<?xml version="1.0" encoding="utf-8"?><rss xmlns:dc="http://purl.org/dc/elements/1.1/" version="2.0"><channel><title>码力全开 一键智造</title><link>https://info.nooko.cn/</link><description>每日更新100+原创文章，覆盖软件，小程序与互联网运营干货</description><item><title>云知声U2大模型评测登顶全球前九：3000亿参数如何跑赢万亿模型？</title><link>https://info.nooko.cn/?id=83</link><description>&lt;p&gt;&lt;img src=&quot;https://info.nooko.cn/zb_users/upload/u2-model-cover.jpg&quot; alt=&quot;云知声U2大模型&quot; title=&quot;云知声U2大模型&quot; /&gt;&lt;/p&gt;
&lt;p&gt;当大多数AI厂商还在疯狂堆叠参数、比拼谁的模型&quot;更大更强&quot;时，一家从语音识别赛道走出来的公司，选择了一条截然不同的路。6月初，云知声正式发布了旗下新一代原生智能体模型——U2，这款拥有近3000亿参数的MoE稀疏混合专家架构大语言模型，在多项国际权威评测中交出了一份令人意外的答卷。&lt;/p&gt;

&lt;h2&gt;评测数据说话：全球前九，长文本超越Claude&lt;/h2&gt;
&lt;p&gt;根据6月10日海外权威AI模型评测平台LLM Stats更新的最新榜单，云知声U2在LLM Stats Score综合能力评测中成功跻身模型总榜前30名。若按照厂商最佳模型成绩进行排名，云知声位列全球模型厂商第九位，与一众国际巨头同台竞技。&lt;/p&gt;
&lt;p&gt;更值得关注的是，在LongBench-V2长文本能力评测中，U2以&lt;strong&gt;54.4%的准确率&lt;/strong&gt;超越了Anthropic的Claude Opus 4.7（53.9%），仅落后于OpenAI的GPT-5.4（55.6%）1.2个百分点，排名全球第二。这意味着在上下文信息提取、跨段落逻辑推理等核心能力上，U2已经真正站上了全球第一梯队的位置。&lt;/p&gt;
&lt;p&gt;评测维度覆盖面同样令人印象深刻，涵盖智能体能力、实战化智能体专项、长文本处理、知识与推理、指令遵循五大核心领域，几乎囊括了当前企业级AI应用最关心的所有能力指标。&lt;/p&gt;

&lt;h2&gt;3000亿参数的&quot;反内卷&quot;哲学&lt;/h2&gt;
&lt;p&gt;在当前大模型行业&quot;军备竞赛&quot;的大背景下，U2的技术路线显得格外清醒。斯坦福大学此前的《大模型规模定律》研究已经指出，当模型参数突破5000亿之后，推理能力和常识理解等核心指标的提升幅度会从早期的30%以上骤降至不足5%，而训练成本和能源消耗却呈指数级攀升。&lt;/p&gt;
&lt;p&gt;云知声的解法是MoE（Mixture of Experts）稀疏架构。U2虽然总参数量接近3000亿，但得益于稀疏激活机制，每次推理实际调用的参数仅在百亿级别，大约只激活十分之一的专家网络。这种设计让U2在保持高性能的同时，推理成本显著低于同等规模的密集模型。&lt;/p&gt;
&lt;p&gt;云知声创始人黄伟提出了一个颇具启发性的公式：&lt;strong&gt;AI公司行业价值 = 智能密度 × Token价值&lt;/strong&gt;。所谓&quot;智能密度&quot;，指的是单位参数中承载的知识量、推理能力和任务解决效率；而&quot;Token价值&quot;则强调每次模型调用能否真正转化为业务成果，而非无效的文本生成。&lt;/p&gt;

&lt;h2&gt;原生智能体：从&quot;能说&quot;到&quot;能做&quot;&lt;/h2&gt;
&lt;p&gt;U2最核心的技术突破之一，在于其原生智能体能力。传统大模型的痛点在于，虽然能回答问题、撰写文章，但要完成复杂的多步骤任务（如自主调用工具、规划路径、执行操作并验收结果），往往需要在外部封装厚厚的应用层代码。&lt;/p&gt;
&lt;p&gt;U2则将工具调用、状态管理和多步规划全部内化为模型原生能力。其创新设计的&quot;Agent+Harness协同演进&quot;机制，让模型原生Agent能力的提升与任务执行脚手架的迭代优化纳入同一训练闭环，形成双向强化的正反馈循环。简单来说，U2不需要外部提示就能自主完成从任务拆解到工具调用再到结果验收的全流程。&lt;/p&gt;
&lt;p&gt;在实际测试中，即便是纯自然语言交互场景，U2也展现出了令人惊艳的&quot;原生规划感&quot;。用户只需用自然语言描述需求，模型便能自主完成代码构建、物理模拟、交互事件挂载等复杂操作，单次交互即可达到验收标准。&lt;/p&gt;

&lt;h2&gt;十三年深耕：数据壁垒构建护城河&lt;/h2&gt;
&lt;p&gt;很多人对云知声的印象还停留在语音识别领域，但实际上这家公司的发展主线一直是&quot;智能交互&quot;——语音只是入口，背后是意图理解，再背后才是任务执行。从2012年创立并攻克&quot;5米远讲&quot;技术，到2018年自研AI芯片&quot;雨燕&quot;面世，再到2023年发布山海通用大模型，云知声几乎在每个技术周期都提前布局。&lt;/p&gt;
&lt;p&gt;2025年6月，云知声在港交所挂牌上市，被市场誉为&quot;AGI第一股&quot;。其首份年报数据显示，2025年总营收达12.11亿元，同比增长29%，其中大模型相关业务收入6.1亿元，同比增长超过10倍，占整体营收比重已突破50%。截至2025年末，云知声已与全国近450家医院建立合作，A++及以上综合排名医院覆盖率接近35%，在医疗AI领域积累了超过10亿条合规脱敏病历数据。&lt;/p&gt;
&lt;p&gt;这些经过真实业务场景验证的数据资产，构成了云知声最难以复制的竞争壁垒。正如黄伟所言：&quot;模型不是靠参数堆出来的，是靠场景喂出来的。&quot;当开源模型能解决70%-80%的通用问题时，剩下20%专业场景的&quot;最后一公里&quot;，才是真正决定胜负的护城河。&lt;/p&gt;

&lt;h2&gt;大模型下半场：从&quot;写得好&quot;到&quot;干得好&quot;&lt;/h2&gt;
&lt;p&gt;大模型赛道的竞争焦点正在发生根本性转变——从&quot;谁更强&quot;转向&quot;谁能以更低成本、更稳定的方式交付足够强的能力&quot;。在这个新维度上，云知声凭借多年积累的数据壁垒、工程化能力和商业化验证，正在重新定义第一梯队的准入标准。&lt;/p&gt;
&lt;p&gt;黄伟将2023到2025年定义为&quot;热身赛&quot;，而2026年才是&quot;正赛&quot;的开端——AI从生成式升级为&quot;生产力AI&quot;，智能体开始独立完成复杂任务，商业化窗口真正打开。U2的发布，可以看作是云知声吹响正赛哨声的关键一步。当大模型的竞争规则从&quot;写得好&quot;变成&quot;干得好&quot;，这张牌桌上的格局，或许正在被悄然改写。&lt;/p&gt;</description><pubDate>Sat, 13 Jun 2026 05:59:53 +0800</pubDate></item><item><title>百度文心大模型全面开源：十款模型权重释放，X1.1深度思考能力惊艳亮相</title><link>https://info.nooko.cn/?id=82</link><description>&lt;p&gt;&lt;img src=&quot;https://info.nooko.cn/zb_users/upload/baidu_ernie_open_source_2025.jpg&quot; alt=&quot;百度文心大模型开源&quot; title=&quot;百度文心大模型开源&quot; /&gt;&lt;/p&gt;&lt;p&gt;在国内大模型竞争日趋白热化的背景下，百度于2025年6月底打出了一套引人注目的组合拳——文心4.5系列十款模型正式开源，文心X1.1深度思考模型同步上线。这两步棋分别瞄准了开源生态建设和前沿推理能力两个关键战场，释放出百度在大模型赛道上加速布局的强烈信号。&lt;/p&gt;&lt;h2&gt;十款模型开源：从轻量到重量全覆盖&lt;/h2&gt;&lt;p&gt;6月30日，百度通过旗下深度学习框架飞桨（PaddlePaddle）平台，一次性释放了文心4.5系列的十款开源模型。这批模型在参数规模上形成了完整的梯度覆盖：从仅有0.3B参数的稠密型轻量模型，到拥有47B激活参数的混合专家（MoE）架构大模型，再到424B参数的多模态视觉语言模型ERNIE-4.5-VL，开发者可以根据不同的部署场景灵活选择。&lt;/p&gt;&lt;p&gt;值得注意的是，此次开源不仅包含模型的预训练权重，还一并开放了推理代码和配套工具链。这意味着开发者和研究机构无需从零开始，就能在本地环境中复现、微调甚至二次开发这些模型。对于算力资源有限的中小团队而言，0.3B和3B级别的模型尤其具有吸引力，它们可以在消费级显卡上高效运行，大大降低了大模型技术的使用门槛。&lt;/p&gt;&lt;p&gt;从行业视角来看，百度的这一举措与此前宣布文心一言免费使用的策略一脉相承。4月1日起，文心一言全面免费开放，6月底又兑现了开源承诺。这种&quot;先免费后开源&quot;的路径，清晰地表明百度正在通过降低使用壁垒来扩大生态影响力，与Meta的Llama系列和阿里通义千问的开源策略形成呼应。&lt;/p&gt;&lt;h2&gt;X1.1深度思考模型：推理能力质的飞跃&lt;/h2&gt;&lt;p&gt;与开源动作同步，百度还悄然上线了文心X1.1深度思考模型。从实测反馈来看，这款模型在事实准确性和复杂推理方面取得了显著进步，尤其是在面对刻意设计的误导性提问时，X1.1展现出了更强的辨识能力和逻辑自洽性。&lt;/p&gt;&lt;p&gt;深度思考模型的核心理念在于模拟人类在处理复杂问题时的思维链过程。与传统的单轮生成不同，X1.1在给出答案前会进行多步内部推理，对中间结论进行自我验证和修正。这种机制使其在数学推理、代码调试、逻辑分析等需要严密思维链的任务中表现尤为突出。&lt;/p&gt;&lt;p&gt;在当前大模型竞争从&quot;能说会道&quot;向&quot;深度思考&quot;演进的趋势下，X1.1的推出恰逢其时。OpenAI的o系列、Anthropic的Claude系列都在强化推理能力，百度选择在同一赛道发力，说明国产大模型正在从追赶走向并跑。&lt;/p&gt;&lt;h2&gt;行业格局：开源浪潮重塑竞争规则&lt;/h2&gt;&lt;p&gt;将视野拉宽，百度此次开源并非孤立事件。2025年上半年，国内大模型开源已成燎原之势。阿里通义千问持续迭代开源版本，DeepSeek以开源策略迅速崛起，字节跳动豆包系列也在特定领域开放了模型权重。据国家网信办数据，截至6月30日，累计已有439款生成式人工智能服务完成备案，仅二季度就新增93款，行业供给端的爆发式增长态势明显。&lt;/p&gt;&lt;p&gt;开源正在从根本上改变大模型行业的竞争规则。过去，模型能力是核心壁垒；如今，生态建设、应用落地和服务质量正在成为新的胜负手。百度选择在飞桨平台上开源文心系列，也是希望借助飞桨在国内开发者中的广泛基础，构建一个从框架到模型再到应用的完整技术栈。&lt;/p&gt;&lt;h2&gt;下半年展望：文心5.0蓄势待发&lt;/h2&gt;&lt;p&gt;据百度此前透露，2025年下半年还将发布文心大模型5.0版本。如果4.5系列的开源是百度在生态层面的战略落子，那么5.0版本大概率将在模型能力上实现新的突破。在多模态融合、长上下文处理、Agent化应用等前沿方向上，业界对文心5.0抱有较高期待。&lt;/p&gt;&lt;p&gt;综合来看，百度6月底的这套组合拳——十款模型开源加X1.1深度思考上线——既展现了技术积累的厚度，也体现了生态布局的野心。在大模型行业从技术竞赛转向生态竞赛的关键节点，百度正试图用开源和推理能力两张牌，重新定义自己在国产AI版图中的位置。&lt;/p&gt;</description><pubDate>Sat, 13 Jun 2026 03:59:49 +0800</pubDate></item><item><title>中国AI生态进入&quot;三缸同步&quot;时刻：439款大模型备案背后的产业裂变</title><link>https://info.nooko.cn/?id=81</link><description>&lt;p&gt;&lt;img src=&quot;https://info.nooko.cn/zb_users/upload/ai_cover_china_ai_ecosystem_2025.jpg&quot; alt=&quot;中国AI生态加速&quot; title=&quot;中国AI生态加速&quot; /&gt;&lt;/p&gt;

&lt;p&gt;2025年上半年的中国AI行业，正在经历一场静悄悄却影响深远的质变。根据国家网信办最新披露的数据，截至6月30日，全国累计已有&lt;strong&gt;439款生成式人工智能服务&lt;/strong&gt;完成备案，其中仅4月至6月这三个月就新增了93款。与此同时，&lt;strong&gt;233款生成式AI应用或功能&lt;/strong&gt;也已完成登记。这组数字背后，折射出的是整个产业链从技术突破到商业化落地的全面提速。&lt;/p&gt;

&lt;h2&gt;备案潮背后：从&quot;野蛮生长&quot;到&quot;有序繁荣&quot;&lt;/h2&gt;

&lt;p&gt;将时间线拉长来看，439款这个数字的含金量远超表面。2023年下半年《生成式人工智能服务管理暂行办法》出台之初，业界一度担忧监管会抑制创新活力。然而一年多的实践证明，备案制度反而成为行业健康发展的催化剂。&lt;/p&gt;

&lt;p&gt;二季度新增的93款服务中，深圳一地就贡献了8款，涵盖顺丰物流、彩讯股份等上市公司。这说明生成式AI已经从互联网科技公司的&quot;专属玩具&quot;，渗透到物流、金融、通信等传统行业的核心业务流程中。每多一款备案服务，就意味着AI技术在一个新的垂直场景中完成了从实验室到生产环境的跨越。&lt;/p&gt;

&lt;p&gt;值得关注的是，备案的加速并非简单的数量堆砌。从技术路线看，这439款服务覆盖了文本生成、图像理解、代码辅助、多模态交互等多个技术方向；从应用场景看，则横跨企业办公、内容创作、教育培训、医疗健康等十余个行业。这种广度与深度的双重扩展，标志着中国AI产业正在从&quot;单点突破&quot;走向&quot;体系化作战&quot;。&lt;/p&gt;

&lt;h2&gt;算力底座：国产GPU的&quot;从零到一&quot;&lt;/h2&gt;

&lt;p&gt;如果说大模型备案数量是AI产业的&quot;果实&quot;，那么算力底座就是支撑整棵大树生长的&quot;根系&quot;。在这个维度上，6月10日摩尔线程开源MusaCoder代码大模型的动作，堪称一个里程碑事件。&lt;/p&gt;

&lt;p&gt;MusaCoder的特别之处在于：它是业内&lt;strong&gt;首个基于国产全功能GPU算力底座完成全链路训练与验证&lt;/strong&gt;的大语言模型。模型提供9B和27B两个参数版本，专注于GPU底层算子代码的自动生成。整个训练流程全部运行在摩尔线程自研的MTT S5000智算卡和夸娥万卡集群上，没有借助任何国外硬件。&lt;/p&gt;

&lt;p&gt;在KernelBench基准测试中，MusaCoder-27B-RL的Overall Pass@8达到&lt;strong&gt;93.2%&lt;/strong&gt;，Avg.@8为88.60%，超越了一众国际主流代码模型，包括Claude Opus 4.7、GLM-5.1、DeepSeek-V4 Pro等。一个仅27B参数的垂直领域模型，在自己的专业赛道上跑赢了参数量数倍于己的通用模型，这背后的技术逻辑值得深思。&lt;/p&gt;

&lt;p&gt;更深层的意义在于生态破局。英伟达CUDA生态经过十几年积累，拥有超过500万开发者和百万级应用，构成了国产GPU最大的竞争壁垒。MusaCoder的出现提供了一条新路径：通过AI自动生成底层算子代码，将国产GPU的开发门槛从&quot;精通硬件架构&quot;降低到&quot;自然语言描述需求&quot;。这种范式的转变，有望从根本上改变国产算力生态的建设模式。&lt;/p&gt;

&lt;h2&gt;&quot;三缸同步&quot;：中国AI的独特优势&lt;/h2&gt;

&lt;p&gt;将上述两个事件放在更大的坐标系中观察，会发现它们并非孤立存在。2025年的中国AI产业，正在呈现出一种独特的&quot;三缸同步&quot;态势——&lt;strong&gt;大模型能力、算力基础设施、行业应用落地&lt;/strong&gt;三个维度首次实现了协同推进。&lt;/p&gt;

&lt;p&gt;大模型层面，以豆包1.6、DeepSeek V4 Pro、商汤V6为代表的国产模型在多模态能力和推理效率上持续追赶甚至超越国际标杆。算力层面，从摩尔线程的MTT S5000到华为昇腾生态，国产智算硬件正在从&quot;可用&quot;迈向&quot;好用&quot;。应用层面，439款备案服务意味着AI已经深入到经济社会的毛细血管中。&lt;/p&gt;

&lt;p&gt;这种三位一体的协同效应，正是中国AI产业区别于其他国家的独特优势。美国在基础模型和底层算法上依然领先，但在应用落地的广度和速度上，中国庞大的市场规模和丰富的应用场景提供了无可比拟的试验场。&lt;/p&gt;

&lt;h2&gt;挑战与展望：从&quot;追赶&quot;到&quot;定义&quot;&lt;/h2&gt;

&lt;p&gt;当然，乐观之余仍需保持清醒。国产GPU在生态成熟度上与CUDA仍有明显差距，大模型在基础科学能力上与国际顶尖水平尚存距离，AI治理框架也需要在实践中不断完善。&lt;/p&gt;

&lt;p&gt;但正如MusaCoder所展示的那样，中国AI产业正在从&quot;追赶者&quot;向&quot;定义者&quot;转变。不是在别人的赛道上跑得更快，而是开始开辟属于自己的新赛道。439款备案服务是应用层面的厚度，MusaCoder是技术层面的深度，两者叠加，正在勾勒出中国AI产业的新轮廓。&lt;/p&gt;

&lt;p&gt;2025年的这个夏天，或许会被后人标记为中国AI从&quot;量变&quot;走向&quot;质变&quot;的关键节点。而这一切，才刚刚开始。&lt;/p&gt;</description><pubDate>Sat, 13 Jun 2026 02:00:03 +0800</pubDate></item><item><title>OpenAI GPT-5.6即将登场：150万上下文窗口重塑大模型竞争格局</title><link>https://info.nooko.cn/?id=80</link><description>&lt;p&gt;&lt;img src=&quot;/uploads/gpt56_cover_20260612.jpg&quot; alt=&quot;GPT-5.6大模型&quot; /&gt;&lt;/p&gt;
&lt;p&gt;大模型赛道的竞争节奏正在急剧加速。据多方消息源确认，OpenAI计划于近期正式发布GPT-5.6——这款内部代号为&quot;iris-alpha&quot;的新一代语言模型，将上下文处理能力推至前所未有的&lt;strong&gt;150万tokens&lt;/strong&gt;。这一数字较GPT-5.5实现了数倍级的跃升，意味着开发者可以在单次对话中输入相当于数百万字的文档资料，而模型依然能够保持精准的理解和连贯的推理。与此同时，OpenAI的上市计划也在同步推进，整个AI行业正站在一个关键的技术与商业交汇点上。&lt;/p&gt;

&lt;h2&gt;150万上下文：从量变到质变的飞跃&lt;/h2&gt;

&lt;p&gt;上下文窗口的扩展从来不是简单的数字游戏。当模型的&quot;记忆容量&quot;从几十万tokens跃升至150万tokens时，应用场景将发生根本性的改变。&lt;strong&gt;全量代码库分析&lt;/strong&gt;成为可能——开发者可以直接将整个项目的源代码一次性喂给模型，让其进行全局性的架构审查、漏洞排查和性能优化，而不再需要人工切分模块后分段处理。这种&quot;一览无余&quot;的理解方式，将大幅提升AI辅助编程的效率和准确性。&lt;/p&gt;

&lt;p&gt;在&lt;strong&gt;长文档处理&lt;/strong&gt;领域，150万tokens的上下文窗口意味着模型可以同时消化数十份学术论文、数百页的法律合同或完整的企业年报，进行跨文档的交叉分析和信息提取。对于金融分析、法律审查、学术研究等专业场景而言，这无异于拥有了一位能够同时阅读海量资料且过目不忘的超级助手。&lt;/p&gt;

&lt;p&gt;更值得关注的是，大上下文窗口为&lt;strong&gt;多模态融合&lt;/strong&gt;铺平了道路。当文本、图像、视频和音频数据可以同时驻留在模型的&quot;工作记忆&quot;中时，跨模态的联合推理能力将得到质的提升。用户可以上传一段视频、附带一份技术文档和若干张设计图，要求模型进行综合分析并生成完整的技术方案——这种复杂的多源信息整合能力，正是下一代AI应用的核心竞争力。&lt;/p&gt;

&lt;h2&gt;Codex与Sites：OpenAI的生态野心&lt;/h2&gt;

&lt;p&gt;在GPT-5.6正式发布之前，OpenAI已经通过一系列产品动作释放了明确的信号。6月初，OpenAI在同一天内推出了&lt;strong&gt;Codex App桌面工作台&lt;/strong&gt;和&lt;strong&gt;Sites一键部署功能&lt;/strong&gt;两个重磅产品。Codex App将AI编程能力从浏览器端延伸到桌面环境，开发者可以在本地IDE中直接调用GPT系列的代码生成和调试能力，实现与开发工具链的深度集成。&lt;/p&gt;

&lt;p&gt;Sites功能则瞄准了&quot;从想法到产品&quot;的最后一公里。开发者使用AI生成的代码和界面，可以通过Sites功能一键部署为可访问的Web应用，大幅缩短了从原型到上线的周期。有资深开发者在体验后直言：&lt;strong&gt;&quot;GPT-5.6的UI生成能力会非常强&quot;&lt;/strong&gt;，暗示新模型在界面设计和前端代码生成方面将有突破性表现。&lt;/p&gt;

&lt;p&gt;这两个产品的组合透露出OpenAI的战略意图——不再满足于提供底层的模型API，而是要构建一个完整的&lt;strong&gt;AI原生开发生态&lt;/strong&gt;。从代码生成、界面设计到应用部署，OpenAI正在将AI能力渗透到软件开发的每一个环节，试图重新定义&quot;编程&quot;这件事本身的含义。&lt;/p&gt;

&lt;h2&gt;IPO倒计时：AI巨头的资本野心&lt;/h2&gt;

&lt;p&gt;技术突破之外，OpenAI的商业化进程同样引人注目。据多方报道，OpenAI已正式启动上市准备工作，计划在未来一年内完成IPO。当前市场对OpenAI的估值预期已攀升至&lt;strong&gt;万亿美金级别&lt;/strong&gt;，这一数字不仅远超大多数传统科技巨头，更反映出资本市场对AI赛道长期价值的坚定看好。&lt;/p&gt;

&lt;p&gt;然而，高估值也意味着高期待。OpenAI需要在&lt;strong&gt;盈利能力&lt;/strong&gt;和&lt;strong&gt;技术投入&lt;/strong&gt;之间找到微妙的平衡。大模型的训练成本持续攀升——据行业估算，训练一个前沿模型的算力开销已达到数亿美金量级。如何在维持技术领先的同时实现可持续的商业回报，是OpenAI管理层面临的核心挑战。GPT-5.6的发布，某种程度上也是对资本市场的一次&quot;秀肌肉&quot;——向投资者证明OpenAI的技术引擎依然在高速运转。&lt;/p&gt;

&lt;h2&gt;全球大模型格局：群雄逐鹿新阶段&lt;/h2&gt;

&lt;p&gt;OpenAI的每一次动作都会在全球AI产业中激起涟漪。在GPT-5.6即将发布的背景下，中国的大模型厂商也在加速追赶。&lt;strong&gt;DeepSeek&lt;/strong&gt;此前已实现在国产芯片集群上运行千卡级大模型的突破，训练成本仅为同级别海外模型的五分之一。&lt;strong&gt;字节跳动的豆包系列&lt;/strong&gt;和&lt;strong&gt;商汤的日日新模型&lt;/strong&gt;也在多模态能力和应用落地方面取得了显著进展。&lt;/p&gt;

&lt;p&gt;值得关注的是，中国AI产业正在走出一条差异化的发展路径。与OpenAI追求通用能力的路线不同，中国厂商更注重&lt;strong&gt;垂直场景的深度优化&lt;/strong&gt;和&lt;strong&gt;端侧部署&lt;/strong&gt;的性价比。在政务、金融、教育、医疗等特定领域，国产大模型已经展现出不输国际竞品的专业能力。与此同时，国产AI芯片的快速迭代——部分产品的推理性能已追平甚至超越同代海外产品——为大模型的自主可控发展提供了坚实的硬件基础。&lt;/p&gt;

&lt;p&gt;大模型赛道的竞争已经从早期的&quot;有没有&quot;进入到&quot;好不好用&quot;的新阶段。GPT-5.6的150万上下文窗口无疑将树立新的技术标杆，但它能否真正转化为用户可感知的产品体验，仍需市场检验。对于开发者和企业用户而言，模型的&lt;strong&gt;实际可用性&lt;/strong&gt;、&lt;strong&gt;调用成本&lt;/strong&gt;和&lt;strong&gt;生态兼容性&lt;/strong&gt;，远比单纯的参数指标更为重要。在这场没有终点的技术马拉松中，谁能持续将前沿能力转化为真实价值，谁才能笑到最后。&lt;/p&gt;</description><pubDate>Sat, 13 Jun 2026 00:00:04 +0800</pubDate></item><item><title>谷歌DiffusionGemma开源发布：文本扩散架构挑战自回归范式，大模型推理提速4倍</title><link>https://info.nooko.cn/?id=79</link><description>&lt;p&gt;&lt;img src=&quot;uploads/diffusion-gemma-cover.jpg&quot; alt=&quot;DiffusionGemma&quot; style=&quot;max-width:100%;height:auto;&quot; /&gt;&lt;/p&gt;

&lt;p&gt;大模型领域的竞争正从&quot;谁参数更大&quot;向&quot;谁架构更聪明&quot;悄然转变。就在本周，谷歌DeepMind团队悄然放出了一个令人眼前一亮的实验性项目——DiffusionGemma。这款模型最大的看点不在于参数规模，而在于它彻底抛弃了当前大语言模型主流的自回归生成范式，转而采用源自图像生成领域的&lt;strong&gt;扩散架构&lt;/strong&gt;来处理文本任务。&lt;/p&gt;

&lt;h2&gt;扩散架构进军文本生成：从图像到语言的跨界突破&lt;/h2&gt;

&lt;p&gt;长期以来，从GPT系列到Llama，几乎所有主流大语言模型都采用自回归（Autoregressive）方式逐词生成文本——先产出第一个词，再基于它预测第二个词，依次类推。这种方式逻辑直观，但存在一个天然瓶颈：每个词的生成都必须等待前一个词完成，难以实现真正的并行计算。&lt;/p&gt;

&lt;p&gt;DiffusionGemma的核心创新在于，它将文本生成视为一个&quot;去噪&quot;过程，而非&quot;逐词续写&quot;。模型从一团完全随机的噪声出发，通过多步迭代逐步&quot;还原&quot;出有意义的文本。这种机制允许模型在生成过程中同时处理多个位置的信息，从而在专用GPU上实现了&lt;strong&gt;最高4倍的推理加速&lt;/strong&gt;。&lt;/p&gt;

&lt;p&gt;不过谷歌也坦诚表示，DiffusionGemma目前仍定位为面向研究者和开发者的实验性模型，整体输出质量尚未达到标准Gemma 4的水平。其速度优势主要体现在本地部署和低并发推理场景，在高并发的云端服务环境中优势相对有限。该模型以Apache 2.0许可证开源，意味着开发者可以自由使用、修改和商用。&lt;/p&gt;

&lt;h2&gt;大模型价格战升级：OpenAI酝酿大幅降价&lt;/h2&gt;

&lt;p&gt;与谷歌在技术架构上的探索形成鲜明对比的是，OpenAI正在商业策略上发动猛烈攻势。据多方消息透露，OpenAI正在考虑&lt;strong&gt;大幅下调API定价&lt;/strong&gt;，目标直指竞争对手Anthropic的存量客户。这一策略的背景是：尽管AI行业投入了数百亿美元用于算力和训练，但多数厂商至今仍未实现盈利，价格战无疑将进一步压缩利润空间。&lt;/p&gt;

&lt;p&gt;同日，OpenAI还宣布了另一项重大商业进展——与甲骨文（Oracle）达成合作，甲骨文云基础设施（OCI）客户将可通过现有云承诺额度直接调用OpenAI的前沿模型及编程工具Codex，无需额外采购流程。这一合作大幅降低了企业客户接入OpenAI模型的门槛。&lt;/p&gt;

&lt;p&gt;更引人注目的是，OpenAI首席执行官山姆·奥特曼已在内部告知员工，公司预计将在&lt;strong&gt;未来一年内完成IPO上市&lt;/strong&gt;，并已向美国证监会秘密提交了S-1草案。一旦成功上市，OpenAI有望成为近年来规模最大的科技企业IPO之一。&lt;/p&gt;

&lt;h2&gt;开源生态持续繁荣：小米MiMo Code加入AI编程赛道&lt;/h2&gt;

&lt;p&gt;在巨头博弈之外，开源社区的活力同样不容忽视。小米MiMo技术团队正式发布了AI编程助手&lt;strong&gt;MiMo Code&lt;/strong&gt;，基于开源项目OpenCode开发，支持持久记忆系统、无限上下文、多模型Agent协同优化以及独创的Compose模式。该工具可接入DeepSeek、Kimi、GLM等主流大模型，采用MIT协议完全开源，并内置了限时免费的多模态模型MiMo V2.5。&lt;/p&gt;

&lt;p&gt;MiMo Code的发布标志着国内科技企业在AI编程工具领域的布局进一步深化。随着AI编程助手从&quot;代码补全&quot;进化到&quot;代码理解与生成&quot;，开发者的工作方式正在经历根本性变革。&lt;/p&gt;

&lt;h2&gt;安全治理呼声渐强：Anthropic推动AI强制测试&lt;/h2&gt;

&lt;p&gt;技术狂飙的同时，安全治理的讨论也在升温。Anthropic首席执行官达里奥·阿莫迪发布长文，&lt;strong&gt;公开呼吁对AI模型实施强制性的第三方安全测试&lt;/strong&gt;。他主张，如果新模型在网络安全威胁、生物武器制造等领域被认定构成&quot;不可接受的风险&quot;，政府应当有权阻止或限制其部署。&lt;/p&gt;

&lt;p&gt;这一立场在AI行业内引发了广泛讨论。支持者认为，随着模型能力的快速提升，前瞻性的安全框架势在必行；质疑者则担心过度监管可能扼杀创新活力。无论如何，这场关于AI治理边界的辩论，将在未来相当长一段时间内持续影响行业走向。&lt;/p&gt;

&lt;h2&gt;写在最后&lt;/h2&gt;

&lt;p&gt;从DiffusionGemma的架构创新，到OpenAI的价格战与上市计划，从小米的开源贡献到Anthropic的安全倡议，本周的AI行业呈现出一个清晰的趋势：&lt;strong&gt;大模型竞争已进入多维博弈阶段&lt;/strong&gt;。单纯的参数规模竞赛正在让位于架构效率、商业策略、开源生态和安全治理的综合较量。对于开发者和企业用户而言，这意味着更多元的选择和更丰富的工具链；对于整个行业而言，一个更加成熟、分层、可持续的AI生态正在加速成型。&lt;/p&gt;</description><pubDate>Fri, 12 Jun 2026 21:59:21 +0800</pubDate></item><item><title>苹果Xcode 27原生集成三大AI编程智能体：开发者工具进入Agent协作时代</title><link>https://info.nooko.cn/?id=78</link><description>&lt;p&gt;&lt;img src=&quot;https://info.nooko.cn/zb_users/upload/xcode27_ai_agents_cover.jpg&quot; alt=&quot;Xcode 27 AI编程智能体&quot; title=&quot;苹果Xcode 27集成三大AI编程智能体&quot; /&gt;&lt;/p&gt;

&lt;p&gt;6月10日，苹果在Xcode 27 Beta更新中悄然埋下了一颗重磅炸弹——原生集成Google Gemini智能体。至此，OpenAI Codex、Anthropic Claude Agent和Google Gemini三大AI编程助手首次齐聚同一款集成开发环境，这在软件开发工具史上尚属首次。这一举动不仅打破了苹果一贯封闭的生态策略，更释放出一个清晰信号：AI编程已从&quot;锦上添花&quot;进化为开发者的&quot;基础设施&quot;。&lt;/p&gt;

&lt;h2&gt;三大AI巨头同台：Xcode 27的野心与妥协&lt;/h2&gt;

&lt;p&gt;对于长期坚持自研路线的苹果而言，将竞争对手的AI产品引入自家核心开发工具，堪称一次战略级别的转向。Xcode 27 Beta的Intelligence设置面板中，开发者可以自由配置Gemini、Codex和Claude三款智能体，根据不同任务场景灵活切换。这种&quot;多模型共存&quot;的设计哲学，与当前AI行业从&quot;单模型崇拜&quot;向&quot;多Agent协作&quot;演进的趋势高度吻合。&lt;/p&gt;

&lt;p&gt;从技术实现来看，三款AI智能体在Xcode中的集成深度远超简单的API调用。以Gemini为例，它能够完整理解项目上下文，包括文件结构、代码依赖关系和项目文档，从而辅助生成样板代码，甚至根据项目规范进行全量代码更新。这意味着AI不再是一个&quot;智能补全&quot;工具，而是一个真正理解项目全貌的&quot;虚拟同事&quot;。&lt;/p&gt;

&lt;h2&gt;从辅助补全到Agent协作：编程范式的质变&lt;/h2&gt;

&lt;p&gt;将时间线拉长来看，AI编程工具经历了三个清晰的演进阶段。第一阶段是代码补全时代，以GitHub Copilot为代表，AI的角色局限于&quot;预测下一个token&quot;；第二阶段是对话式编程时代，开发者通过自然语言描述需求，AI生成代码片段；而现在正在进入的第三阶段，则是Agent协作时代。&lt;/p&gt;

&lt;p&gt;在Agent协作模式下，AI智能体具备自主规划和执行复杂任务的能力。开发者无需再逐行描述需求，只需给出高层指令，AI便能自动完成多步骤操作——分析代码库、定位问题、编写修复方案、运行测试并提交变更。Xcode 27中三大智能体的引入，正是这一范式转变的最佳注脚。&lt;/p&gt;

&lt;p&gt;值得注意的是，多Agent架构在2026年上半年已成为行业共识。Anthropic推出的Dynamic Workflows允许Claude自主编排数十个子Agent并行处理大型代码迁移任务；Cursor v3支持最多8个并发Agent协同工作；Google Antigravity 2.0也上线了Agent Teams功能。苹果选择在这一时间节点将三大AI巨头同时引入Xcode，显然是对这一趋势的精准卡位。&lt;/p&gt;

&lt;h2&gt;开发者生态的连锁反应&lt;/h2&gt;

&lt;p&gt;Xcode 27的这一更新对开发者生态的影响将是深远的。首先，它大幅降低了AI编程工具的使用门槛。过去开发者需要在多个平台之间切换——用ChatGPT写逻辑、用Claude做审查、用Gemini查文档，如今这些能力被统一整合到了一个开发环境中，工作流的连续性和效率得到了质的提升。&lt;/p&gt;

&lt;p&gt;其次，多模型共存催生了&quot;模型择优&quot;的新工作模式。不同AI模型各有所长——Codex在代码生成方面表现突出，Claude在代码审查和逻辑推理上更具优势，Gemini则在多模态理解和文档处理方面独树一帜。开发者可以根据任务类型选择最合适的智能体，甚至让多个Agent对同一问题给出不同方案进行交叉验证。&lt;/p&gt;

&lt;p&gt;从行业竞争格局来看，苹果的这一举动也意味深长。在AI编程领域，微软旗下的GitHub Copilot和VS Code一直占据主导地位。苹果通过Xcode 27的AI集成，不仅巩固了其在苹果生态开发者的粘性，更向整个开发工具市场发出了强有力的挑战信号。&lt;/p&gt;

&lt;h2&gt;Agent Skills标准化：打通跨平台协作的关键&lt;/h2&gt;

&lt;p&gt;支撑Xcode 27多Agent架构的底层技术之一，是正在快速标准化的Agent Skills协议。这套由Anthropic于去年10月首次提出、12月升级为开放标准的技术框架，在2026年上半年获得了OpenAI、Google以及国内AI厂商的广泛采纳。&lt;/p&gt;

&lt;p&gt;Agent Skills的核心思想是将AI的能力模块化为标准化&quot;技能包&quot;。每个Skill包含一份YAML元数据文件和Markdown格式的执行指令，AI模型可以根据当前任务自动匹配和加载相应技能。这种渐进式披露机制有效解决了上下文窗口稀缺性的问题——模型只需为正在执行的任务付出token成本，而非一次性加载所有知识。&lt;/p&gt;

&lt;p&gt;在Xcode 27的场景下，Agent Skills的标准化意味着开发者编写的技能包可以在Codex、Claude和Gemini之间无缝迁移，真正实现了&quot;一次编写，三端通用&quot;。这对于构建跨模型的AI编程工作流具有里程碑意义。&lt;/p&gt;

&lt;h2&gt;展望：AI编程的下一个战场&lt;/h2&gt;

&lt;p&gt;Xcode 27原生集成三大AI智能体，标志着AI编程工具竞争进入了全新阶段。当模型能力趋于同质化，真正的差异化将体现在工程化基础设施的质量上——包括上下文管理、任务编排、记忆系统和技能生态。这正是业内所说的&quot;Harness Engineering&quot;（挽具工程）的核心价值。&lt;/p&gt;

&lt;p&gt;展望未来，AI编程工具的演进方向将集中在三个维度：一是多Agent协作的深度和复杂度将持续提升，从简单的任务分发进化为真正的团队化协作；二是Desktop Agent形态将进一步成熟，AI将从IDE内的辅助工具进化为跨应用的通用数字助手；三是Coding Plan等订阅制模式将加速普及，让开发者不再为token成本焦虑。&lt;/p&gt;

&lt;p&gt;对于广大开发者而言，2026年下半年的核心命题已经不再是&quot;该不该用AI编程&quot;，而是&quot;如何构建属于自己的AI工作流&quot;。苹果用Xcode 27给出了一个有力的回答：让最好的AI工具协同工作，而不是彼此替代。&lt;/p&gt;</description><pubDate>Fri, 12 Jun 2026 19:58:39 +0800</pubDate></item><item><title>英伟达豪赌欧洲：20座AI工厂背后的万亿算力野心</title><link>https://info.nooko.cn/?id=77</link><description>&lt;p&gt;&lt;img src=&quot;/generated-images/cover_20250612.jpg&quot; alt=&quot;英伟达AI算力&quot; title=&quot;英伟达AI算力&quot; width=&quot;100%&quot; /&gt;&lt;/p&gt;&lt;p&gt;全球人工智能产业正经历一场前所未有的基础设施革命。2025年6月，英伟达首席执行官黄仁勋在GTC巴黎大会上掷出一枚重磅炸弹——公司计划在欧洲七国部署超过&lt;strong&gt;20座大型AI工厂&lt;/strong&gt;，力争到2026年底前将欧洲大陆的AI算力提升整整10倍。这一雄心勃勃的战略布局，不仅重塑了全球算力版图，更揭示了AI作为新一代基础设施的核心地位。&lt;/p&gt;&lt;h2&gt;欧洲算力版图的重构之路&lt;/h2&gt;&lt;p&gt;黄仁勋此次欧洲之行的战略意图十分清晰：将欧洲打造成仅次于北美的全球第二大AI算力枢纽。具体而言，英伟达已与法国AI独角兽Mistral AI达成深度合作，双方共建的AI云平台将采用&lt;strong&gt;1.8万块Grace Blackwell超级芯片&lt;/strong&gt;，为欧洲本土企业提供顶级推理与训练能力。与此同时，德国工业AI云项目也已敲定，计划配备&lt;strong&gt;1万块高性能GPU&lt;/strong&gt;，直指欧洲制造业智能化升级的核心需求。&lt;/p&gt;&lt;p&gt;值得注意的是，这并非简单的硬件倾销。英伟达正在构建一个涵盖芯片供应、软件生态、行业解决方案的完整闭环。从法国的云服务到德国的工业智能，再到英国的主权AI论坛，黄仁勋用一趟欧洲之行完成了对欧洲AI产业上下游的全面卡位。&lt;/p&gt;&lt;h2&gt;为什么是欧洲？地缘与市场的双重考量&lt;/h2&gt;&lt;p&gt;欧洲长期以来在AI算力领域处于相对弱势地位，本土缺乏能够与英伟达、AMD抗衡的芯片巨头，云计算市场也被亚马逊、微软、谷歌等美国企业主导。然而，欧洲拥有全球最为严格的数据监管框架——《通用数据保护条例》（GDPR）要求大量敏感数据必须在本地处理，这为&lt;strong&gt;主权AI&lt;/strong&gt;概念的兴起提供了肥沃土壤。&lt;/p&gt;&lt;p&gt;英伟达敏锐地捕捉到了这一趋势。通过在欧洲本土建设AI工厂，企业可以在满足数据合规要求的同时，获得低延迟、高带宽的算力支持。法国总统马克龙此前多次强调&quot;欧洲技术主权&quot;的重要性，而英伟达的投资恰好迎合了这一政治诉求，实现了商业利益与地缘战略的巧妙契合。&lt;/p&gt;&lt;h2&gt;算力即权力：全球AI基建竞赛升温&lt;/h2&gt;&lt;p&gt;英伟达的欧洲布局只是全球AI基础设施竞赛的一个缩影。从沙特的NEOM智慧城市到印度的国家级AI算力中心，从日本的富岳超算到中国的东数西算工程，各国正将AI算力视为21世纪的战略资源。黄仁勋曾多次公开宣称&quot;算力即权力&quot;，而英伟达正是这场权力重构的最大受益者。&lt;/p&gt;&lt;p&gt;财务数据印证了这一点。尽管面临地缘政治风险和竞争对手的围剿，英伟达股价仍稳定在&lt;strong&gt;143美元&lt;/strong&gt;附近，市值稳居全球前三。更值得关注的是，英伟达正在从单纯的芯片供应商向AI基础设施运营商转型——通过提供DGX Cloud、AI Foundry等服务，其商业模式正从&quot;卖铲子&quot;升级为&quot;运营金矿&quot;。&lt;/p&gt;&lt;h2&gt;挑战与隐忧：繁荣背后的阴影&lt;/h2&gt;&lt;p&gt;然而，这场算力盛宴并非没有隐忧。首先，&lt;strong&gt;能源消耗&lt;/strong&gt;问题日益严峻。一座大型AI工厂的电力需求堪比一座中型城市，欧洲本就紧张的能源供应能否支撑如此庞大的算力扩张，仍是未知数。其次，&lt;strong&gt;供应链安全&lt;/strong&gt;不容忽视。英伟达芯片的制造仍高度依赖台积电，任何地缘波动都可能导致产能中断。&lt;/p&gt;&lt;p&gt;此外，欧洲本土AI企业的竞争力也是一大问号。尽管算力基础设施大幅提升，但欧洲在基础模型研发、AI人才储备等方面与美国仍存在明显差距。如果本土企业无法充分利用这些算力资源，英伟达的巨额投资可能沦为&quot;为他人作嫁衣裳&quot;。&lt;/p&gt;&lt;h2&gt;未来展望：AI工厂定义新工业时代&lt;/h2&gt;&lt;p&gt;展望未来，AI工厂有望成为继蒸汽机、电力、互联网之后的第四代工业基础设施。黄仁勋在巴黎大会上同步透露，英伟达正在加速量子计算研究，探索后摩尔时代的算力突破路径。这意味着，今天的AI工厂可能只是未来智能社会的雏形。&lt;/p&gt;&lt;p&gt;对于中国科技企业而言，英伟达的欧洲布局既是警示也是启示。在全球算力竞赛中，单纯依赖进口芯片已非长久之计，构建自主可控的AI算力生态势在必行。与此同时，中国庞大的应用场景和数据资源，也是培育本土AI基础设施的独特优势。&lt;/p&gt;&lt;p&gt;无论如何，2025年的这个夏天，黄仁勋用20座AI工厂的蓝图，为全球科技产业写下了浓墨重彩的一笔。算力的军备竞赛已经打响，而最终的赢家，将是那些既能掌握核心技术、又能洞察产业趋势的玩家。&lt;/p&gt;</description><pubDate>Fri, 12 Jun 2026 17:58:54 +0800</pubDate></item><item><title>华为余承东宣称盘古大模型为&quot;全球首个&quot;：AI大模型赛道进入三国争霸时代</title><link>https://info.nooko.cn/?id=76</link><description>&lt;p&gt;&lt;img src=&quot;/uploads/2026/06/ai_llm_battle_20260612.jpg&quot; alt=&quot;AI大模型竞争格局&quot; /&gt;&lt;/p&gt;
&lt;p&gt;2026年6月12日，华为开发者大会现场传来一声惊雷。华为终端BG董事长余承东在主题演讲中掷地有声地宣称：&lt;strong&gt;&quot;盘古大模型是全球第一个大模型&quot;&lt;/strong&gt;。这一表态犹如向平静的湖面投入巨石，瞬间在科技圈激起千层浪。就在同一天，OpenAI向美国证券交易委员会递交IPO申请的消息也在资本市场上引发轩然大波。两大事件在同一天发生，仿佛冥冥之中预示着AI大模型赛道正在进入一个全新的竞争阶段。&lt;/p&gt;

&lt;h2&gt;盘古大模型的&quot;第一&quot;之争&lt;/h2&gt;

&lt;p&gt;余承东的&quot;全球首个&quot;论断并非空穴来风。从技术演进脉络来看，华为在人工智能领域的布局确实起步极早。早在2021年，华为就发布了盘古系列大模型的首个版本，涵盖NLP、CV和科学计算等多个领域。彼时，ChatGPT尚未诞生，GPT-3虽已发布但主要面向研究者开放，尚未形成广泛的商业化应用。&lt;/p&gt;

&lt;p&gt;盘古大模型的技术路线与OpenAI的GPT系列存在显著差异。&lt;strong&gt;盘古更强调行业落地和垂直场景的深度适配&lt;/strong&gt;，而非追求通用的对话能力。在气象预报、药物研发、矿山作业等B端场景中，盘古大模型已经建立了相当的技术壁垒和商业壁垒。余承东此番表态，既是对华为技术积累的一种自信宣示，也暗含着对当前大模型竞争格局重新定义的野心。&lt;/p&gt;

&lt;p&gt;然而，&quot;第一&quot;的定义本身就充满争议。如果以公开发布时间为准，GPT-3的问世确实早于盘古；如果以大规模商业化应用为标尺，ChatGPT的现象级爆发更是无人能及。华为选择在此时高调发声，其战略意图值得玩味——&lt;strong&gt;在中美科技博弈的大背景下，强调技术自主性已成为中国科技企业的共同选择&lt;/strong&gt;。&lt;/p&gt;

&lt;h2&gt;OpenAI冲刺IPO：AI商业化进入兑现期&lt;/h2&gt;

&lt;p&gt;与华为的&quot;第一&quot;宣言形成鲜明对比的是，OpenAI正在紧锣密鼓地推进上市进程。据知情人士透露，OpenAI已向美国证券交易委员会秘密递交IPO文件，并与高盛、摩根士丹利等顶级投行达成合作，计划最快于2026年秋季完成上市。若顺利落地，这将是科技史上规模最大的IPO之一，估值有望突破万亿美元大关。&lt;/p&gt;

&lt;p&gt;OpenAI的上市计划标志着&lt;strong&gt;大模型行业从&quot;烧钱竞赛&quot;正式迈入&quot;商业化兑现&quot;阶段&lt;/strong&gt;。过去几年，OpenAI凭借ChatGPT的爆发式增长，实现了从非营利研究机构到商业巨头的华丽转身。然而，高昂的算力成本和研发投入始终是其盈利道路上的巨大障碍。上市融资将为OpenAI提供充足的弹药，以应对日益激烈的市场竞争。&lt;/p&gt;

&lt;p&gt;更值得关注的是，OpenAI的IPO可能重塑整个AI行业的估值体系。一旦其市值达到万亿级别，将带动整个AI产业链的估值中枢上移。从芯片制造商到云计算服务商，从模型开发商到应用集成商，整个生态都将受益于这场资本盛宴。但与此同时，&lt;strong&gt;市场对AI企业的盈利预期也将大幅提高&lt;/strong&gt;，那些尚处于烧钱阶段、缺乏清晰商业模式的初创公司将面临更大的生存压力。&lt;/p&gt;

&lt;h2&gt;国产大模型价格战白热化&lt;/h2&gt;

&lt;p&gt;就在华为和OpenAI各自布局之际，国产大模型市场的价格战已经打得火热。6月11日，MiniMax发布了基于稀疏注意力架构的M3模型，并宣布API价格暴跌97.5%。这一降幅堪称惨烈，意味着原本需要100元才能完成的AI任务，现在只需2.5元。&lt;/p&gt;

&lt;p&gt;M3模型的技术亮点同样不容小觑。&lt;strong&gt;其支持的100万token超长上下文窗口&lt;/strong&gt;，是此前主流模型的数倍之多。这一突破对于需要处理长文档、代码库或视频内容的应用场景具有重大意义。稀疏注意力架构的应用，使得计算需求降至此前的1/20，在大幅降低推理成本的同时，依然保持了出色的性能表现。&lt;/p&gt;

&lt;p&gt;价格战的背后是残酷的市场竞争。豆包1.6、商汤V6、DeepSeek V4 Pro等国产大模型纷纷加入战局，API价格一降再降。对于开发者而言，这无疑是一个黄金时代——&lt;strong&gt;以极低的成本就能调用顶尖的大模型能力&lt;/strong&gt;。但对于模型厂商来说，如何在价格战的压力下保持研发投入和技术领先，将是一个严峻的考验。&lt;/p&gt;

&lt;h2&gt;技术路线分化：通用与垂直的博弈&lt;/h2&gt;

&lt;p&gt;随着竞争的深入，大模型的技术路线也开始出现明显的分化。以OpenAI、Anthropic为代表的美国厂商，持续押注通用人工智能（AGI）的终极目标，追求模型的泛化能力和通用智能水平。Claude Opus 4.8引入的动态工作流引擎和多代理编排能力，正是这一思路的最新体现。&lt;/p&gt;

&lt;p&gt;而以华为盘古为代表的中国厂商，则更加强调&lt;strong&gt;垂直行业的深度定制和场景化落地&lt;/strong&gt;。在工业制造、能源矿山、气象预报等领域，盘古大模型已经形成了难以复制的行业know-how积累。这种&quot;窄而深&quot;的技术路线，虽然在通用性上不及GPT系列，但在特定场景下的实用性和商业价值却毫不逊色。&lt;/p&gt;

&lt;p&gt;两条路线孰优孰劣，目前尚无定论。但可以确定的是，&lt;strong&gt;大模型的竞争已经从单纯的技术指标比拼，演变为生态建设和商业模式的全方位较量&lt;/strong&gt;。谁能率先建立起可持续的商业闭环，谁就能在这场马拉松式的竞争中占据主动。&lt;/p&gt;

&lt;h2&gt;未来展望：三国争霸格局初现&lt;/h2&gt;

&lt;p&gt;综合当前的市场态势，AI大模型赛道正在形成&quot;三国争霸&quot;的竞争格局。&lt;strong&gt;OpenAI凭借先发优势和资本实力，继续领跑通用大模型领域&lt;/strong&gt;；Anthropic以安全性和可靠性为差异化卖点，在企业和政府市场稳步扩张；华为则依托完整的产业链布局和深厚的行业积累，在B端垂直市场构筑护城河。&lt;/p&gt;

&lt;p&gt;2026年无疑是AI大模型发展的关键之年。OpenAI的IPO、华为的盘古宣言、国产模型的价格战，这些事件共同勾勒出行业发展的新图景。&lt;strong&gt;从技术突破到商业落地，从资本狂欢到生态构建&lt;/strong&gt;，大模型产业正在经历一场深刻的范式转变。&lt;/p&gt;

&lt;p&gt;对于普通用户和开发者而言，这是一个充满机遇的时代。更低的使用成本、更丰富的模型选择、更强大的AI能力，正在将人工智能从一个遥不可及的科技概念，转变为触手可及的日常工具。而对于行业参与者来说，真正的考验才刚刚开始——在技术与商业的双重赛道上，唯有持续创新和务实落地，才能在这场史诗级的产业变革中立于不败之地。&lt;/p&gt;</description><pubDate>Fri, 12 Jun 2026 16:06:38 +0800</pubDate></item><item><title>智能眼镜销量暴涨800%：AI大模型点燃可穿戴设备新风口，中国品牌冲刺全球九成份额</title><link>https://info.nooko.cn/?id=75</link><description>&lt;p&gt;&lt;img src=&quot;/uploads/ai_model_price_war_20250612.jpg&quot; alt=&quot;智能眼镜AI时代&quot; /&gt;&lt;/p&gt;
&lt;p&gt;可穿戴设备赛道沉寂多年后，一个出人意料的品类突然引爆了整个消费电子市场——&lt;strong&gt;智能眼镜&lt;/strong&gt;。进入2025年以来，智能眼镜销量同比暴涨800%，这一数字不仅远超行业预期，更让众多分析师重新审视AI落地场景的巨大潜力。从几百元的入门款到数千元的高端旗舰，国产智能眼镜正以空前的产品密度和价格梯度席卷市场，一场由AI大模型驱动的可穿戴设备革命已然拉开序幕。&lt;/p&gt;

&lt;h2&gt;800%暴涨背后的三重推力&lt;/h2&gt;

&lt;p&gt;智能眼镜市场的爆发并非偶然，而是多重技术红利与消费需求共振的结果。&lt;strong&gt;AI大模型的端侧部署&lt;/strong&gt;是第一重推力。过去，受限于算力和功耗，智能眼镜的语音助手功能往往体验粗糙，识别准确率和响应速度难以满足日常使用。但随着轻量化大模型的成熟，新一代智能眼镜能够本地运行具备深度理解能力的AI助手，支持自然语言对话、实时信息检索和上下文记忆，交互体验实现了质的飞跃。&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;AR显示技术的突破&lt;/strong&gt;构成了第二重推力。Micro-LED和光波导技术的成熟，使得智能眼镜的显示效果从&quot;能看&quot;进化到&quot;好用&quot;。高亮度、高透光率的显示方案让虚拟信息能够自然叠加在真实视野中，不再有早期产品那种明显的&quot;屏幕感&quot;。这一进步让智能提词、实时翻译、导航指引等核心功能真正具备了实用价值。&lt;/p&gt;

&lt;p&gt;第三重推力来自&lt;strong&gt;中国供应链的极致效率&lt;/strong&gt;。从光学模组到AI芯片，从声学器件到整机组装，中国企业在智能眼镜的每一个环节都建立了深厚的产业积累。这种全链条的供应链优势使得产品迭代速度极快，新品从概念到量产的周期大幅缩短，同时成本控制能力远超海外竞争对手。&lt;/p&gt;

&lt;h2&gt;功能进化：从&quot;听个响&quot;到&quot;全能助手&quot;&lt;/h2&gt;

&lt;p&gt;早期的智能眼镜功能单一，大多只能充当蓝牙耳机的替代品。而2025年的新一代产品已经进化为真正的&quot;全能助手&quot;。&lt;strong&gt;智能提词&lt;/strong&gt;功能成为最受欢迎的应用场景之一——演讲者、主播、教师等职业群体可以通过眼镜镜片上的虚拟文字提示，流畅完成脱稿表达，彻底告别了低头看稿的尴尬。&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;实时翻译&lt;/strong&gt;功能则打开了跨语言沟通的新大门。搭载多语种大模型的智能眼镜能够将对方的语音实时翻译为母语文字，投射在镜片上，同时通过骨传导扬声器播放翻译语音。这一功能在商务谈判、海外旅行等场景中展现出极高的实用价值，被用户称为&quot;戴在眼睛上的同声传译器&quot;。&lt;/p&gt;

&lt;p&gt;此外，&lt;strong&gt;AI摄影助手、健康监测、手势控制&lt;/strong&gt;等功能的加入，进一步拓宽了智能眼镜的使用边界。部分高端型号甚至集成了微型投影模块，能够在任意平面上投射虚拟屏幕，将眼镜变成了一台便携式显示器。功能的持续丰富正在推动智能眼镜从&quot;尝鲜玩具&quot;向&quot;日常必需品&quot;转变。&lt;/p&gt;

&lt;h2&gt;市场格局：中国品牌领跑全球&lt;/h2&gt;

&lt;p&gt;智能眼镜市场的竞争格局呈现出鲜明的&quot;中国主导&quot;特征。国内厂商凭借快速的产品迭代和激进的价格策略，已经占据了市场的主导地位。从互联网巨头到传统音频厂商，从创业公司到手机品牌，各路玩家纷纷入局，推出了覆盖不同价位段的产品矩阵。&lt;/p&gt;

&lt;p&gt;行业数据显示，2025年中国智能眼镜市场出货量预计将突破&lt;strong&gt;275万台&lt;/strong&gt;，同比增长107%，正式超越北美市场成为全球最大的智能眼镜消费区域。更值得关注的是，海外市场的需求同样旺盛，部分热门品牌甚至出现断货现象。分析人士指出，中国品牌有望在未来两到三年内占据全球&lt;strong&gt;80%至90%&lt;/strong&gt;的市场份额，重现智能手机时代中国品牌崛起的路径。&lt;/p&gt;

&lt;p&gt;价格下探是推动市场普及的关键因素。随着产业链成熟和规模效应显现，智能眼镜的平均售价正以每年20%至30%的速度下降。入门级产品的价格已经下探至几百元区间，大幅降低了消费者的尝鲜门槛。这一趋势与智能手机的发展轨迹高度相似——当产品价格降至大众可接受的范围时，市场将迎来爆发式增长。&lt;/p&gt;

&lt;h2&gt;挑战与展望：从爆发到持续增长&lt;/h2&gt;

&lt;p&gt;尽管市场前景广阔，智能眼镜行业仍面临若干挑战。&lt;strong&gt;续航能力&lt;/strong&gt;是用户反馈最集中的痛点，多数产品的单次使用时间在4至8小时之间，难以满足全天候佩戴需求。&lt;strong&gt;佩戴舒适度&lt;/strong&gt;也是影响用户体验的重要因素，镜架重量、鼻托设计和镜腿弧度等细节需要针对不同脸型进行优化。&lt;/p&gt;

&lt;p&gt;在技术层面，&lt;strong&gt;隐私保护&lt;/strong&gt;问题不容忽视。集成摄像头和麦克风的智能眼镜在公共场所使用时，容易引发周围人的隐私担忧。如何在功能体验和隐私尊重之间找到平衡，是厂商需要认真思考的课题。部分品牌已开始通过硬件指示灯和隐私模式切换等设计来缓解这一矛盾。&lt;/p&gt;

&lt;p&gt;展望未来，智能眼镜的进化方向将围绕&lt;strong&gt;&quot;更轻、更强、更智能&quot;&lt;/strong&gt;三个关键词展开。材料科学的进步将带来更轻便的镜架设计，端侧大模型的持续优化将赋予眼镜更强大的AI能力，而与汽车、家居、办公等场景的深度联动则将拓展智能眼镜的应用边界。随着技术成熟度和用户接受度的同步提升，智能眼镜有望成为继智能手机之后下一个改变人们生活方式的终端设备，开启可穿戴智能的新纪元。&lt;/p&gt;</description><pubDate>Fri, 12 Jun 2026 14:01:39 +0800</pubDate></item><item><title>豆包1.6价格暴跌三分之二：大模型价格战白热化，2025年成Agent落地元年</title><link>https://info.nooko.cn/?id=74</link><description>&lt;p&gt;&lt;img src=&quot;https://info.nooko.cn/uploads/ai_cover_doubao16_price_war.jpg&quot; alt=&quot;大模型价格战&quot; title=&quot;大模型价格战&quot; /&gt;&lt;/p&gt;

&lt;p&gt;6月12日，字节跳动旗下火山引擎正式宣布豆包大模型1.6版本大幅降价，综合调用成本降至原来的三分之一。这一消息在AI行业引发强烈震动，标志着中国大模型赛道的价格竞争进入全新阶段。值得注意的是，此次降价并非简单的营销策略，而是基于底层技术架构的深度优化——豆包1.6采用了基于上下文长度的区间定价机制，在0-32K上下文区间内，输入价格低至每百万tokens仅0.8元。&lt;/p&gt;

&lt;h2&gt;降价背后的技术逻辑&lt;/h2&gt;

&lt;p&gt;火山引擎总裁谭待在公开场合详细阐释了此次降价的核心理念。他强调，价格下调的关键驱动力并非功能缩水或服务质量妥协，而是上下文调度层面的根本性优化。豆包1.6作为国内首个支持256K超长上下文的思考型模型，在推理能力和处理效率上均有显著提升，同时通过更精细的资源调度算法大幅压缩了运营成本。&lt;/p&gt;

&lt;p&gt;从技术角度看，大模型推理成本主要由计算资源消耗和内存占用构成。豆包团队在模型架构层面进行了针对性改进，通过优化注意力机制的内存访问模式和引入更高效的推理调度策略，在不牺牲输出质量的前提下实现了成本的大幅缩减。这种&quot;技术驱动降价&quot;的路径，与此前行业里简单粗暴的补贴式降价形成了本质区别。&lt;/p&gt;

&lt;h2&gt;DeepSeek效应持续发酵，阿里被迫加速&lt;/h2&gt;

&lt;p&gt;豆包降价的背后，折射出中国大模型行业日益白热化的竞争态势。值得关注的是，阿里巴巴董事会主席蔡崇信近日在巴黎VivaTech大会上罕见地坦承，公司曾&quot;一度迷失方向&quot;，直到DeepSeek推出低成本高性能模型后，才真正感受到了生存压力。据蔡崇信透露，面对DeepSeek的竞争冲击，阿里工程师团队在春节期间几乎全员驻扎办公室，以超常规节奏推进研发工作，最终在数周内推出了竞争力强劲的Qwen系列模型。&lt;/p&gt;

&lt;p&gt;这一事件深刻揭示了中国AI行业的竞争现实：技术突破往往来自意想不到的方向，而巨头们的危机意识和应变速度正在被倒逼提升。阿里在经历组织架构调整后，已将AI明确为电商与云计算双核心战略的基石，DeepSeek的出现无疑加速了这一战略转型的落地进程。&lt;/p&gt;

&lt;h2&gt;2025：Agent落地元年&lt;/h2&gt;

&lt;p&gt;谭待在解读豆包降价战略时提出了一个重要判断——2025年将是中国AI Agent（智能体）落地的元年。他认为，大模型价格的持续下降正在消除企业采用AI智能体的核心障碍，智能体将逐步从概念验证阶段走向规模化部署，渗透到企业运营的各个业务环节。&lt;/p&gt;

&lt;p&gt;从行业数据来看，这一趋势已有明显信号。据最新统计，2026年国内新增大模型企业级项目中，搭载RAG（检索增强生成）架构的占比已高达78%，同比提升26个百分点。与之关联的GEO（生成式引擎优化）技术服务市场规模已突破1100亿元，年复合增长率保持高位。这些数据表明，大模型正在从&quot;炫技&quot;阶段快速过渡到&quot;实用&quot;阶段，企业级应用场景的爆发已近在眼前。&lt;/p&gt;

&lt;h2&gt;价格战的深层影响&lt;/h2&gt;

&lt;p&gt;大模型价格战的影响远不止于商业竞争层面。从产业生态角度审视，持续降价正在重塑整个AI产业链的价值分配格局。对于上游芯片厂商而言，推理需求的爆发式增长意味着算力市场的扩容；对于中游模型提供商而言，价格竞争正在加速行业洗牌，缺乏技术积累和成本控制能力的玩家将被淘汰；对于下游应用开发者而言，更低的API调用成本意味着可以尝试更丰富的应用场景和更复杂的业务逻辑。&lt;/p&gt;

&lt;p&gt;从全球视角来看，中国大模型市场的价格竞争强度已明显领先于海外市场。这种竞争态势一方面推动了中国AI技术的快速迭代，另一方面也引发了关于&quot;低价竞争是否可持续&quot;的讨论。然而，从豆包1.6的案例来看，基于技术进步的成本优化具有可持续性，这或许为中国大模型产业走出一条差异化竞争路径提供了参考。&lt;/p&gt;

&lt;p&gt;展望未来，随着更多企业级AI应用的落地验证，大模型行业的竞争焦点将从单纯的&quot;价格战&quot;逐步转向&quot;价值战&quot;——谁能为企业客户创造更可量化的业务价值，谁才能在这场AI竞赛中真正胜出。&lt;/p&gt;</description><pubDate>Fri, 12 Jun 2026 12:04:35 +0800</pubDate></item></channel></rss>