当大多数AI厂商还在疯狂堆叠参数、比拼谁的模型"更大更强"时,一家从语音识别赛道走出来的公司,选择了一条截然不同的路。6月初,云知声正式发布了旗下新一代原生智能体模型——U2,这款拥有近3000亿参数的MoE稀疏混合专家架构大语言模型,在多项国际权威评测中交出了一份令人意外的答卷。
评测数据说话:全球前九,长文本超越Claude
根据6月10日海外权威AI模型评测平台LLM Stats更新的最新榜单,云知声U2在LLM Stats Score综合能力评测中成功跻身模型总榜...
在国内大模型竞争日趋白热化的背景下,百度于2025年6月底打出了一套引人注目的组合拳——文心4.5系列十款模型正式开源,文心X1.1深度思考模型同步上线。这两步棋分别瞄准了开源生态建设和前沿推理能力两个关键战场,释放出百度在大模型赛道上加速布局的强烈信号。十款模型开源:从轻量到重量全覆盖6月30日,百度通过旗下深度学习框架飞桨(PaddlePaddle)平台,一次性释放了文心4.5系列的十款开源模型。这批模型在参数规模上形成了完整的梯度覆盖:从仅有0.3B参数的稠密型轻量模型...
大模型赛道的竞争节奏正在急剧加速。据多方消息源确认,OpenAI计划于近期正式发布GPT-5.6——这款内部代号为"iris-alpha"的新一代语言模型,将上下文处理能力推至前所未有的150万tokens。这一数字较GPT-5.5实现了数倍级的跃升,意味着开发者可以在单次对话中输入相当于数百万字的文档资料,而模型依然能够保持精准的理解和连贯的推理。与此同时,OpenAI的上市计划也在同步推进,整个AI行业正站在一个关键的技术与商业交汇点上。
150万上下文:从量变到质变...
大模型领域的竞争正从"谁参数更大"向"谁架构更聪明"悄然转变。就在本周,谷歌DeepMind团队悄然放出了一个令人眼前一亮的实验性项目——DiffusionGemma。这款模型最大的看点不在于参数规模,而在于它彻底抛弃了当前大语言模型主流的自回归生成范式,转而采用源自图像生成领域的扩散架构来处理文本任务。
扩散架构进军文本生成:从图像到语言的跨界突破
长期以来,从GPT系列到Llama,几乎所有主流大语言模型都采用自回归(Autoregressive)方式逐词生成文本...
6月10日,苹果在Xcode 27 Beta更新中悄然埋下了一颗重磅炸弹——原生集成Google Gemini智能体。至此,OpenAI Codex、Anthropic Claude Agent和Google Gemini三大AI编程助手首次齐聚同一款集成开发环境,这在软件开发工具史上尚属首次。这一举动不仅打破了苹果一贯封闭的生态策略,更释放出一个清晰信号:AI编程已从"锦上添花"进化为开发者的"基础设施"。
三大AI巨头同台:Xcode 27的野心与妥协
对于长期坚...
2026年6月12日,华为开发者大会现场传来一声惊雷。华为终端BG董事长余承东在主题演讲中掷地有声地宣称:"盘古大模型是全球第一个大模型"。这一表态犹如向平静的湖面投入巨石,瞬间在科技圈激起千层浪。就在同一天,OpenAI向美国证券交易委员会递交IPO申请的消息也在资本市场上引发轩然大波。两大事件在同一天发生,仿佛冥冥之中预示着AI大模型赛道正在进入一个全新的竞争阶段。
盘古大模型的"第一"之争
余承东的"全球首个"论断并非空穴来风。从技术演进脉络来看,华为在人工智能领...
6月12日,字节跳动旗下火山引擎正式宣布豆包大模型1.6版本大幅降价,综合调用成本降至原来的三分之一。这一消息在AI行业引发强烈震动,标志着中国大模型赛道的价格竞争进入全新阶段。值得注意的是,此次降价并非简单的营销策略,而是基于底层技术架构的深度优化——豆包1.6采用了基于上下文长度的区间定价机制,在0-32K上下文区间内,输入价格低至每百万tokens仅0.8元。
降价背后的技术逻辑
火山引擎总裁谭待在公开场合详细阐释了此次降价的核心理念。他强调,价格下调的关键驱动...
六月的AI圈,热闹程度堪比盛夏的高温。就在过去一周,国内大模型赛道接连放出重磅消息——字节跳动旗下豆包大模型迎来1.6版本迭代,商汤科技SenseNova系列升级至V6,与此同时,中国科研团队在光计算芯片方向取得里程碑式突破。三件事看似各自独立,实则共同指向一个趋势:国产大模型正在从单纯的参数比拼,转向多模态融合与底层算力架构的协同创新。
豆包1.6:多模态推理的"性价比杀手"
字节跳动这次推出的Doubao 1.6并非简单的版本号递进。据多方信息交叉验证,新模型在多...
2026年6月9日,AI领域迎来一枚重磅炸弹——Anthropic正式推出新一代旗舰大模型Claude Fable 5,同步亮相的还有定位更高的Claude Mythos 5。两款模型共享同一底层架构,但Fable 5的特殊之处在于,它是Anthropic历史上首个面向公众开放的Mythos级别模型,这意味着此前仅限于内部或特定合作伙伴使用的顶级能力,如今所有开发者都能直接调用。
从Opus到Mythos:模型能力的代际跃迁
熟悉Claude模型家族的用户都知道,An...
2025年上半年的中国人工智能行业,正在经历一场前所未有的"双轨加速"——一边是监管框架日趋完善、合规进程持续提速,另一边则是头部企业密集冲刺资本市场、产业落地进入深水区。这两条看似平行的轨道,实则正在交汇融合,共同塑造着中国大模型产业的未来格局。
备案潮涌:439款生成式AI服务获准入场
根据国家网信办最新披露的数据,截至2025年6月30日,全国累计已有439款生成式人工智能服务完成备案,另有233款生成式AI应用或功能完成登记。值得注意的是,仅在2025年第二季度...
长期以来,大模型训练领域几乎被英伟达的CUDA生态牢牢垄断。从GPT系列到Llama,几乎所有知名大模型的训练都依赖NVIDIA的H100、H800等高端GPU。国内厂商虽然在推理环节取得了一定进展,但在训练这一核心场景上始终缺乏有力的技术验证。6月10日,摩尔线程正式宣布开源MusaCoder代码大模型,彻底改变了这一局面——这是业内首个完全基于国产全功能GPU算力底座完成全链路训练与验证的大语言模型,模型权重及训练代码已同步在开源社区上线。
从"能用"到"好用":国产...
2026年6月堪称大模型行业的"超级发布月"。DeepSeek、MiniMax、Anthropic三家厂商先后亮出王牌,加上微软7款MAI模型和云知声U2大模型,大模型竞争进入前所未有的白热化阶段。
一、DeepSeek V4 Pro:开源模型的精确度之王
DeepSeek正式发布V4 Pro模型,宣称在精确度指标上超越OpenAI GPT-5.5 Pro。这是中国开源模型在高端推理能力上持续逼近甚至反超头部闭源模型的标志性事件。此前DeepSeek已将V4 Pro永久降价...
6月9日,AI安全领域的领军企业Anthropic发布了一份震动业界的报告——《当AI构建自身》,正式向全球发出递归自我改进(RSI)风险预警。报告指出,截至2026年5月,Claude代码库中已有80%的代码由AI自主编写,工程师人均产能暴涨8倍。更令人警醒的是,Anthropic预测递归自我改进或在2028年底前发生,概率高达60%。递归自我改进:AI正在"造自己"所谓递归自我改进,是指AI系统能够自主优化自身的算法和架构,无需人类干预即可实现能力跃升...