大模型资讯 | LLM动态与模型评测

美团开源万亿参数大模型LongCat-2.0：国产算力集群完成全流程训练

7月11日，美团正式发布自研万亿参数大模型LongCat-2.0并宣布开源。该模型总参数达1.6万亿，采用混合专家架构，支持百万级Token上下文窗口，在多个基准测试中超越同量级开源模型。尤为值得关注的是，LongCat-2.0是业界首个在五万卡国产算力集群上完成全流程训练与推理的万亿参数模型。国产算力支撑万亿参数模型训练，打破技术壁垒LongCat-2.0的发布具有重要意义。长期以来，训练万亿参数模型依赖英伟达等国外厂商的高端GPU。而LongCat-2.0完全基于国产算力...

2026-07-12/ 545 次浏览/ 大模型

美团开源万亿参数大模型LongCat-2.0：国产算力集群完成全流程训练

2026-07-12/ 542 次浏览/ 大模型

Anthropic发布Claude Science：AI从写代码走向做实验的战略跃迁

6月30日，Anthropic在旧金山举办的AI for Science活动上正式发布Claude Science，这一重大举措标志着人工智能在科学研究领域的应用进入全新阶段。不同于以往专注于代码生成的AI工具，Claude Science定位为面向科研人员的AI工作台，整合了基因组学、蛋白质组学、药物发现等60余项预配置工具，旨在加速科学发现进程。60+科学工具一体集成，打造科研新范式Claude Science的核心亮点在于其强大的工具集成能力。平台整合了基因组数据分析、...

2026-07-07/ 516 次浏览/ 大模型

OpenAI正式发布GPT-5.6系列：Sol、Terra与Luna三档模型齐发，编程跑分超越Claude Mythos 5

2026年6月27日，OpenAI正式对外宣布推出GPT-5.6系列模型。这一次发布并非一次简单的版本迭代——三款面向不同场景的型号同时亮相，加上美国政府监管压力下的分阶段开放策略，让整个AI行业再次聚焦于这场技术与政策交织的博弈。三档模型矩阵：从旗舰到轻量的精准分层GPT-5.6系列一次性发布了三款模型：Sol定位旗舰级，面向编码、网络安全、生物学等复杂任务以及长周期智能体工作流；Terra作为中端模型，专为高吞吐、大规模批量调用场景优化；Luna则是轻量级快速响应模型，主...

2026-06-27/ 539 次浏览/ 大模型

DeepSeek完成510亿元首轮融资：估值破500亿美元，国产大模型资本新纪元

6月16日，国产大模型代表企业深度求索（DeepSeek）完成公司成立以来首轮外部融资，规模约510亿元人民币（约合70亿美元以上），投后估值突破500亿美元。本轮由创始人梁文锋个人出资约200亿元领投，腾讯出资约100亿元，宁德时代及溥泉资本出资约50亿元，网易、京东、Monolith砺思资本、IDG资本各出资约30亿元。这笔融资刷新了国内AI赛道单轮融资纪录，也标志着DeepSeek正式进入超级独角兽行列。融资结构：创始人重金领投彰显信心从融资结构来看，创始人梁文...

2026-06-18/ 1489 次浏览/ 大模型

国产AI算力芯片强势崛起：2025年出货量占比突破55%，生态闭环加速成型

2025年，中国人工智能产业正经历一场深刻的算力底座重构。据最新行业数据显示，国内AI加速卡市场国产芯片出货量占比已历史性突破55%大关，标志着国产算力正式从边缘配套走向核心主场。华为昇腾、寒武纪、摩尔线程等本土厂商在推理性能、能效比和生态适配等维度全面提速，国产AI芯片的迭代周期已压缩至12-18个月，与国际主流节奏并驾齐驱。国产芯片性能跃升：从追赶到并跑的关键转折在技术层面，国产AI芯片正实现从"能用"到"好用"的质变。华为昇腾950PR芯片在推理场景下的性能表现已达到英...

2026-06-15/ 1565 次浏览/ 大模型

黄仁勋首度回应任正非：全球AI芯片格局正在被重新定义

在全球人工智能产业高速推进的当下，一场围绕AI芯片话语权的深层博弈正在悄然展开。英伟达CEO黄仁勋近期首次公开回应华为创始人任正非此前关于AI芯片领域的发言，这一罕见互动引发了业界广泛关注。黄仁勋坦言，尽管英伟达在单芯片性能上仍保持一代领先优势，但人工智能的发展逻辑并非单纯依赖单颗芯片的算力上限，而是更加看重整体算力规模的部署能力。黄仁勋的"坦诚"：承认华为已能覆盖中国市场需求在此次回应中，黄仁勋传递了一个意味深长的信号：中国拥有充足的能源资源来支撑大规模芯片集群...

2026-06-15/ 2873 次浏览/ 大模型

DeepSeek V4昇腾全栈适配：国产AI芯片从"备胎"到主力的历史性转折

在过去的几年里，全球大模型训练几乎形成了一个不成文的共识：想要训练顶级AI模型，就必须依赖英伟达的GPU和CUDA生态。国产芯片即便在推理场景中偶有露面，也大多停留在"备选方案"的位置。然而，这一局面正在被一场前所未有的技术突破所颠覆。从"备胎"到首发：DeepSeek V4的战略抉择 2025年，DeepSeek V4的发布在整个AI行业引发了强烈震动。这款拥有1.6万亿参数的旗舰大模型，做出了一个令外界始料未及的决定——选择华为昇腾平台作为首发训练和运行环境。这...

2026-06-15/ 1727 次浏览/ 大模型

中国AI大模型产业突破4500亿：国产模型全球化提速，智谱GLM引领出海新范式

2025年6月，中国人工智能产业交出了一份令人瞩目的成绩单。据最新统计数据显示，国内AI产业整体规模已突破4500亿元大关，核心企业数量超过2500家，通过国家网信办备案的生成式大模型达到241款，三项指标均稳居全球首位。更值得关注的是，一家海外科技公司的CTO近期做出了令同行震惊的决策——将公司90%的AI工作负载从Claude和Gemini迁移至中国智谱科技研发的GLM模型，这一事件被视为国产大模型从技术追赶到全球输出的标志性转折。产业规模再创新高，"第一城"效应...

2026-06-14/ 1906 次浏览/ 大模型

MiniMax开源M1推理模型：百万Token上下文+超低算力成本，开源AI推理赛道迎来新标杆

在AI大模型竞争日趋白热化的当下，推理效率与算力成本已成为决定模型能否大规模落地的关键因素。国内AI企业MiniMax（稀宇极智）近期开源的推理模型MiniMax-M1，以其突破性的性能指标和极低的训练成本，为开源社区注入了一剂强心针。这款模型不仅在技术指标上令人瞩目，更在商业模式层面为行业提供了全新的思考方向。百万Token上下文：打破长文本处理天花板 MiniMax-M1最引人注目的特性之一，是其支持高达100万Token的输入长度——这一数字是DeepSeek-R...

2026-06-14/ 2586 次浏览/ 大模型

华为盘古大模型5.5重磅发布：准万亿参数MoE架构引领国产AI新高度

在2025年华为开发者大会（HDC 2025）上，华为常务董事、华为云CEO张平安正式揭开了盘古大模型5.5的神秘面纱。这一版本不仅代表了华为在人工智能领域的最新技术结晶，更标志着国产大模型正式迈入全球顶尖竞争行列。从准万亿参数的MoE架构到首创的多模态世界模型，盘古5.5正在重新定义"中国智造"的技术高度。准万亿参数MoE架构：盘古Ultra MoE的技术突破盘古大模型5.5的核心亮点之一，便是其Ultra MoE模型——一个拥有7180亿参数的准万亿级MoE（混合...

2026-06-14/ 1241 次浏览/ 大模型

国产8nm eMRAM芯片流片成功：推理提速30%功耗骤降40%，端侧AI迎来存储革命

在人工智能浪潮席卷全球的当下，端侧AI正成为产业竞争的新焦点。然而，存储瓶颈始终是制约边缘设备性能的核心难题——传统DRAM功耗居高不下，Flash读写速度难以满足实时推理需求。近日，一款国产8nm eMRAM芯片成功流片的消息引发行业震动：推理速度提升30%，功耗骤降40%。这一突破不仅意味着国产半导体在先进存储领域迈出关键一步，更预示着端侧AI即将迎来的存储革命。一、eMRAM技术：打破"存储墙"的破局之钥 eMRAM（嵌入式磁性随机存取存储器）是一种基于磁隧道结（...

2026-06-14/ 2064 次浏览/ 大模型

端侧AI芯片全面爆发：从智能手机到机器人，大模型正重塑万物智能

2025年的科技圈，如果非要提炼一个贯穿全年的主线，那一定是端侧AI芯片的全面爆发。这不仅仅是一场硬件升级，而是一次从云端到终端的智能范式转移——大模型正在从数据中心走向你口袋里的手机、手腕上的手表、鼻梁上的眼镜，甚至脚下奔跑的机器人。巨头集体押注：端侧AI成为新战场今年6月的苹果WWDC开发者大会上，Siri迎来了自2011年诞生以来最彻底的一次重构。全新的Siri不再是一个简单的语音助手，而是一个深度融合了苹果自研大模型能力的智能体。这背后，是苹果A系列芯片多...

2026-06-14/ 2770 次浏览/ 大模型

OpenAI o3-pro重磅发布降价80%：全球AI算力竞赛进入白热化阶段

2025年6月第二周，全球人工智能领域迎来密集的技术与商业动作。其中，OpenAI连续发布o3-pro推理模型、大幅下调API价格、宣布多云合作战略三连击，堪称本年度大模型赛道最具震撼力的组合拳。这一系列举措不仅直接冲击了竞争对手的市场份额，更深刻揭示了AI产业正在经历的底层逻辑变革——从单纯的技术参数竞赛，转向算力基础设施、定价策略和生态构建的多维博弈。 o3-pro：面向复杂推理的新一代旗舰模型 OpenAI此次推出的o3-pro定位为"深度推理"旗舰产品，主要面...

2026-06-14/ 2853 次浏览/ 大模型

中国大模型全球化提速：智谱GLM海外企业迁移背后的产业新格局

就在全球AI竞争日趋白热化的当下，一则来自海外的消息在国内科技圈引发了广泛讨论：2025年6月，一家海外科技公司的首席技术官做出了一项令同行直呼"大胆"的决定——将公司90%的AI工作负载从Anthropic的Claude和Google的Gemini全面迁移到中国智谱AI开发的GLM系列模型上。这一标志性事件，折射出中国大模型产业正在经历一场从量变到质变的深刻跃迁。从"追赶者"到"被选择者"：中国大模型的全球化拐点过去两年，中国大模型企业给人的印象更多是"追赶者"...

2026-06-13/ 2742 次浏览/ 大模型

云知声U2大模型评测登顶全球前九：3000亿参数如何跑赢万亿模型？

当大多数AI厂商还在疯狂堆叠参数、比拼谁的模型"更大更强"时，一家从语音识别赛道走出来的公司，选择了一条截然不同的路。6月初，云知声正式发布了旗下新一代原生智能体模型——U2，这款拥有近3000亿参数的MoE稀疏混合专家架构大语言模型，在多项国际权威评测中交出了一份令人意外的答卷。评测数据说话：全球前九，长文本超越Claude 根据6月10日海外权威AI模型评测平台LLM Stats更新的最新榜单，云知声U2在LLM Stats Score综合能力评测中成功跻身模型总榜...

2026-06-13/ 1437 次浏览/ 大模型

百度文心大模型全面开源：十款模型权重释放，X1.1深度思考能力惊艳亮相

在国内大模型竞争日趋白热化的背景下，百度于2025年6月底打出了一套引人注目的组合拳——文心4.5系列十款模型正式开源，文心X1.1深度思考模型同步上线。这两步棋分别瞄准了开源生态建设和前沿推理能力两个关键战场，释放出百度在大模型赛道上加速布局的强烈信号。十款模型开源：从轻量到重量全覆盖6月30日，百度通过旗下深度学习框架飞桨（PaddlePaddle）平台，一次性释放了文心4.5系列的十款开源模型。这批模型在参数规模上形成了完整的梯度覆盖：从仅有0.3B参数的稠密型轻量模型...

2026-06-13/ 1603 次浏览/ 大模型

OpenAI GPT-5.6即将登场：150万上下文窗口重塑大模型竞争格局

大模型赛道的竞争节奏正在急剧加速。据多方消息源确认，OpenAI计划于近期正式发布GPT-5.6——这款内部代号为"iris-alpha"的新一代语言模型，将上下文处理能力推至前所未有的150万tokens。这一数字较GPT-5.5实现了数倍级的跃升，意味着开发者可以在单次对话中输入相当于数百万字的文档资料，而模型依然能够保持精准的理解和连贯的推理。与此同时，OpenAI的上市计划也在同步推进，整个AI行业正站在一个关键的技术与商业交汇点上。 150万上下文：从量变到质变...

2026-06-13/ 1922 次浏览/ 大模型

谷歌DiffusionGemma开源发布：文本扩散架构挑战自回归范式，大模型推理提速4倍

大模型领域的竞争正从"谁参数更大"向"谁架构更聪明"悄然转变。就在本周，谷歌DeepMind团队悄然放出了一个令人眼前一亮的实验性项目——DiffusionGemma。这款模型最大的看点不在于参数规模，而在于它彻底抛弃了当前大语言模型主流的自回归生成范式，转而采用源自图像生成领域的扩散架构来处理文本任务。扩散架构进军文本生成：从图像到语言的跨界突破长期以来，从GPT系列到Llama，几乎所有主流大语言模型都采用自回归（Autoregressive）方式逐词生成文本...

2026-06-12/ 2451 次浏览/ 大模型

苹果Xcode 27原生集成三大AI编程智能体：开发者工具进入Agent协作时代

6月10日，苹果在Xcode 27 Beta更新中悄然埋下了一颗重磅炸弹——原生集成Google Gemini智能体。至此，OpenAI Codex、Anthropic Claude Agent和Google Gemini三大AI编程助手首次齐聚同一款集成开发环境，这在软件开发工具史上尚属首次。这一举动不仅打破了苹果一贯封闭的生态策略，更释放出一个清晰信号：AI编程已从"锦上添花"进化为开发者的"基础设施"。三大AI巨头同台：Xcode 27的野心与妥协对于长期坚...

2026-06-12/ 2825 次浏览/ 大模型

‹‹ 1 2 › ››