你禁你的,我搞我的:按不住的中国AI冲出一个U2大模型
又禁了,又 xx 的禁了。美国人工智能企业 Anthropic 旗下两款最新大模型 Fable 和 Mythos 被全面禁止外国公民访问,甚至包括这家公司的外籍员工……
你禁你的吧,我们玩我们的。
1
中国 AI 犀利出圈
一边是美国 AI 闭关锁国,另一边,中国 AI 犀利出圈。" 港股 AGI 第一股 " 云知声在本月初发布了其最新通用大语言模型 U2。出道即巅峰。
基于快慢思考融合的 MoE(混合专家)范式构建,与大多数同行们堆参数、堆 Token 的路径截然不同,从而实现了 " 小参数强能力、少 Token 高产出、低算力低成本 " 的突破。
用行话来说就是用 3000 亿级别的参数规模实现了万亿级别参数的大模型性能。
更小更轻更便宜,但一样好用。有多便宜呢?售价仅为 1.9 元。
有多好用呢?综合能力跻身全球榜单 TOP 10。
海外权威 AI 模型评测平台 LLM Stats 更新的榜单中,U2 排名第 8。在平台收录的独立长上下文评测基准 LongBench-V2 中,以 54.4% 的 Accuracy 超越 Claude Opus 4.7。
呐,这可不是中国小圈子自吹自擂,这是全球权威公开的 AI 模型评测榜单。U2 的实力是第三方实打实用评测数据排出来的结果。
确实是有技术优势的,而且可以视作 " 另辟蹊径 ",属于全球独一份的技术创新。先飚几句行话,懂行的可以看看是不是真优势:
第一、架构层面,U2 提出了快慢思考融合的 MoE 高知识密度结构。
第二、训练层面,U2 构建了以课程学习、过程监督、Harness 协同演进为核心的训练体系。
第三、工程层面,TITO 全链路 Token ID 直通网关从根本上消除了多轮 RL 训练中的分词漂移问题,上下文自适应记忆操作算子为长程任务提供了原生的记忆管理能力。
简单翻译一下就是:可通俗理解为类似 " 多线程处理 " 的思路决定了其深度推理能力、编程能力更高效、响应速度更快;AI 能耗更低的同时处理结果更准确;训练出的能力可无缝对接 OpenClaw / Hermes 等主流 Agent 脚手架,适配度更高,同时成本更低。
2
测一下它真牛还是吹牛
已经有不少人公开了测评结果,可以说一片好评。那作为 AI 行业的深度观察者,我这边也手痒到不行了,开测。
根据普通爱好者最常用的 AI 能力以及本人的个人偏好,对 U2 的能力测评主要在三个点:推理、编程、Agent。
先看推理:
因为我平时关注科技与电商等行业,那刚好 618 结束,我让 U2 帮我生成一份今年 618 中国电商销量最高的十款商品以及背后的社会消费动因,测评结果如图:
思考了大约 3 分钟,平心而论,这个速度与常见的大模型相比不是最快的,但这反而让我感到放心,因为这个问题本身是有窄度的,限定了主题意味着我的要求更加明确,那么对于这个需求的处理过程(思考)自然需要精确调用信息。再来看结果:
这个结果是有点意外的,销量前三甲都是苹果手机;而且除了第六第七是面霜和空调,其余产品也都是——国产手机。U2 给出的总结是:2026 年 618 消费体现出品质化、智能化、健康化、国货化四大趋势。消费者更注重产品实际价值而非单纯追求低价。
按照我对 618 的数据掌握情况以及多方比对,这个结果是高度准确的,在推理层面,U2 确实是靠谱的。
再看编程能力:我的需求是,帮我编写一个适合 8 岁小孩的经典五子棋网页小游戏。U2 表现得很兴奋,仅用时 1 分钟就编写在了一个文档中,用浏览器打开即可游玩。
最后是 Agent 综合落地:我提出了一个非常复杂但大家又都很感兴趣的话题,就是分析一下 Space X 上市之后的走势。U2 在思考片刻之后给出的分析结果如下:
面对这个综合了多方要素的金融难题,U2 在很短的时间内精确调用了多种资源,自动抓取了所需的检索与分析工具,很快就生成了逻辑清晰、数据有出处、结论严谨的报告,展现了足够强大的深度结构化处理能力。
这种处理能力尤其让我动容的是:下限非常高,没有出现常见的大模型工具为了完成而疯狂幻觉的坏毛病,同时上限也肉眼可见的高,应用场景非常广泛,无论是哪个行业或者任何案头工作,它都能在最短时间内手到擒来,而且呈现结果可用度极高。从最基础的给出答案,进阶为可靠地帮助人实现任务,这个实测水平确实对得起这家公司忝列全球 AI 头部序列。
3
中国 AI 已经按不住了
云知声 U2 出道即巅峰,给我的感觉不是孤证,而是一个群星璀璨时代的必然结果。换句话说,想用 " 禁令 " 按住中国 AI 的群星时刻,已经不可能了。
首先技术上按不住。U2 不是一夜间出现的,它的身边有足够多的战友,DeepSeek、智谱、百川、通义、混元、盘古……中国大模型阵营的参战兵力已经多到让对手数不过来了。而且量变带来质变,就比方云知声用 3000 亿参数打出万亿性能,其实是有代表性的,大家都在逼自己用更少的资源做更多的事。这种能力不是靠禁令能封死的,因为它本质上是在解决全球性的技术到实战的最后一公里——如何用有限的资源创造无限的可能。
其次是产业趋势按不住。不是说中国 AI 已经天下无敌了而是说 U2 代表的这条技术路线、出圈姿势、这波产业浪潮,已经大势所趋。这家公司过去 14 年的技术历程,历经了中国 AI 与全球 AI 大发展的每个重要时刻,也正是在这场连续不断的产业化迭代攀升的历史进程中,持续涌现出了 U2 这样的技术突破成果。
这样的公司在中国不是一个,是源源不断的一批又一批。请问你拿什么禁?
