用AI,就得用国外的?
今天跟朋友聊天,聊到一件我一直觉得不太对劲的事。
他提到自己最近的感受。身边很多人,包括一些做内容的人,在 AI 工具的选择上几乎形成了一种默认共识,要用就用国外的。ChatGPT、Claude、Gemini,这是一档。国内的模型嘛,那属于「另一档」。
我说,你有没有觉得,现在那些 AI 头部博主,80% 到 90% 的内容都是在吹国外模型?
他想了一下,说,好像确实是。
我说,他们也不是完全不提国产模型。国产出了新版本的时候,也会出一两篇文章来「宣传」一下。但仔细看就会发现,读完的感觉就是「任务完成了」。交完差,第二天继续吹国外的。
朋友补了一句。而且你有没有注意到,他们提到国内模型的时候,大部分都是商单。
我说,是。挣着国内厂商的广告费,嘴上喊着国外的好。
这种割裂感,才是真正让人不舒服的地方。

但先别急着骂自己人
让我先说说我自己。
坦率地讲,我自己的潜意识里,也有这么一种倾向,只要能力够得着,就会优先用国外的模型。
我vibe coding的时候,基本上都在用 ChatGPT 5.5或者Gemini 3.5 Flash(Anthropic 实在是用不起)。因为在这个场景下,国外的模型确实更顺手,我已经形成了习惯,也就不太愿意换。
但有意思的是,我现在写文章,已经全部切换到 DeepSeek V4 Flash 了。效果非常好,完全够用,甚至在某些中文表达的细腻程度上有惊喜。
这就引出了一个我想在这篇文章里认真讨论的问题。
在不同的场景下,其实有不同的工具更适合。没有哪个模型是「全面碾压」的。
但我们现在整个舆论氛围变成了一种暗示,用 AI 就要用国外的,用国内的就是 low。
这个氛围,我觉得不太对。

这风气的根,埋在一百年前
聊到这的时候,我想起了一段历史。
清朝末年,庚子赔款之后,美国退还了部分赔款,用于送中国学生去美国留学。1909 年到 1929 年之间,大约有 1800 名学生通过这个渠道去了美国。
这些人里,出了很多了不起的人物。胡适、赵元任、竺可桢、梅贻琦,都是那个时期出去的。
但还有另一个数字。这批留美学生最终回到中国的,不到 30%。
大部分人留在了国外。
这本身没有对错。每个人都有选择自己生活的权利。但我想说的是,这一段历史塑造了中国知识界很长一段时间里的一种潜意识,外面的就是更好的。
当时的大学里,留美回来的教授地位最高,留欧的次之,国内培养的教授最不受待见。「留美博士」这个头衔,就是学术界的金字招牌。
钱学森 1955 年历经千难万险回国,美国海军次长说他抵得上五个海军陆战师。华罗庚在回国的轮船上写了《告留美学生的公开信》,信里有一句话。
「梁园虽好,非久居之乡。归去来兮。」
我一直很喜欢这句话。它的意思不是说梁园不好,梁园当然好,好东西谁不向往呢?但这里是我的家,我还是要回来。
今天再看 AI 圈里这股「国外的更好」的风气,你会发现,历史在换皮重演。
能「出去」(也就是能用上国外模型)的人,本身就是一个极小的圈子。还要有海外信用卡、英语能力,这几道门槛一叠,14 亿人口里,能用上的人可能不到 1%。
但这不到 1% 的人,占据了 AI 相关内容声量的 80% 到 90%。
而那些真正占据了 99% 用户的人,比如 DeepSeek、通义千问、Kimi、豆包,却在这些内容里变成了「背景板」。「哦,国产的,也能用,但是……」
这个「但是」后面跟的东西,有时候已经不是事实了,成了一种惯性。

同一个剧本,国产车已经演过一次了
顺着这个思路,我想到了另一个故事。
大概十年前,中国汽车市场还是合资车的天下。大众、丰田、本田、通用,加在一起占了 70% 以上的市场份额。如果你去买一辆国产车,身边的人会觉得你疯了。
当时流行一句话,叫「开国产车丢人」**。
这是真事。2010 年左右,你拿着同样的预算,宁可买一台丐版大众桑塔纳,也不会买一台顶配的比亚迪 F3。因为开合资车有面子,开国产车掉价。
比亚迪那几年的处境,可以说是「黑暗时刻」。创始人王传福后来说,2019 年是最难的一年,利润跌到了 16 亿,销量连续 11 年在 40 到 50 万辆之间徘徊。
但就在那一年,比亚迪在研发上投了 84 亿。
后来的事情大家都知道了。2020 年刀片电池发布,2022 年比亚迪成为全球第一个停止燃油车生产的车企,2023 年超越大众成为中国市场最畅销的品牌,2025 年超越特斯拉成为全球最大的电动车制造商。
更戏剧性的是,2023 年大众投了 7 亿美元给中国的造车新势力小鹏,为了买他们的技术。
德国车企向中国购买技术,这在十年前是不可想象的。
今天你再问一个年轻人,买国产车丢人吗?他大概会觉得很奇怪。在今天的年轻人眼里,比亚迪汉、蔚来 ET7、理想 L9 已经成了新中产的社交货币。买合资车?那才叫老土。
从「开国产车丢人」到「不开国产车不够潮」,这个口碑翻转只用了五年时间。

所以,当我听到有人说「国产 AI 就是不行」的时候,我脑子里想的是,你有多久没有认真用过最新版的国产模型了?
我自己专门去看了一下当前的 benchmark 数据。结果有点出乎意料。
阿里巴巴的通义千问系列,最新的 Qwen3.7 Max 版本,在 Artificial Analysis 的智能指数上得分 57。你知道这个分数是什么水平吗?它和 GPT-5.5(medium 模式)、Gemini 3.1 Pro 是完全持平的。而它的价格,只相当于 GPT-5.5 的三分之一。
DeepSeek 更是把性价比做到了极致。V4 Flash 版本的智能指数是 47(在 Max 推理模式下),大约是 GPT-5.5 顶配水平的 80%,但价格只有 GPT-5.5 的 七十分之一。
我当然不是在说国产模型已经全面超越了国外的最好版本。Claude Opus 4.8 的 61 分、GPT-5.5 high 的 59 分,确实是目前的天花板,在复杂推理和代码生成上依然领先。
但我想说的是,国产模型的真实能力和大众认知之间,存在一条巨大的信息鸿沟。
这条鸿沟是怎么来的?一方面是很多人对国产模型的印象还停留在「两年前那个版本」。另一方面,是那些最有影响力的人,那些每天都在写 AI 内容的人,也没有在帮读者填补这条鸿沟。
他们用的是国外模型,写的是国外模型,推荐的也是国外模型。国产模型出了新版本,他们可能连深度测试的兴趣都没有。偶尔一期,还多半是广告。
这就回到我前面说的那个感觉。挣着国内的钱,吹着国外的香。
骂完别人,也得骂骂自己
但写到这,我不得不停下来,对自己做一个诚实的审视。
我前面说,我用 DeepSeek V4 Flash 来写文章,确实好用。但在写这篇文章之前的很长一段时间里,我从来没有认真去了解过国产模型的最新能力到了什么程度。
我也承认,如果现在让我用一个完整的国产模型去跑完一个完整的项目,从需求分析到开发到部署,我心里没底。可能是因为那句没说出来但存在心底的话,国外的应该更好吧。
所以这篇文章不只是在说别人。
我也是被这种氛围影响的一分子。
如果说那些头部博主的问题是「只吹国外的」,那我的问题可能就是「没有真正花时间去验证国产的」。这两件事,说到底是一体两面。
朋友在聊天时说了一句话,我觉得很有道理。消费者的角度更多是谁能解决我的问题。 如果你是一个纯粹的消费者,哪个好就用哪个,这完全没问题。月薪 5000 的人不需要为国产 AI 的崛起负责。
但如果你已经是一个有影响力的人,如果你的内容已经有一万、十万或者百万人在看,那你的立场就和纯粹消费者不再一样了。
你不一定非要用国产的。但你在评价国产的时候,至少应该用过、试过、认真比过。而不是拿着两年前的老印象,随口来一句「当然还是国外的更香」。
这不是道德绑架。
这是一个行业要健康发展,本来就该有的状态。

聊到这,我又想到了华罗庚那句话
「梁园虽好,非久居之乡。归去来兮。」
梁园当然好。好东西谁都喜欢。
但如果我们永远只在梁园里待着,永远觉得自己的园子种不出好东西,那可能就真的种不出来了。
而事实上,好的国产车已经种出来了,好的国产 AI 也正在长出来。
我们需要的,不过是愿意停下来看一看、试一试,然后诚实地告诉别人「这东西行不行」的那些人。
而已。