但斌火线回应：DeepSeek爆火后三大投资疑问（组图）

1个月前来源：华尔街见闻原文链接评论0条

2月12日上午盘中，但斌执掌的私募机构东方港湾公开发文：

此前，围绕这位百亿私募大佬的最新季报组合，以及他长期看好的英伟达与“DeepSeek冲击波”，讨论十分激烈。

作为过去两年私募主动投资的“冠军”，但斌一直看好并重仓包括英伟达在内的部分海外科技股。

但斌对英伟达的高仓位押注，还叠加了杠杆工具，可谓对芯片龙头股保持相当高的预期。

如今，他从技术角度，回应了DeepSeek“火爆全网”后引发的三大投资“疑问”

1）中国团队在算力卡脖子的情况下，仍能研发出全球领先的AI大模型，是否说明了今后AI的进步不需要算力？

2） Deepseek团队通过修改PTX指令集，优化了GPU的使用，是不是意味着绕过CUDA的壁垒，今后使用国产芯片可以畅行无阻了。

3）中国模型的降本与平权，会带来什么投资机会与风险？

但斌火线回应：DeepSeek爆火后三大投资疑问（组图） - 1 全球算力需求还会增加

但斌在文章中指出：Deepseek的成果会增加全球AI算力的需求，而非减弱。

他认为市场最大的误解是，从根本上把算法、算力和数据三者进行对立，误认为算法的创新进步，是对算力和数据形成了“替代和竞争”。

“而实际上，算法、数据和算力三者之间，是一种‘协同关系’。”

假设过去算法低效时，单位芯片在一个用例上只能服务10个用户；现在算法提效了，同一芯片可以服务100人。该芯片如果不提价，其价值量肯定是翻了10倍，而不是变得更低。如果一个商品的价值量提升了10倍，而价格不变，那么需求一定是上升的，这是经济学常识。

但斌火线回应：DeepSeek爆火后三大投资疑问（组图） - 2 AI应用普及将加快

但斌进一步指出：成熟AI模型的“降本与平权”已是过去2年大趋势。2025开年Deepseek作为“追赶者”送出的大礼包也在这一趋势内，这是走向“应用普及”的必经之路。

而成熟模型的降本与前沿模型的探索是两码事，想争做AI时代模型的领头人，所需算力和资源都不是小数，这也是除了Openai以外许多巨头的野心。

世界上任何一种技术的发展，基本遵循着“创新－跟随－降本”的发展模式。前沿的“探索者”会花重金和时间进行实验探索，最终找到一个有效果的技术方案，并将其商品化；

紧接着，社会会出现一大批“跟随者”，沿着探索者的思路去复现其产品，并在工程上进一步降本优化。这种成本优化的思路又会回到探索者那里进行整合和降本，双方相互学习，相得益彰。

在所熟知的领域里，包括了创新药与仿制药，特斯拉与中国电动车，还有大模型领域，皆是如此。

但斌火线回应：DeepSeek爆火后三大投资疑问（组图） - 3 杰文斯悖论

但斌还提及，随着AI成本的大幅下降，AI应用普及带来的推理需求才是算力的主场。

我们在年度思考中对比过o1模型的推理成本，在每百万token55美金的输出价格下，Agent应用使用推理模型几乎是寸步难行。而短短不到一个月，推理模型成本被追赶者的工程优化降低了100倍，我们预期的Agent应用生态，在以极快的速度向我们走来。

Deepseek带火了一个概念——杰文斯悖论，指的是当资源使用效率提高后，资源的消耗总量不会下降，反而会增加的经济现象。该理论最早于19世纪应用于煤炭的消耗问题。当瓦特改进蒸汽机，提高了煤炭利用率后（单位动力耗煤量大幅下降了75%），烧煤蒸汽机被更广泛地应用到工厂、铁路和船舶上，反而加速了煤炭消耗总量，也提升了煤炭价格。同样的情况，也发生在当汽车燃油效率提升（每公里耗油更少了），带来的行驶里程和总油耗的大幅增长，以及LED灯节能导致更长开灯时间和更多地方安装灯光，总体耗电量不降反升的情况。

当一项技术未被大面积采用之前，其单位资源消耗量的下降，反而会促进整体资源消耗总量的上升。同样的情况，也会在AI模型的应用身上发生，因为AI时代才刚刚开幕。

但斌火线回应：DeepSeek爆火后三大投资疑问（组图） - 4 CUDA的壁垒不会被削弱

另外，但斌还很有信心的认为，CUDA（英伟达所推出的一种软硬件集成技术）的壁垒在未来不会被削弱。

他举了一个例子：AMD（一家美股芯片公司）正在通过HIP转换器，将CUDA代码迁移，仍然存在性能损失和适配成本。这类似于在苹果电脑上运行Windows系统——虽然技术上可行，但性能、兼容性和体验通常比原生环境差。除此之外，几乎没有更好的替代方案。

他还提及了一个细节，内地团队为了优化英伟达芯片的使用效率，不满足于CUDA的高级语言编辑，直接在底层编辑PTX指令集，对H800芯片中的流处理器进行通讯任务分配的修改，从而一定程度提高了全互联的通讯效率和稳定性。很多人看到这里，会认为相关团队没有使用CUDA软件，而是用PTX汇编语言对GPU进行功能修改，因此团队具备能力绕过CUDA，使用汇编语言在其他厂商的芯片上去复现模型的训练，这是很大的误解。

相关团队之所以能够使用PTX（全称为：并行计算任务线程的执行）进行任务执行的优化，也是英伟达架构的“可编辑性”所允许的。英伟达经常会吸收开发人员编辑PTX的创新工程方法，反过来优化官方的CUDA算子，这也是CUDA生态的反哺优势。

他自己很乐观的认为：CUDA并未被绕开，壁垒反而被增强。

但斌火线回应：DeepSeek爆火后三大投资疑问（组图） - 5 AI应用会涌现各种投资机会

但斌进一步提出观点：随着技术发展，全球的AI应用会涌现各种投资机会，而大模型企业的商业模式会继续饱受挑战。

DeepSeek以一己之力，短短一个月为全国人民做了一次“AI科普”，并在模型能力和推理成本上追平甚至超越了大多数美国模型。

其更重要的贡献在于发现了一种高效的方法，即利用经过强化学习训练并具备推理能力的大模型进行蒸馏，从而生成包含“思维链”的样本数据，并对小模型进行直接的监督微调。

但斌还指出一个细节：在大模型领域，即没有网络效应也没有专利保护，希望成为领头羊的模型企业，只有持续保持前沿模型领先，才能维持巨大的用户数量和定价优势，以弥补前期高额的探索成本。这种难度现在也变得越来越大了。

关键词：私募机构英伟达 DeepSeek 算力 AI 模型

转载声明：本文为转载发布，仅代表原作者或原平台态度，不代表我方观点。今日澳洲仅提供信息发布平台，文章或有适当删改。对转载有异议和删稿要求的原著方，可联络content@sydneytoday.com。