最好看的新闻,最实用的信息
02月20日 14.0°C-15.5°C
澳元 : 人民币=4.62
墨尔本
今日澳洲app下载
登录 注册

但斌火线回应:DeepSeek爆火后三大投资疑问(组图)

6天前 来源: 华尔街见闻 原文链接 评论0条

2月12日上午盘中,但斌执掌的私募机构东方港湾公开发文:

此前,围绕这位百亿私募大佬的最新季报组合,以及他长期看好的英伟达与“DeepSeek冲击波”,讨论十分激烈。

作为过去两年私募主动投资的“冠军”,但斌一直看好并重仓包括英伟达在内的部分海外科技股。

但斌对英伟达的高仓位押注,还叠加了杠杆工具,可谓对芯片龙头股保持相当高的预期。

如今,他从技术角度,回应了DeepSeek“火爆全网”后引发的三大投资“疑问”

1) 中国团队在算力卡脖子的情况下,仍能研发出全球领先的AI大模型,是否说明了今后AI的进步不需要算力?

2) Deepseek团队通过修改PTX指令集,优化了GPU的使用,是不是意味着绕过CUDA的壁垒,今后使用国产芯片可以畅行无阻了。

3) 中国模型的降本与平权,会带来什么投资机会与风险?

但斌火线回应:DeepSeek爆火后三大投资疑问(组图) - 1 全球算力需求还会增加

但斌在文章中指出:Deepseek的成果会增加全球AI算力的需求,而非减弱。

他认为市场最大的误解是,从根本上把算法、算力和数据三者进行对立,误认为算法的创新进步,是对算力和数据形成了“替代和竞争”。

“而实际上,算法、数据和算力三者之间,是一种‘协同关系’。”

假设过去算法低效时,单位芯片在一个用例上只能服务10个用户;现在算法提效了,同一芯片可以服务100人。该芯片如果不提价,其价值量肯定是翻了10倍,而不是变得更低。如果一个商品的价值量提升了10倍,而价格不变,那么需求一定是上升的,这是经济学常识。

但斌火线回应:DeepSeek爆火后三大投资疑问(组图) - 2AI应用普及将加快

但斌进一步指出:成熟AI模型的“降本与平权”已是过去2年大趋势。2025开年Deepseek作为“追赶者”送出的大礼包也在这一趋势内,这是走向“应用普及”的必经之路。

而成熟模型的降本与前沿模型的探索是两码事,想争做AI时代模型的领头人,所需算力和资源都不是小数,这也是除了Openai以外许多巨头的野心。

世界上任何一种技术的发展,基本遵循着“创新-跟随-降本”的发展模式。前沿的“探索者”会花重金和时间进行实验探索,最终找到一个有效果的技术方案,并将其商品化;

紧接着,社会会出现一大批“跟随者”,沿着探索者的思路去复现其产品,并在工程上进一步降本优化。这种成本优化的思路又会回到探索者那里进行整合和降本,双方相互学习,相得益彰。

在所熟知的领域里,包括了创新药与仿制药,特斯拉与中国电动车,还有大模型领域,皆是如此。

但斌火线回应:DeepSeek爆火后三大投资疑问(组图) - 3 杰文斯悖论

但斌还提及,随着AI成本的大幅下降,AI应用普及带来的推理需求才是算力的主场。

我们在年度思考中对比过o1模型的推理成本,在每百万token55美金的输出价格下,Agent应用使用推理模型几乎是寸步难行。而短短不到一个月,推理模型成本被追赶者的工程优化降低了100倍,我们预期的Agent应用生态,在以极快的速度向我们走来。

Deepseek带火了一个概念——杰文斯悖论,指的是当资源使用效率提高后,资源的消耗总量不会下降,反而会增加的经济现象。该理论最早于19世纪应用于煤炭的消耗问题。当瓦特改进蒸汽机,提高了煤炭利用率后(单位动力耗煤量大幅下降了75%),烧煤蒸汽机被更广泛地应用到工厂、铁路和船舶上,反而加速了煤炭消耗总量,也提升了煤炭价格。同样的情况,也发生在当汽车燃油效率提升(每公里耗油更少了),带来的行驶里程和总油耗的大幅增长,以及LED灯节能导致更长开灯时间和更多地方安装灯光,总体耗电量不降反升的情况。

当一项技术未被大面积采用之前,其单位资源消耗量的下降,反而会促进整体资源消耗总量的上升。同样的情况,也会在AI模型的应用身上发生,因为AI时代才刚刚开幕。

但斌火线回应:DeepSeek爆火后三大投资疑问(组图) - 4CUDA的壁垒不会被削弱

另外,但斌还很有信心的认为,CUDA(英伟达所推出的一种软硬件集成技术)的壁垒在未来不会被削弱。

他举了一个例子:AMD(一家美股芯片公司)正在通过HIP转换器,将CUDA代码迁移,仍然存在性能损失和适配成本。这类似于在苹果电脑上运行Windows系统——虽然技术上可行,但性能、兼容性和体验通常比原生环境差。除此之外,几乎没有更好的替代方案。

他还提及了一个细节,内地团队为了优化英伟达芯片的使用效率,不满足于CUDA的高级语言编辑,直接在底层编辑PTX指令集,对H800芯片中的流处理器进行通讯任务分配的修改,从而一定程度提高了全互联的通讯效率和稳定性。很多人看到这里,会认为相关团队没有使用CUDA软件,而是用PTX汇编语言对GPU进行功能修改,因此团队具备能力绕过CUDA,使用汇编语言在其他厂商的芯片上去复现模型的训练,这是很大的误解。

相关团队之所以能够使用PTX(全称为:并行计算任务线程的执行)进行任务执行的优化,也是英伟达架构的“可编辑性”所允许的。英伟达经常会吸收开发人员编辑PTX的创新工程方法,反过来优化官方的CUDA算子,这也是CUDA生态的反哺优势。

他自己很乐观的认为:CUDA并未被绕开,壁垒反而被增强。

但斌火线回应:DeepSeek爆火后三大投资疑问(组图) - 5AI应用会涌现各种投资机会

但斌进一步提出观点:随着技术发展,全球的AI应用会涌现各种投资机会,而大模型企业的商业模式会继续饱受挑战。

DeepSeek以一己之力,短短一个月为全国人民做了一次“AI科普”,并在模型能力和推理成本上追平甚至超越了大多数美国模型。

其更重要的贡献在于发现了一种高效的方法,即利用经过强化学习训练并具备推理能力的大模型进行蒸馏,从而生成包含“思维链”的样本数据,并对小模型进行直接的监督微调。

但斌还指出一个细节:在大模型领域,即没有网络效应也没有专利保护,希望成为领头羊的模型企业,只有持续保持前沿模型领先,才能维持巨大的用户数量和定价优势,以弥补前期高额的探索成本。这种难度现在也变得越来越大了。

今日评论 网友评论仅供其表达个人看法,并不表明网站立场。
最新评论(0)
暂无评论


Copyright Media Today Group Pty Ltd.隐私条款联系我们商务合作加入我们网站地图

法律顾问:AHL法律 – 澳洲最大华人律师行新闻爆料:news@sydneytoday.com

电话: (03)9448 8479

联系邮箱: info@meltoday.com

友情链接: 华人找房 到家 今日支付Umall今日优选