谷歌的TurboQuant算法会削弱人工智能对存储芯片的需求吗? - FT中文网
登录×
电子邮件/用户名
密码
记住我
请输入邮箱和密码进行绑定操作:
请输入手机号码,通过短信验证(目前仅支持中国大陆地区的手机号):
请您阅读我们的用户注册协议隐私权保护政策,点击下方按钮即视为您接受。
为了第一时间为您呈现此信息,中文内容为AI翻译,仅供参考。
FT商学院

谷歌的TurboQuant算法会削弱人工智能对存储芯片的需求吗?

专家称,更高效的人工智能可能意味着对半导体的需求更大。
00:00

{"text":[[{"start":8.96,"text":"三星电子(Samsung Electronics)第一季度强劲的业绩表现,缓解了投资者对谷歌(Google)新算法可能威胁韩国存储芯片行业AI驱动繁荣的担忧。"}],[{"start":18.61,"text":"三星援引内存芯片市场“前所未有的超级周期”,本周预计单季利润将高于去年全年,且没有迹象表明内存正变得不再是人工智能公司的瓶颈。"}],[{"start":30.47,"text":"这份业绩指引推动三星股价逼近历史高位,并缓解了因TurboQuant引发并持续两周的焦虑。这项技术在3月下旬由谷歌研究院(Google Research)的博文中提出,宣称可大幅减少人工智能所需的内存。"}],[{"start":45.58,"text":"这则帖子引发了一场关于高带宽内存未来需求的激烈且持续的争论。这类用于驱动AI服务器的先进芯片由三星及其韩国竞争对手SK海力士(SK Hynix)生产。"}],[{"start":58.36,"text":"一些投资者认为这波存储热潮终将破灭;也有人觉得TurboQuant影响甚微;而乐观派则认为,即便该技术确实降低了人工智能的成本,也只会催生对更多人工智能的需求,从而带动对更多芯片的需求。"}],[{"start":73.69,"text":"首尔成均馆大学(Sungkyunkwan University)教授权锡俊(Kwon Seok-joon)表示,TurboQuant“有望将运行大型语言模型的成本削减到原来的四分之一至八分之一”。“乍一看,这似乎会威胁对高带宽存储芯片的需求。”"}],[{"start":87.5,"text":"不过,权锡俊补充道,“推理成本大幅下降,会解锁此前因成本过高而无法运行的工作负载”,例如实时编码助手以及同时运行的多个智能体,“从而推动总体算力需求上升,而非下降”。"}],[{"start":102.2,"text":"TurboQuant的工作原理是压缩所谓的“键值缓存”——这是一种让ChatGPT、Claude等人工智能模型保留对话上下文的短期记忆——并在需要时将其重建,而准确率几乎不受影响。"}],[{"start":115.43,"text":"随着人工智能交互变得更长、用户数量上升,对KV缓存的需求激增,对AI服务可使用的内存造成更大压力。"}],[{"start":124.29,"text":"TurboQuant提供了一个出路,降低“每个token的成本”,也就是AI系统处理每个数据单元所需的计算与内存开销。谷歌研究院的研究人员称,该方法最多可将内存使用量降低至原来的六分之一。"}],[{"start":139.36,"text":"上月,该博文导致三星和SK海力士的股价大幅下跌。但分析师和研究人员如今表示,如果TurboQuant确实奏效,它更可能扩大整体内存需求而非减少——这正是“杰文斯悖论”的一例,即更高效率反而会提升某种资源的总体使用量。"}],[{"start":null,"text":"

折线图:三星股价(韩元)。注:在TurboQuant冲击后,三星股价反弹
"}],[{"start":157.46,"text":"经济学家威廉•斯坦利•杰文斯(William Stanley Jevons)在其1865年的著作《煤炭问题》中指出,詹姆斯•瓦特(James Watt)更高效的蒸汽机反而导致了煤炭使用量的增加,因为它使得以煤为动力的技术在更多情境下具有经济可行性。"}],[{"start":171.92000000000002,"text":"TurboQuant所依据的相关研究者之一Han In-su对英国《金融时报》表示,该算法“可以为实现此前被认为不可能的高难度任务奠定基础,例如在有限内存资源下处理更长的上下文而不牺牲准确性,或在更小型的设备上部署高性能的人工智能”。"}],[{"start":189.91000000000003,"text":"未来资产证券(Mirae Asset Securities)的Kim Young-gun在一份研究报告中提到,由谷歌设计的“容器化”技术Kubernetes让人产生了“似曾相识”的感觉。这项技术使得在一台服务器上运行多个应用成为可能,大幅提升了硬件效率。"}],[{"start":206.10000000000002,"text":"在2010年代后期被广泛采用之初,人们担心服务器和内存的需求会下降,因为各家公司为获得同样结果所需的资源更少。实际情况却相反:成本下降反而促使使用量大幅增长。"}],[{"start":221.59000000000003,"text":"研究机构SemiAnalysis的Ray Wang表示:“市场在很大程度上误判了TurboQuant。随着AI模型演进与创新推进,我们依然认为训练和推理都将需要更高的内存需求。”"}],[{"start":235.10000000000002,"text":"Ray Wang表示,人工智能服务提供商为锁定供应而日益采用长期合约,这将缓冲韩国芯片制造商可能遭受的任何冲击。"}],[{"start":244.81000000000003,"text":"他说:“在加速且可持续的人工智能需求推动下,存储器的周期性在减弱。现在,合约价比现货价更重要。”"}],[{"start":254.46000000000004,"text":"在上月举行的三星电子年度会议上,联席首席执行官全英贤(Jun Young-hyun)表示,公司正与主要客户签订“三年或五年的合同”,从以往的季度和年度条款转变而来。"}],[{"start":266.37000000000006,"text":"目前,TurboQuant仍只是博文中的一个概念。其现实影响有望在4月下旬于巴西举行的国际表征学习会议上发布之后更加明朗,届时预计谷歌之外的人也将能够进行测试。其最终成败取决于各大科技集团能否在大规模场景中加以应用。"}],[{"start":285.7900000000001,"text":"“我们从未想过,一项源于‘如何更完美地压缩数据’这一学术问题的技术,会引发如此巨大的社会与经济涟漪效应。”Han In-su说道。"}]],"url":"https://audio.ftcn.net.cn/album/a_1775978910_3515.mp3"}

版权声明:本文版权归FT中文网所有,未经允许任何单位或个人不得转载,复制或以任何其他方式使用本文全部或部分,侵权必究。

苹果下一任掌门人特努斯面临决定性的AI时刻

库克的继任者必须带领这家iPhone制造商渡过产业转型。

乌克兰无人机飞行员在500公里外打击俄罗斯目标

基于互联网的新型引导系统使乌克兰无人机操作员能够在远离战场的区域执行任务。

Netflix哈斯廷斯:良好领导力与糟糕治理的双面标杆

这家流媒体公司的联合创始人退居幕后,而亲手缔造的"帝国"正面临迄今为止最大的挑战。

石油交易商Gunvor:油价将面临更多动荡

全球第四大独立原油贸易商称,4月至6月期间石油市场的波动性将会加剧。

寿险与年金行业正转向更高风险资产

许多已经进入保险公司资产负债表的工具,存在复杂性和流动性不足的问题。
1天前

地缘政治冲击凸显云服务商多元化的必要性

一些欧洲银行业担心自己过度依赖少数几家美国超大规模云服务商。
设置字号×
最小
较小
默认
较大
最大
分享×