Ai滚动快讯
根据动态大数据,智能机器人自动撰写的实时快讯播报。秒级初稿,紧跟最新消息。
财中社 2025-07-02 10:51 2925阅读
华泰证券发表研究报告称:推理算力需求增长或快于算力单位成本下降。总算力支出受到算力需求与成本的共同影响。随AI应用用户数量的不断增长及Agent的渗透不断提升,推理端算力需求不断上升;同时,由于硬件的迭代与infra算法的不断改进,模型推理的单位成本不断下降,模型推理价格目前已下降到2023年初的1/100以下,目前市场对未来推理端算力支出节奏存在分歧。本报告旨在提供一个推理算力需求从用户渗透到Token调用、再到硬件支出的分析框架,我们通过对Google与微软(OpenAI)未来Token调用量、算力总需求和未来硬件支出节奏的测算,得出结论:推理算力需求增长速度快于单位算力成本的降低。我们持续看好推理端算力需求的加速增长。
海内外大厂Token调用量增长迅速,推理算力需求快速增长
海外CSP厂商来看,根据2025年5月Google I/O大会数据,Google的Token月均调用量从2024年4月的9.7万亿增长至2025年4月的480万亿,增长50倍。根据微软FY2025年第三季度电话会数据,Azure AI基础设施在2025年一季度处理了超100万亿Token,较去年同期增长5倍,其中3月份单月Token调用量达50万亿。国内互联网大厂来看,2025年5月字节火山引擎Token日均调用量为16.4万亿(月均508T),是2024年5月的137倍。认为,海内外大厂Token调用量已出现明显加速拐点,推理端算力需求快速增长。
考虑到单位算力成本下降后,Google算力支出仍有望高增
AI搜索的渗透是Google Token调用量增长的主要驱动,通过对AIOverview、AIMode、Gemini 2C应用和其他推理需求的测算,我们预测Google 25年第二季度Token总量有望达到2009万亿,环比增长223%,相较于2024年第二季度的71万亿Token增长接近30倍。单位算力成本=单位价格/算力,受软件算法优化与新版本芯片的部署影响,单位算力成本呈现下降趋势,根据我们测算,4、5、6月单位算力成本分别环比下降14%/13%/13%,下降幅度小于4、5、6月算力需求提升的环比增速56%/38%/32%。根据我们测算结果,Google 2025年二季度推理算力开支仍有望环比增长100%以上。
用户使用量与DeepResearch的渗透有望驱动微软算力需求高增
微软Token调用量的提升主要源于OpenAIChatGPT网页的访问量上升及Deep Research功能的渗透。考虑到以上两因素的影响,在我们的预测框架下,微软2025年第二季度的总Token调用量有望达到205万亿,环比增长约100%。算力成本角度,算法优化带来模型浮点运算利用率的提升,即同样数量的芯片能带来更多的有效算力。根据我们测算,考虑到算法优化带来的算力成本下降后,微软年底的推理算力卡需求量仍约为3月的两倍有余,我们预测微软的算力硬件需求仍将维持高速增长。
来源:财中社