现金九游体育app平台就需要事前把举座任务拆分红多个经过法子的任务-九游体育(中国)官方网站登录入口 IOS/安卓通用版/手机app下载

发布日期：2026-04-23 14:13 点击次数：63

界面新闻记者 | 李彪

界面新闻裁剪 | 文姝琪

　　抓续五天的“DeepSeek开源周”刚铁心，DeepSeek团队就在国内知乎平台注册官方账户，并在3月1日今日发布了第一条动态。这篇最新的帖子初度对外公布模了型的优化时刻细节、本钱利润率等要津信息。

　　这篇帖子最诱惑眼球的一个论断是，按DeepSeek测算，假设GPU租借本钱为2好意思元/小时，总本钱为8.7万好意思元/天。淌若统计包括网页、App和API在内的通盘负载，将通盘模子tokens全部按照DeepSeek-R1的订价（DeepSeek R1 的订价：$0.14 / 百万输入 tokens (缓存射中)，$0.55 / 百万输入 tokens (缓存未射中)，$2.19 / 百万输出 tokens）贪图，表面上一天的总收入为5.62万好意思元，算下来本钱利润率为545%。

　　高达545%的利润率意味着什么，又会给行业带来了何如的影响？界面新闻采访了复旦大学贪图机科学时刻学院西宾张奇，他的商榷标的为当然讲话处理、信息检索、数据密集型贪图。

　　在当然讲话处理中，Token是讲话文本被分割后的基本单元，每个用户向AI发问并得回申诉，问题及谜底的文本长度对应数目不等的Token。AI处理每个Token齐需要滥用算力。此外，还存在射中缓存与否的情况，射中缓存指用户向AI发问触及的关统共据已存在于缓存之中，模子可径直调用，无需从头贪图或从数据库检索，节俭了算力、期间及存储资源，本钱更低，若没能射中，则需要滥用更多算力等资源，本钱更高。

　　当前，按Token计价收费是AI公司的主要交易模式。射中缓存相对价钱较低，未射中则收费更高。

　　张奇告诉记者，对行业来说，DeepSeek在最新的著述中提到的56.3%缓存射中率（原文称，在 24 小时统计时段内，DeepSeek V3 和 R1齐能完了输入 token 总额为 608B，其中 342B tokens（56.3%）射中 KVCache 硬盘缓存）是一项具有遑急意象数据。

　　“固然各家莫得公布过关统共据，但跳跃一半的射中率在业内应该已是很高的水平。”张奇合计，像在DeepSeek所开荒的6710亿参数超大模子上，几亿用户发问时所写的文本多若干少存在各异，在这种前提下能够完了高中率，阐发团队在模子举座优化上作念了许多职责。

　　据DeepSeek团队先容，V3、R1推理系统的优化方针便是追求“更大的费解，更低的延长。”

　　基于DeepSeek接管的搀杂大家模子中枢架构（MOE），超大模子由宽绰领域较小的大家模子构成，并承担不同的单干。平常用东说念主类天下的团队协作来阐发其中所需要的休养职责，淌若一个团队要将各个领域的大家围聚到全部来攻克某项任务，就需要事前把举座任务拆分红多个经过法子的任务，再按照分拨给不同领域的大家，让他们每个东说念主齐发达专科手段惩处问题，终末汇总论断。

　　DeepSeek在文中写说念，由于DeepSeek-V3 / R1的大家数目宽绰，而况按照当先的瞎想章程，每层256个大家在本色运行中仅激活其中8个。要完了团队的“大费解，低延长”的优化方针，就需要作念到短期间处理多数任务时“高效调用”每个大家，也便是DeepSeek在文中提到的“大领域跨节点大家并行（Expert Parallelism / EP）”。

　　“这是一项难度极大的均衡职责，淌若模子优化分拨上作念不好，就会使得一个6000多亿参数的超大模子，每次可能只好8个或几个大家在本色运行，而且淌若某一个莫得运行完，剩下的通盘大家可能在恭候。恭候则频繁又意味着贪图资源的虚耗。”张奇合计，在DeepSeek开源前，搀杂大家模子的均衡瞎想对许多AI模子大厂齐是尚未攻克的勤恳。

　　此外，据DeepSeek先容，另外，由于白日用户走访量大、就业负荷高，晚上的就业负荷低，团队罢领路一套机制，在白日负荷高的时候，应用通盘模子节点部署推理就业。晚上负荷低的时候，减少推理节点，以用来作念商榷和历练。

图源：DeepSeek知乎官方账号

　　把柄DeepSeek统计，按照这套“白日推理——晚上历练”的决议谋划，在最近的24小时内，将DeepSeek V3和R1推理就业占用节点加到全部，任务吃力的岑岭期最多占用278个节点，平均占用226.75个节点（每个节点为8个英伟达H800 GPU）。

　　张奇合计，探讨到DeepSeek还有新模子阵势过火他职责需要GPU，上述1800-2000张H800GPU（平均占用节点数乘以8个GPU），大略率仍是用上了DeepSeek现阶段为DeepSeek V3与R1模子所能调用的“全部算力资源”。

　　此前按照行业不雅点，DeepSeek的改革冲破在于，在有限资源的环境下，将后果栽种到了极致，从而罢领路模子的低本钱开荒。在上述一系列优化后果的基础之上，才有了545%的本钱利润率。

图源：DeepSeek知乎官方账号

　　但DeepSeek也强调，545%仅仅一个表面值，本色运行时没“有这样多收入”。因为 V3 的订价更低，同期收费就业只占一部分，另外夜间还另有扣头。

　　此前，DeepSeek在同类模子厂商中就以“AI拼多多”的廉价标签备受心理。

　　客岁推出V2模子时，DeepSeek就曾在4月初度将API调用价钱降至输入1元/百万tokens、输出2元/百万tokens，激励了豆包、Kimi、文心一言等厂商的跟进，带动了第一波模子价钱战。最新的V3模子就业订价仅为OpenAI同类模子4o的1/15，R1模子的价钱也远低于同业。

　　这次公布出的高利润率也让外界看清了DeepSeek降价的“底牌”。

　　在此之前，业内一度热议“DeepSeek模子API订价过低是否会带来雄伟损失”，DeepSeek前商榷员罗福莉客岁5月在个东说念主知乎上否定了这极少。据她显现，当前以DeepSeek当前的订价，大领域服提供就业，不亏本，利润率超50%。DeepSeek独创东说念主梁文峰也在接管36氪媒体专访时提到，公司的订价计谋是“原则上不亏本销售，也不追求过高利润。当前的订价仅在本钱之上保留了一定的利润空间。”

　　当前，业内秘书接入部署“满血版”DeepSeek R1模子的厂商大多以单机（8张GPU的就业器）、双机这一类小领域建造为主。据记者了解，“四机当前是业内磨真金不怕火公司时刻智商的一说念分水岭”。而跟着就业器台数越多，领域化部署休养和优化难度越大，DeepSeek团队所完了的300多台就业器部署工程对团队时刻智商条目更是急剧高涨。

　　脚下，固然545%的本钱利润率是DeepSeek基于大领域部署测算的一个表面值，本色的利润水平官方并未公布，但依然让行业运行看到了“赢利的但愿”。

　　张奇合计，DeepSeek在公布利润率的同期也将模子优化次第开源，行业会愈加积极学习这套优化次第部署DeepSeek。固然对绝大多数公司来说，“知说念”和“作念到”是两件事，将不异优化次第落到本色会遭逢多样新问题，但通盘行业会在这方面进行更多尝试。

　　（界面新闻记者伍洋宇对此文亦有孝顺）

海量资讯、精确解读，尽在新浪财经APP

牵累裁剪：韦子蓉现金九游体育app平台

栏目分类

热点资讯

现金九游体育app平台就需要事前把举座任务拆分红多个经过法子的任务-九游体育(中国)官方网站 登录入口 IOS/安卓通用版/手机app下载

现金九游体育app平台就需要事前把举座任务拆分红多个经过法子的任务-九游体育(中国)官方网站登录入口 IOS/安卓通用版/手机app下载