不说谎的创新经济媒体,致力于发现创新公司,服务创新公司,旗下产品覆盖150万+新经济用户,单周全网分发量可达1500万,已完成真格基金、软银中国、险峰、BAI等顶级机构的5轮融资。
分享

Token死贵?一帮90后清华博士,1年融资3轮:砍掉50%成本

最近,AI行业有个声音很热:Token太贵,烧不起了——某些平台,价格飙升463%。

口述 | 清程极智 师天麾

访谈丨铅笔道 松格

编辑 | 铅笔道 王方

最近,AI行业有个声音很热:Token太贵,烧不起了——某些平台,价格飙升463%。

也就在这个时候,中国版“OpenRouter”出现了,恰好能帮大家省算力的钱。

OpenRouter,干啥的?它是家美国公司,成立两年,估值35亿元。它的业务,有点像“大模型调度器”,你提任务需求,它匹配最合适的模型帮你干活。

然而这个赛道,最近在国内也快速生根发芽。

清程极智,由一群90后清华博士创立,最近完成新一轮融资,清华大学资产管理公司入股。过去1年,该公司连续融资三轮。

它的业务,比OpenRouter更进一步,做“智能路由器”,帮用户匹配最优模型,从而降低算力消耗。

清程极智业务简介

清程极智业务简介

针对这个赛道的机会,铅笔道与清程极智联合创始人师天麾聊了聊,精华如下:

1、这个赛道,属于产业链哪个环节?

答:AI基础设施。

2、这个机会,要解决什么痛点?

答:AI Token太烧钱了,服务质量也不稳定。

3、这个行业,什么时候被重视的?

答:DeepSeek发布后。

4、行业传统方案有多贵?

答:有个客户,部署DeepSeek满血版,要花四五百万。

5、新方案能降低多少成本?

答:效果不打折,降低20%-50%。

6、“智能路由器”,这个机会共识了吗?

答:没共识,大家才开始尝试。

读完这篇文章,你会收获一个认知:帮大家降低算力成本,这个赛道这么值钱。

- 01 -

AI基础设施,为什么是机会?

铅笔道:想听听您的创业故事。

师天麾:我们是在2023年开始认真讨论,要不要创业。

当时有一个很明显的变化:AI已经从“能不能做出来”,变成了“做出来之后怎么用”。

大模型训练的效果越来越好,大家都看到了应用落地的希望,于是各种大模型公司一下子都冒出来了。但问题也很快暴露——太烧钱了。

一是算力不够,中国能用的高端显卡本来就有限;


二是即便有卡,训练一次模型的成本也高得惊人,动辄就是几千万甚至上亿。

这些年我们其实一直在研究一件事:怎么让AI Token更便宜。通过编译优化、训练和推理优化,让同样的显卡,能干更多活,花更少钱。

所以当大模型开始澎湃发展的时候,我们觉得是时候可以发挥所长了,所以开始创业。

铅笔道:哪件事情,是您创业的临门一脚?

师天麾:读博时我发了几篇论文,挺顺的。但经常困惑:这些研究到底有什么用?名字出现在会议上、Google Scholar上引用数+1,然后呢?转折点出现在博三博四。

我和蚂蚁合作,把论文成果用在金融风控上——判断速度大幅提升,风险交易识别更准,还在中关村拿了奖。

那一刻真切感受到:技术真的能干实事。

后来在大厂实习过多段,感受很深:分工太细,自主性低,"安排什么干什么",没意思,也不自由。

原本计划毕业先去大厂——华为"天才少年"Offer也拿到了,想先攒经验、拿title,过几年再创业。但机会提前来了:信任的老师和师兄能够一起创业。既然早晚要创业,不如早点开始。

铅笔道:怎么最通俗地形容你们在做的事?

师天麾:我们做的事,就是给市场提供"多、快、好、省"的Token。

如果把AI产业比作手机,芯片是硬件,我们是操作系统,豆包、DeepSeek这些模型是上面的App。

我们做的,就是让AI的"操作系统"不卡、好用、省钱。

铅笔道:创业到现在,方向有没有大的变化?

师天麾:我们做的事一直没变,变化的是订单方向。

2024年训练需求火,厂商拿着钱找上门,我们就主攻训练优化;2025年DeepSeek带火开源模型,推理需求爆发,我们便转向推理优化。

恰好我们在超算、大规模集群上有十几年积累,而行业正需要大规模推理能力,业务切换水到渠成。

- 02 -

DeepSeek对行业的影响

铅笔道:AI很火,但为什么落地难?

师天麾:AI落地难,主要有三个坎。

第一,效果不够真。 以前AI生成的视频、图片一眼假,"AI感"太重,没法工业化用。现在可灵这类工具出来了,画面自然多了,才真正具备大规模落地的基础。

第二,缺行业数据。 基座模型不懂行,落地得做微调。但微调不是简单的事——得先理解业务、清洗数据、反复调试,周期客观存在,急不来。

第三,缺复合人才。 懂业务的不懂AI,懂AI的不懂业务。我们跟企业合作时,经常得先培训他们的人,两边才能对上话。这种人才断层,沟通和落地成本都很高。

铅笔道:AI基础设施,是什么时候开始真正被行业重视的?

师天麾:DeepSeek开源后,行业认知彻底变了。

2024年我们融资,还得跟投资人解释什么是AI Infra。

2025年,DeepSeek"开源周"时(2025.2.24-2.28),几乎一天发一个项目,全是AI基础设施相关的,让行业看到:原来软件优化就能把性能提上去、成本降下来。

投资人立马懂了,主动找上门说要投"AI Infra最强的公司",我们再不用科普了。

铅笔道:那DeepSeek火了之后,你当时怎么判断这个趋势的?

师天麾:春节期间,我们就被拉着天天开会。

DeepSeek火了,三类客户找上门:国产显卡公司要适配,云厂商和运营商要卖货,国企客户要部署——领导催得急,但预算没做,临时改不了。

痛点很快暴露:按原方案,部署DeepSeek满血版要四五百万,客户只想"试试",一听价格懵了。

我们顺势推出软件优化方案,让不支持低精度算力的国产显卡,通过软件实现类似能力。四台服务器变一两台,成本直降到20%-50%,效果还不打折。

方案一出就火了,精准击中"低成本体验满血版"的需求。

铅笔道:有没有比较典型的客户案例,以及带来了什么效果?

师天麾:金融和石油能源行业我们落地了不少案例。

这些国央企客户有个共同痛点:没人预判到DeepSeek会火,没留预算,但领导要求快速部署落地,临时改预算又麻烦。

我们的方案正好合适——把成本压进原有预算,还能体验满血版性能。

比如中石油的智能采购平台,纯信创场景,底层算力到上层昆仑大模型都要国产,我们优化推理引擎后,实测算力成本降低40%,省下来的资源还能干别的。

后来这个项目还拿了一个行业奖项。

铅笔道:DeepSeek这一波把AI带火之后,企业对AI基础设施的需求,发生了哪些变化?

师天麾:2025年行业有两个明显变化。

一是模型适配需求激增。 开源模型迭代快,国产显卡型号多,用户买了硬件最担心"新模型出来能不能跑"。我们重点在华为、沐曦、海光等主流国产显卡上,第一时间适配最新模型,解决兼容焦虑。

二是大规模推理和MaaS爆发。 DeepSeek让大家看到,新技术能把成本降很多。MaaS模式(模型即服务)成了云厂商新利润点——以前卖卡价格透明,现在看服务质量定价,技术强就能多赚钱。

但云厂商有卡、有人手,但缺AI Infra人才,我们有技术不做运营,两边互补。现在合作多家云厂商,尤其是中小厂商,希望转型Token业务但缺乏Infra能力,需求格外强烈。

- 03 -

最新机会:智能路由器

铅笔道:现在AI创业公司很多,哪些方向更有机会跑出来?

师天麾:我们看好深入行业的AI应用和底层的AI技术创新。

原因很简单:模型迭代太快。你现在精心设计的工作流,可能三个月后被新模型、新框架直接颠覆,前期投入全白费。如果没有行业壁垒或技术壁垒,很容易被替代。

更有机会的是扎进行业里——有行业数据、懂业务流程、解决真实痛点。这类场景可替代性低,壁垒高,活得久。

铅笔道:你们会不会担心,未来芯片厂商或者大模型厂商也抢你们的饭碗?

师天麾:这个质疑从成立第一天就有,但市场确实需要中间层。

第一,生态太分散。国内芯片厂商十几家,每家生态封闭,互不兼容。没有一家能覆盖所有模型,如果硬要做通用适配,成本极高、得不偿失。客户需要一套"通用连接器",这就是我们存在的价值。

第二,客户要"好用"而不是"研究底层"。 国央企必然混用多家芯片,但不同芯片软件栈不统一,换一家就得换一套软件,版本功能还不一样,管理起来头疼。客户只想用,不想研究底层怎么弄。

第三,我们能做定制化优化。 芯片厂商做的是通用优化,跑起来就行;但我们能针对不同场景、不同规模——4台、16台、128台机器跑DeepSeek,瓶颈各不一样——做深度优化。尤其是大规模场景,我们的性能优势非常明显。

铅笔道:国产芯片本身来看,目前有哪些短板,反而给你们带来了机会?

师天麾:我认为国产芯片有三个弱势,这反而是我们的机会。

第一,软件生态弱。兼容性参差不齐,用户买之前必问"能不能跑这个模型"。我们用一套软件打通不同显卡,把使用门槛降下来,让国产芯片真正"好用"。

第二,性价比不够。 目前国产卡价格还是相对较贵,我们通过推理引擎优化,提升硬件利用率,把整体性价比拉上去。

第三,新特性缺失。很多国产卡不支持FP8、FP4,硬件换代成本极高。我们用软件实现类似能力,让用户提前用上这些特性,花小钱办大事。

铅笔道:从AI Infra这个行业来看,你觉得今年有那些机会有风险,但值得去突破?

师天麾:我们今年顺应市场需求推出AI Ping的"智能路由"能力,这个有点像是个模型服务的智能路由器,它能帮用户省掉两个麻烦。

一是“模型路由器”,帮你解决"选模型"的麻烦。

简单问题用便宜的小模型,复杂问题才用贵的大模型。我们实测过,把主流大模型搭配着用,效果比单用一个好,成本还能降5-10倍。

二是“云服务路由器”,帮你解决"选云服务"的麻烦。

市面上几十家云服务商,性能时好时坏。我们实时监控,自动帮你挑当前最快、最便宜的。你说"要用DeepSeek",我们自动选最好的那家,你不用管背后是阿里还是火山。

最终目标:你只管提需求,我们自动匹配模型和平台,你直接拿结果。就像打车软件自动派单,你不用自己挑司机。

铅笔道:“智能路由”这个方向,目前在行业里已经共识了吗?

师天麾:智能路由还是个新方向。

模型路由——业内某个大厂两三个月前放了个Demo,情感陪伴、游戏NPC这类对话场景也在试点。难点在于模型厂商从商业考量来说,更愿意推荐自家的模型。我们接了600多个模型服务,作为中立平台更有优势。

服务路由——目前来看企业用户接受度非常高,通常情况下,用了服务路由吞吐提升近一倍,成本降一半,模型输出质量还不变,很受企业欢迎。

所以我们的核心壁垒就在这:我们既不做模型,也不做算力运营,纯中立聚合,才能做好这个"智能调度"的事。

铅笔道:这个方向,你们怎么判断出来的?

师天麾:我们判断这个方向,基于两点。

用户需求本质——用户要的是解决问题,不是选模型、选服务商。给问题,直接给答案,省去选型麻烦,这是必然趋势。

技术时机成熟——小模型能力现在足够强,能解决大部分简单问题;大模型又贵又缺。大小搭配,降本增效,水到渠成。

最大挑战是信任。用户习惯了"一个模型用到底",担心模型路由换来换去,效果不稳定。这需要时间培养心智,不过只要客户用起来看到效果,信任会快速建立。

铅笔道:从商业角度来看,你觉得这是一门好生意吗?

师天麾:我觉得是门好生意。

第一,用户愿意买单。 有人为稳定性付费,有人为性价比付费,需求真实存在。

第三,规模效应。单个用户去谈没折扣,我们聚了几百家一起采购,能拿到很好的价格,就像团购,开发者的价格自然会降下来。

第四,解决真痛点。现在模型和服务商太多,各类榜单很多,用户选择困难,我们帮大家减少了决策成本。

我们做的评测和路由,能帮用户做出更靠谱的决策,这事本身很有价值。

铅笔道:2025年来看,您的收入大概是什么结构?

师天麾:2025年的收入主要有几部分:比如大模型私有化部署,还有帮芯片厂商做一些优化项目。另外AI Ping(智能路由平台)这块,也已经开始形成收入了。

铅笔道:今年你们重点想打造的核心能力是什么?

师天麾:今年我们 AI Ping 小团队的核心目标,把“智能路由”做好,往技术、生态和商业三个方向延伸。

先说技术价值。它解决的是一个很现实的问题:大模型 API 不稳定。我们做了一套监测系统。实时看每个模型的延迟、吞吐、稳定性和成本。服务质量变成可量化、可预测。

有了这些数据,系统会自动分配请求。根据任务类型,选最合适的模型和节点。既保证效果,也尽量省钱。如果某个节点出问题,系统会在秒级切换,不影响业务。

再说生态价值。智能路由让 AI Ping 成为一个“中枢”。连接开发者和模型厂商。

对开发者来说,一个入口就够了,不用对接多个平台,少做重复工作,效率更高;对模型厂商来说,流量分配更公平,中小厂商也有机会被用到,只要性价比好,就能获得曝光;对行业来说,算力可以更高效地流转。

竞争回到两件事:性能和成本,AI更容易落地。

路由越智能,接入的开发者和厂商越多,生态就越繁荣。生态越繁荣,数据和场景越多。又会反过来提升路由能力。

第三是规模壁垒。智能路由会带来“越做越强”的效果。

用户越多,数据就越多。数据越多,路由就越精准。体验更好,成本更低。体验好了,又会吸引更多用户。

大量数据还能推动算法持续优化。调度更高效、更稳定。结果是,我们一直领先,竞品的空间会被不断压缩。

最终,我们的目标是:让智能路由不只是一个功能,而是一道壁垒。

它由规模和数据共同形成:用户增加,数据增加;数据增加,能力提升。形成循环,也更难被替代。

本文不构成任何投资建议。

您可能感兴趣的文章
发表评论

所有评论

联系创业者

close

创业者需要验证您的身份,请输入您的请求信息:

0/200

进入个人中心-联络人,即可查看请求结果

取消
确定

提示信息

close

您还未认证身份,暂时无法和ta联系!请尽快前往个人中心进行创投认证哦。

去认证咯
还是算了
联系方式
电话
拨打电话
邮箱
复制到剪切板
微信
复制到剪切板

查看所有联系人

下载铅笔道APP
下载铅笔道APP
下载铅笔道APP
下载铅笔道APP
关闭二维码