提到OpenAI发布GPT3.5时,一览科技创始人罗江春,内心流露出复杂情感。
这是铅笔道与Global AI推出的联合专栏,探讨AI应用的主流机会。Global AI正寻求早期AI项目投资,BP投递入口:https://globalai.hanghang.com/
访谈 | 铅笔道创始人 王方
整理 | 铅笔道编辑 吴欣晓
"我真的为此流过泪,不止一次。"提到OpenAI发布GPT3.5时,一览科技创始人罗江春,内心流露出复杂情感。“我们难道不努力吗?不聪明吗?我们也一样工作到凌晨两点,为什么中国没有诞生OpenAI这样的公司?。”
一个客观的现实是:国内做大模型,太烧钱了。“即便融了几十亿元,在 AI 基础设施建设中也远远不够。”
因此,作为创业公司,聚焦应用是更好的选择。
然而,关键的问题是:AI应用赛道千千万,哪些最能跑出百亿美金独角兽?罗江春的答案是:视频应该是TOP5的选择。
这也是一览科技的主攻方向。罗江春在视频行业深耕20年:2005年创办风行网,开创中国互联网高清视频产业,拥有清华机械工程和企业管理双学士学位,1997 年—2000年于美国莱斯大学就读人工智能与机器人专业。
访谈中,罗江春提出了多个AI机会赛道:
1、AI视频(To B)将成为水电煤。
视频正从娱乐载体蜕变为商业基础设施:尤其是在获客、促活和增收上,正成为企业刚需。
比如,银行需日均百条"种草视频"促活用户,电商依赖AI生成海量营销内容,传统三天制作一条视频的产能被AI提升至"日均百条级"。
2、AI视频(ToB)仍依赖人的参与,并且该局面会持续数年。
客户不在乎工具,只在乎最终结果。TOB场景下,对AI的要求更高,必须有人工干预。AI生成数百个初稿后,专业团队筛选优化(如精修图片、重写脚本),最后多轮审核交付。
3、垂直Agent是唯一机会:对抗大厂垄断的护城河。
通用AI Agent会被大厂收割,但法律、审计等垂直Agent依托专业语料库和闭环数据,有很好的创业机会。
4、AI不是移动互联网的延续,而是代际变革。
AI的影响比互联网更深远。AI的诞生更像电的发明,是一个底层基础设施级别的变化,是代际影响。
声明:访谈对象已确认文章信息真实无误,铅笔道愿为其内容做信任背书。
01 AIGC:TO B是否有未来?
铅笔道:什么时候开始关注AIGC的(AI生成内容)?
罗江春: 我们提这个概念时大模型还没流行。
2018 年我们提 RGC 概念(从 PGC、UGC 到 RGC),当时叫“机器生产内容”,和现在的 AIGC是一个意思。
记得当时在乌镇互联网大会上我就提了这个,只是那时没有大模型,做法比较原始:抽取视频素材标记,人写脚本后混剪配音,形成 RGC 雏形。
我们现在的业务是:AI+视频。我觉得,未来视频会像水电一样成为基础需求。
铅笔道:你们主要做TO B 业务(商用)?
罗江春: 对,我们其实是把“内容”这件事做了进一步的升级:从toC转向商用。
就像我当年做风行的时候,更多是在做娱乐内容。现在像抖音、快手、优酷、爱奇艺这些平台,大家刷的也还是娱乐内容。
那我们往前走了一步,我们看到的是“商用内容”或者叫“商业内容”。
为什么这么说?过去20年,内容的主要功能是提供娱乐。但是我们看到一个核心趋势是:视频越来越“工具化”,它的“使用属性”和“功能属性”开始被强化了。
就比如卖货。我们服务了很多大的电商平台,他们用视频不是为了娱乐,而是为了“种草”,激发消费者的购买需求。这就不是“娱乐”的用途了,是有非常明确的目的。
还有银行客户,他们做视频是为了提升用户活跃度,比如让信用卡用户不仅是每个月打开APP还款一次,而是通过视频延长用户使用时长,增加粘性。
所以,视频作为一个“内容载体”,它的使用场景越来越多,不再局限于娱乐,而是广泛走向商用。
这也是我们提出“让视频像水和电一样”的原因。视频服务应该成为所有企业客户的基础设施。
02 AI不是“新互联网”,而是“代际变革”
铅笔道: 您2018年提出AIGC(RGC)概念,这是个怎样特殊的年份?当时 OpenAI 成立才两三年,这对您有影响吗,还是说国内已经有了相关的发展土壤?
罗江春: 其实没有。那时我根本不知道 OpenAI,差不多到 2021 年才开始关注它的 GPT 1.0、2.0 版本。
2015 年前后,大家更关注的是 AlphaGo和DeepMind。
OpenAI 当时并不在大多数 AI 从业者的视野里,Meta(Facebook)的 Torch 和Google的TensoFlow等框架等才是我们关注的重点。
当时投资圈还在追逐 “AI 四小龙”,像云从、商汤那一波,其实跟我们当时做的视频理解也很像。
我们用 AI 打标签,也主要用图像识别、语音识别(STT)这类技术,我们能用这些技术来做视频理解,也是因为它们当时已经相对成熟了,我们不可能从头去开发所有底层技术。
铅笔道: 有人判断AI时代的下一个“字节跳动”,可能于视频领域有关。你对这个判断怎么看?
罗江春: 不一定是视频,虽然视频领域肯定很大,但未必是最大的。前五应该有可能。
铅笔道: 除了视频,你觉得还有哪几个方向?
罗江春: 核心要回归到 AI 到底改变了什么。 它改变视频内容生产方式只是一方面,可能我们现在都身处其中,像在森林里,还没跳出来看未来的全貌。
很多人想在科技史里找一个能和AI类比的技术革命,而我觉得 AI 可能像“电”。发明电之前,大家点油灯蜡烛,发明电以后更在电普及后,城市的夜晚才能灯火通明,生活的时间和空间无限拉长。
AI 的影响可能比互联网领域的类比更深远,它是一个底层基础设施级别的变化,并且是代际影响。 比如刚开始觉得它像互联网,但进入工业领域后,它更像“电”,对生活是代际的影响,不是简单延续 PC 互联网、移动互联网到 AI 互联网的逻辑。
很多人把 AI 类比成移动互联网或 PC 互联网那样的替代技术,其实这样的类比,把价值看小了。
03 国产大模型:遗憾、务实与加速追赶
铅笔道: 你在2021年就开始关注OpenAI了,其实已经很早了,毕竟大多数人是2022年才开始接触。
罗江春: 这可能也跟我的专业背景有关系。我是正经科班出身,在美国留学的时候读的就是AI和机器人(Robotics)专业。我们有一个圈子,一群人经常会讨论AI和人工智能的话题。所以OpenAI、GPT这些概念,其实很早就在我们内部流传开了。
铅笔道: 那你第一次听到OpenAI的时候印象是什么?
罗江春: 我当时的印象是,这家公司选择了一条完全不同的路线(Transformer)。
当时我们也不知道他们能否成功。他们要花几十亿美金堆 GPU,作为创业公司,这种不计成本的投入胆子太大了,而且还能找到投资。
说实话,我为这件事特别感慨。中国没有这样的土壤。要是我想拿几万张显卡堆算力,谁会给我几十亿美金?在一无所有的时候,没人敢支持你。
我真的为此哭过好几次。我们难道不努力吗?不聪明吗?没有工作到凌晨两点吗?关键就是土壤问题,中国确实缺乏这样的环境。
其实如果有资金支持,土壤成熟,中国人也能跟随并做出 OpenAI 这样的公司,当时已经隐隐有这种感觉了。
客观且从专业角度讲,我们“follow”别人是没问题的。 比如哥伦布发现美洲大陆后,第二个人再走就容易了,中国人很擅长这个。这不仅是任正非先生这么说,也是产业里的现实。
让我们去引领新技术革命,指出方向,这和基础科学、教育等很多因素相关。
比如现在的应试教育,AI 来了之后,我都不知道怎么教育孩子了:还要不要刷题?刷题有意义吗?我经常让孩子遇到不会的题就拍照问“豆包”,让他学会用工具。
我们现在的教育体系不鼓励钻研基础科学,也不鼓励质疑,缺乏批判和自我批判精神,而颠覆式创新正需要这些。
铅笔道: 您刚才提到的遗憾从何而来?现在释怀了么?
罗江春: 当然还遗憾,非常遗憾!当 GPT-3.5 真正出来并使用时,第一次用的感受和现在不同。当时感觉像在和 “God” 对话,它无所不知。尤其是 ChatGPT 推出后,这是跨时代的产品。
铅笔道: 这有没有让您对技术路线产生犹豫?比如 2021 年看到 OpenAI 时,是否决定开始准备做大模型?
罗江春:我们一直没做大模型。作为创业公司,我们缺乏土壤。即便融了几十亿元,在 AI 基础设施建设中也远远不够。
所以我们坚定聚焦应用层,不跟风底层大模型的研发。中国缺乏做大模型的广泛土壤,底层大模型最终会是 BAT 等大厂的主场。
铅笔道:2022 年 GPT 爆火后,国内资本是很动心的,你没动过心吗?
罗江春: 我和美元基金的负责人很熟,他们投资时也很犹豫。大家心态普遍是:第一怕错过机会,第二怕投错项目,第三怕投的项目没有下一轮融资。
我们其实没动过心,我们就是做应用的。
讲个小笑话,从2023年1月到7月,我一直在坚持读大模型的论文。但有一天我突然发现,我读不过来了,他们出论文的速度比我读的速度快,节奏确实太快了。这些做大模型的兄弟们,他们像是站在天上看世界。他们一天的成果,普通人可能要用一年才能实现。
铅笔道:既然已经那么坚定只做“应用层”,那还遗憾什么?
罗江春: 我遗憾的是 GPT 没出现在中国。改革开放以来,中国在 PC 互联网、移动互联网领域都有对标美国的公司,但 AI 时代来临前,我们没有一家能引领代际变革的公司,这很遗憾。
铅笔道:对于公司而言,站在巨人的肩膀上(AI底层技术),是不是也是一件开心的事。
罗江春: 我们这一代人很幸运,经历了PC互联网、移动互联网,现在又遇上了AI的崛起。它确实把我们抬到了一个新的高度。
像我们原来做RGC,有很多东西做不了,现在有了AIGC、大模型作为底座,特别是视频大模型、多模态大模型,这些事情都能做了。我们是看得很清晰的。
铅笔道: 大模型出现后,对公司的战略有什么具体影响和变化吗?
罗江春: 更加坚定地做内容,也更坚定目前的方向。整体战略方向不变(AI + 视频 + TO B),但会把 AI 渗透到各个环节中。
04 AI+视频+toB=?
铅笔道:在视频生成内容的质量提升上,哪些技术生态对您影响最大?
罗江春: 视频可拆分为三个要素:脚本、素材、剪辑加后期(含音效)。
目前有两种技术路线:一种是像 Runway 或即梦那样,输入创意直接生成视频,但效果不稳定、与预期偏差大,不过在特定场景下有改进空间;
另一种是我们推崇的。拆分环节,脚本、素材、混剪独立处理,素材不足时可生成,再用 AI 混剪。特别是脚本这个环节,我们认为必须要有人为干预。
如果完全不干预,让AI直接从一个idea生成完整视频,中间会出现很多不可控的问题,最后出来的东西跟你想要的完全不一样。
但是目前 AI 还没强大到 “一念即得”,即使是 GPT、豆包等大模型,回答问题时也是基于搜索和推理,输入与输出常存在偏差。所以本质是智能程度还不够,无法一站式生成满足用户需求的内容。
现在的AI更像 “辅助驾驶”,而非“自动驾驶”,其实还差得远。
这是为什么现在大家对Agent(智能体)这么感兴趣,就是AI来扮演一个Agent的角色,帮助你完成任务,而不是替代你来做。
铅笔道:对你们来说,AI 提升了几倍的人效?
罗江春: 我们希望是“两个数量级以上”的提升,才算真正达到预期。
比如说以前一个客户的项目,一条两三分钟的视频,质量要求比较高,那很正常是三天做一条,要好几个人一起搞。
现在我们工业化拆解完流程后,三天可以搞100条、200条都没问题。 能做到这些的前提是:我们做了很多“储备”和“质量控制”的工作。
铅笔道: 从用户角度看,用通用大模型写脚本,和用你们的自研产品,有什么技术上的差别?这属于哪种类型的技术壁垒?
罗江春: 差异非常明显。关键在于,我们的内容创作是 “命题作文”。客户有明确需求,我们为每个客户定制工作流,这是自研的,其他软件无法替代。
我们从一开始就强调“有四个有”:有场景、有数据、有用户、有产业链。
第一,“场景”是真实的客户需求;第二,“数据”,我们长期积累了大量素材和客户数据;第三,“技术”是我们的核心能力,而且这种技术能力随着客户案例和数据的积累呈螺旋式增长。它不是一下形成的,是越做门槛越高;第四,“产业链”让你的技术能有充分发挥的空间,一旦形成闭环,别人很难竞争
铅笔道: 你们是什么时候正式接入大模型技术的?
罗江春:从2022年底GPT出来开始,我们应该是国内最早一批接入的。那个时候很多人还没反应过来,我们已经上线工具了。
铅笔道:你们引入AI大模型后,客户的反馈怎么样?他们知道吗?有感知吗?
罗江春:这里有个过程。其实我们在2023年已经开始推AIGC工具,我们推出了“运营宝”,里面有AI编剧、AI绘图、各种AI工作流。最初是想赋能创作者(To C或To小B)。
后来我们很快发现一个问题:客户要的是“结果”,而不是工具。他不关心你怎么做菜,只在乎你有没有做出他想要的那道菜。我们很快转向用AI“做交付”——直接服务客户,而不是做工具。
其实现在大家流行说的RaaS(Result as a Service),我们2023年就在这么干了,比大家早了差不多两年。 AI 刚出现时,结果的可靠性存疑,在TO B场景下,对AI的要求更高,必须有人工干预。
05 TO B视频怎么赚钱?
铅笔道: 所以To B类客户,其实对AI的“智慧程度”要求更高?
罗江春:当然,所以人是必须介入的。Agent也不是完全替代人类,而是辅助人类做事。
客户更关注结果。这些客户用内容是为了达成后续目标,比如电商客户会关注转化率、消费数据;大公司(银行、手机厂商、平台)的 KPI 很严格,内容必须帮他们完成指标。
铅笔道:具体说说,你们是怎么用AI服务toB客户的?
罗江春: 我们用 AI 生产内容时,一定有人工介入,并非全流程自动化。 比如客户需要一张图片,AI 可能生成几百张,我们会安排专业人员从中挑选并精修,用擦除、重绘等工具优化,经过多轮审核后才交付。
AI提升效率的核心在于处理重复性工作。 比如过去用 PS 做一张图需要半天甚至更久,现在 AI 生成几百张,人只需半小时筛选,再局部优化,效率能大幅提升。
就像写文档时,会先用 “豆包” 生成初稿,再自己审核修改。AI 的价值在于辅助人做筛选、评判,而非替代人。所以人与大模型交互时,人的专业水平越高,结果越好。
铅笔道:TO B 的 AI 视频交付中,AI 最适合做哪些工作?
罗江春: AI 擅长补人类的短板,比如处理重复性、标准化的工作。以前剪辑需要训练三个月工具操作,现在 AI 能简化流程,让编导直接判断内容是否可行,无需依赖剪辑师。
AI 就像 “辅助驾驶”,帮人提升效率,而非替代人做创意决策。这和机器人行业的逻辑类似,让机器做人类不愿做、不擅长或不能做的事。我们把AI定位为辅助者。
铅笔道:你认为这种模式是短期现象还是长期趋势?
罗江春:AI的进化速度不是匀速的。
我听过一位头部券商的分析师的观点。AI 目前之所以爆发,是因为“吃完”了互联网上积累的大量数据,当新增高质量数据有限时,其进化速度会放缓。这个观点很有道理。
从生物和哲学角度看,当前 AI 的能耗模式一定是低效的。 人脑每天消耗约 400 大卡能量,而一个数据中心的 GPU 能耗远超于此。
未来芯片技术可能优化算力效率,但短期内很难颠覆现有模式。
所以,在未来三到五年内,不太可能出现“念头一动就生成理想视频”的颠覆性技术。 TO B 的 AI 视频交付模式至少能稳定 3-5 年。
铅笔道:TO B 视频主要用于市场营销吗?
罗江春:不止。客户既会用于公域获客,也更看重私域流量(如 APP 内的内容运营)。比如信用卡客户每天可能需要 100 条种草视频,关联商城或理财产品,这比传统 TVC 的需求量大得多。
铅笔道:按市场规模看,哪些行业需求更大?
罗江春:我们专注服务大客户,因为内容是非标品,服务大小客户的售前成本相近,做大客户更高效。
但国内市场存在 “内卷” 问题:大客户常要求降价或增加服务内容,利润空间被压缩,而欧美客户更注重契约精神,付款流程规范。核心围绕 “拉新、促活、留存、增收” 四个目标。
我们更倾向服务互联网大平台客户,因为他们的内容需求量大且持续,而硬科技行业(如半导体)对视频内容的需求较少。
铅笔道:有没有可能未来服务中小企业?比如做一家平台型公司。
罗江春:我们其实一开始是服务中小客户的,后来才聚焦到大平台和重要客户。
在 2018-2019 年服务中小客户时,他们对内容的需求并非刚需,拓展起来很困难。而且服务中小客户和大客户的获客成本差不多。
在国内 TOB 领域,想找到低成本获客的方法服务小 B 客户很难。我们尝试过很多方法,最后发现还是得靠销售。
长期来看,这种情况可能更“糟糕”。很多中小客户对内容的需求,可能会逐步转向抖音、快手、视频号这些平台。内容会更偏向于平台运营。
06 未来的百亿美金机会
铅笔道:在 AI 领域,TO B 和 TO C 的生态是隔离的,还是相互交融的?
罗江春:我觉得是分不开的。底层技术是一样的。
比如我们公司来看,产能非常重要。如果未来某个时间点我们一天能生产 100 万条图文、100 万条视频,那时我们想做C端会很容易。所以生态是融合的。
铅笔道:这个行业的竞争格局如何?是不是很混乱?
罗江春:挺混乱的。不只是客户在卷,供应商之间也很卷。行业里进进出出的人很多。有些角色刚进来,觉得这个领域不错,但实际操作后发现比想象中困难,就退出了。
我们遇到过很多竞争对手,名字都没听说过,也有很多大公司参与。玩家很多,但没有出现占据绝对份额的玩家。
铅笔道:AI 视频这个赛道,除了你们公司,还有哪些细分方向值得关注?有没有可能出现百亿美金级别的公司?
罗江春:我认为工具类产品一定有机会,尤其是工具加大模型的模式。但这种机会很容易被大厂吃掉。因为这种模式本质上依赖场景、数据、技术、资金和用户,而大厂基本什么都有。
比如抖音的剪映,为什么能成功?因为每天有无数用户在用,内容不断生成,语料库可以不断扩展。其他大模型想 PK 根本竞争不了,进化速度跟不上。
所以如果工具加上大模型底座,确实有机会成为百亿美金的公司,但很可能红利属于大厂。
铅笔道:创业者通过深耕垂直产品(比如非主流应用),机会也很小?
罗江春:这种路径周期太长了。其实大厂不是看不上,而是产品经理可能暂时没想到。一旦他们意识到,很容易将功能集成到超级 APP 里。
铅笔道:除了工具,智能体(Agent)领域您怎么看?现在很多人做数字员工,TOB 和 TOC 哪个更有机会?
罗江春:对创业公司来说,TOB 的智能体更容易切入和生存,但能否做大是个问题。通用型 Agent 大概率会被大厂垄断。
但垂直领域的 Agent 有机会,比如法律、审计等专业场景,像律师顾问、审计工具,只要有专业语料和数据库支撑,就能收费。
可是这类业务难在规模化,获客和竞争都是问题。TO C的 agent我觉得是和“内容”相关的。可能是游戏、互动、陪伴这些方向,但一定和内容挂钩。
铅笔道:您看好人形机器人吗?为什么一定要做成 “人形”?
罗江春:我只看好人形机器人。因为物理世界的设施大多为人设计,比如工厂拧螺丝的工位,人形机器人最容易适配,这是取代人类工作的关键。
联系创业者
进入个人中心-联络人,即可查看请求结果
您还未认证身份,暂时无法和ta联系!请尽快前往个人中心进行创投认证哦。