当前页面：首页 > 快讯 > 正文 >

大模型创业 300 天：成者 100 亿估值，80% 败者出局

来源：虎嗅APP 时间： 2023-08-03 13:55:29

作者：杨晓鹤，头图来自：视觉中国

2023 年，知名投资机构老虎基金募资不成的消息，悄然传遍了整个互联网。

(相关资料图)

在习惯了风口创业的过去 10 年中，" 投资人寒冬 " 似乎还是第一次出现。这与新消费、直播带货、元宇宙几个风口悄然落幕，并购和中概股等退出渠道的大门半遮半掩，种种不利因素都息息相关，创投市场似乎要真正冷清下来。

创业公司融资艰难，大佬的二次创业也不好找方向。从美团退休的王慧文，研究了好一阵的 Web3 和元宇宙。被腾讯收购公司后离开的王小川，试水了 AI 医疗。但一切转变在 2022 年末，ChatGPT 3.5 发布，迅速让市场形成共识，AGI（通用人工智能）时代来了，全行业开始跑步入局大模型。

据了解，当时在低调创业的王小川，已经成立了公司做智能硬件。意图帮助有睡眠障碍的上亿人，打造一款治疗打鼾的智能枕头。当 3 月份大模型热潮兴起后，王小川用了 2 周时间做了决定，放下这个创业项目，布局大模型。

王小川找来原搜狗 CTO 杨洪涛帮忙接管医疗项目，原搜狗 COO 茹立云在这家公司的股份，也兑给了杨洪涛，追随王小川的大模型创业。王小川共拿出 5000 万美元成立 " 百川智能 "，并邀请了 Soul 的技术人才来做算法负责人，加速去做大模型。而王慧文的故事，大家就十分熟悉了，酒桌上发布英雄招募贴，成立光年之外公司做大模型。

在互联网大厂中，大模型也带来了翻天覆地的影响。有大模型的项目负责人，年前因为升职不成的问题，从而提出离职。年后 3 个月时间后，该集团 CEO 就成为大模型的总负责人，举公司之力 All in 大模型。

没有人想错过这波 AGI 时代的浪潮，大家都相信 AI 在经过三起三落的发展后，通用人工智能的奇点正在来临。毕竟在 AI 热潮下，类似 ChatGPT 和 Midjourney 等几十人规模的公司，创造 40 亿美金左右的估值，美股 " 七巨头 " 总市值一年飙至 11 万亿美元，大涨 60%。这些激动人心的爆发式增长的故事，再一次搅动了国内科技商业市场。

国内互联网大厂中，李彦宏、张勇、张一鸣、王兴等大佬都已经亲自挂帅，可以说除了拼多多，已经全部入局大模型。正如 7 月 19 日，微软和英伟达的市值增加了 1750 亿美元，马斯克在评价相关推文时惊叹：" 疯狂的时代。"

即将沉寂的科技商业市场，突然迎来了 AI 这一兴奋剂，也让互联网进入了最后一次的狂欢。

一、低谷中燃起的新曙光

李明是一家创业公司的 CEO，团队规模在 100 多人。2023 年是他最为融资发愁的一年。

最开始创业的过程十分顺利，早期拿到知名天使投资机构的天使和 A 轮融资。" 那时候工业互联网还是个热门赛道，也不像很多 AI 项目那么浮夸。" 李明告诉 AI 鲸选社，但 2023 年中，他在启动的新一轮融资中，慢慢发现了行情不对。

投资机构不仅看数据和故事，还要看营收了。此前执着产品化的李明，根本还没意识到，投资风向的变化。用梅花创投创始合伙人吴世春的话讲，就是现在投资项目 " 既要（技术），又要（数据），还要（营收）"。没办法，他开始找 FA 机构帮助融资，而且融资轮次也退步，求个 A++。

"FA 帮找了 30 多家投资机构，都不了了之了。" 融资的不顺利，让李明有些泄气。但在 6 月份，他感受到大模型的威力，于是内部上马了基于 ChatGPT 的产业化业务。" 现在也还没融到资，不过投资人会主动找来交流，对方明显感兴趣了。"

而对于袁进辉的一流科技来说，大模型也是个救命稻草。2022 年，这家做 AI 深度学习框架的公司，已经到了融资不顺，不得不裁员生存的地步。此前公司 3 次濒临资金链断裂，都是找天使投资人，也是当时快手 CEO 的宿华借钱。

" 做的事情和百度的飞桨、华为昇思差不多，最重要的是那时候市场大模型训练的业务还没起来。" 一流科技员工告诉 AI 鲸选社，公司属于有钱的时候（2021 年）没业务，有业务的时候（2023 年）没钱了。

就在袁进辉感觉前途无望的时候，2023 年公司迎来了收购的机会。2023 年 4 月份，在清华科技园的一流科技公司内，迎来了一位贵宾，他就是刚刚宣布进军大模型的美团联合创始人王慧文。

最终的收购价格还可以，一位被裁员的一流科技的员工告诉我们，" 能与上一轮高瓴资本投资的估值相当，自己的期权也有着落了。"

而成为光年之外联合创始人的袁进辉，终于再也不用为融资发愁。王慧文的融资能力，在当下创投圈无出其右。根据后来的美团收购协议显示，光年之外在没有大模型产品的情况下，就融资了 20 亿元。

当然，这波行动中更早布局的投资人，已经成功狩猎到独角兽。

Minimax 是在 2021 年 11 月成立，在 2022 年 1 月获得天使轮投资，2023 年初公司估值就达到独角兽级别。最早 4 家投资机构中，还有上海游戏公司米哈游，据悉是因为两家创始高管中有家人关系。而据鲸选社了解，智谱最近也在以 100 亿人民币的估值融资。

这两家公司的成立时间都不到 2 年，却都已经成为独角兽，大模型赛道的发展速度惊人。

而 AGI 热潮，对于那些老牌 AI 公司也是一次救赎。此前，出门问问的 IoT 上市故事，已经历经几次无功而返。伴随着大模型 " 序列猴子 " 和 4 款 AIGC 产品的故事推出，尽管其大模型还小心翼翼不对外公开测评，但也让出门问问终于有了新故事可讲，目前已经提交港股上市申请。

更多的大模型和 AIGC 创业者走在了路上，甚至在一家创业营里，60% 的项目都和 AI 相关，拥有轻资产、高壁垒、天花板高的优点，AGI 彻底成为当下最火的赛道。

二、将 AGI 的梦想做到最巅峰

如果说 2023 年是大模型创业 " 元年 "。那么互联网大厂最早入局大模型的 " 源年 "，则可以追溯到 2019 年。

阿里是 2019 年 9 月开始布局大模型，2021 年 4 月发布 PLUG 大模型。而早在 ChatGPT 3.0 面世之前，国内就已经有多家万亿参数的大模型，他们分别是达摩院的 M6 和华为云的盘古大模型，以及智源的悟道 2.0。和 ChatGPT 相比，尽管模型参数超越了，但数据丰度不一样，效果还没法比较，在达摩院的张聪看来，国内大模型起大早赶晚集，最重要的是没做两件事。

第一件事是没做对齐。那时候阿里有很多大小模型，主要没有做训练结果对齐。" 你看现在 ChatGPT 能做诗会聊天，很像人的智力，实际上就是与人的价值观对齐。" 张聪讲道，这些都需要对推理结果进行人为调整，而不是用机器的逻辑去做。

第二没有去做高质量的数据集，ChatGPT 早期利用菲律宾的大学教授进行数据标注，国内是利用中专生做标注，语料的问题也十分影响结果。在张聪看来，7 月 19 日公布的 Llama 2 的精调 Chat 模型，就是在 100 万人类标记数据上训练的，训练 token 总数增加了 40%，相比 Llama 的提升是全方位的。" 所以大模型并不是大力出奇迹的发明，而是精心设计的工程创造 "。

并且反观国内 AI 产业，也会面临很多其他因素干扰。当时，达摩院主要有两个团队做大模型，一个是金榕领导的机器智能团队，司罗负责的是 AliciMind；一个是周靖人领导的自然语言实验室，其中杨红霞负责的是大模型 M6。

在 2022 年末的测评中，M6 大模型的成果稍具优势，二者最终整合成现在的通义大模型。" 实际上，达摩院大模型团队只有二三十人，主要它的预训练，都放在阿里云。" 张聪告诉 AI 鲸选社，不过现在通义是集团的重要项目，涉及到的人员有 600 多人，现在很多资源都倾斜给大模型，集团 CEO 每 2 周过问一次技术进展。

而对于百度来说，这波 AGI 热潮，可是自己从 2016 年就预言来临的 AI 时代，自然也不会错过。

今年 2 月 7 号在内部正式立项，3 月 16 号正式发布。这期间直接上升到百度集团优先级最高的项目，李彦宏亲自督战，CTO 王海峰博士直接挂帅，那时候百度阳泉超算中心就专门为大模型训练。

百度算法工程师赵辉告诉 AI 鲸选社，百度自然语言处理部一直就在研究 NLP 等技术，首席科学家吴华也一直是领导，这个部门就有几百人。百度的 ERNIE2.0 后转成文心大模型，" 以前就在做百度大脑，现在都说是大模型文心么。"

做的事情有相似，当然也有区别。赵辉提到，以前百度会做很多垂直搜索的 Rank，就是为了根据人为的点击，重新排序搜索的结果。大模型出现后，这些能力都会被沉淀在大模型的算法中，也有利于给出的回答更精准。

对于百度来说，大模型推动下一代搜索质变，已经写进了李彦宏的 OKR。不过，对于生态来说，百度的文心大模型是基于 bert 模式，" 包括智源的 GLM 都是独立的技术路线，和国际的 GPT 并不一样。" 一位百度云的人员告诉 AI 鲸选社，这点其实倒也不用担心，文心千帆什么类型的模型都有，GPT2、3、4 也非常不同。

而说回从阿里离职的杨红霞，她在去往海外后，也被字节跳动挖去做北美大模型的研发负责人。张一鸣一直在研究大模型会开源还是闭源，所以也没要求集中力量赶工。" 年底前会有真正意义上的突破。" 杨红霞对 AI 鲸选社说道。

综合来看，字节跳动应该是继百度之后，在业务上与大模型更匹配的公司。有猎头告诉我们，虽然大模型不着急，但在 AIGC 领域还是挺激进。比如 TikTok 在做广告创意业务 AIGC，总监职务给出预算 100~150W，要求是 88 后带队。

至此，互联网大厂除了拼多多，已经全部入局大模型。大厂入局的热情，甚至比当年的 O2O 和直播还有过之而无不及。

三、分水岭突然出现的那一夜

6 月份，在北京搜狐大厦，光年之外这家融资最多的大模型企业，正热火朝天地创业。

原一流科技的 Oneflow 深度学习框架还寻思继续做，但被大模型业务抽调了很多人。可就在 6 月 23 日，突然有人在社交媒体上透露王慧文病了，当时公司还有人去求证，得到的是没有这回事的消息。可是在 25 日晚，美团突然宣布联合创始人王慧文因为抑郁症住院，辞去公司董事一事，其创业的光年之外公司面临出手的新闻。

一时间，光年之外做不下去，王慧文提前跑路的新闻，成为一些人的猜测。AI 鲸选社从投资人圈得到的消息，是王慧文的病情确实很严重。最后王慧文睡在上铺的兄弟，美团创始人王兴帮助接盘了光年之外。

大模型真的不行了吗？大家萌生出此疑问。那期间，正好知名投资人朱啸虎和猎豹创始人傅盛也在朋友圈争论，大模型行业是否有泡沫。朱啸虎极度看衰市场一拥而上，做通用大模型的现状，认为绝大多数都会在年底死掉。

光年之外的主动变动，也是否印证了朱啸虎的言论？

从 AI 鲸选社获得信息看，收购了光年之外的美团，目前并没有停止大模型的脚步。不仅独家投资了智谱 AI 数亿元，当下还在招聘大模型的项目总监，给出的年薪高达 300 万元，甚至还在美国成立技术研究院。赚辛苦钱的美团，也并不想在这波科技大潮中落后，尤其在饿了么明确要接入通义大模型，有业务竞争的携程，也已经推出了大模型之后。

但对于国内市场来说，通用大模型确实已经太多。据不完全统计，短短不到 8 个月时间，已经有超过 85 家大模型发布，其中很多成了上市公司的套现概念。

Wind 数据显示，2023 年 24 家 "AIGC 概念股 " 已经合计发生 67 笔减持，大股东的离婚潮也令人惊叹。2023 年初至今，近十家 AI 板块公司大股东家庭被曝离婚。备受关注的是，A 股 AI 企业昆仑万维，最近就发生占股 11% 的李琼女士（创始人周亚辉的前妻），计划减持 3% 的股份（大概 13 亿元），然后有息借给公司。据了解内情的人向 AI 鲸选社介绍，感受到了 AGI 红利的昆仑万维，不仅做了大模型，最近还在密集组建团队，全力以赴做对标微软的 Copilot。

上市公司利用 AGI 抓紧炒概念，套现离场。大模型创业公司则在内卷到死。

一位在近期成立了 AIGC 基金的投资人张阳告诉我们，伴随着开源免费且强大的 Llama 2 袭来之际，下半年很多大模型企业势必会面临融资难的问题。

如今一切已经有端倪，在 7 月 11 日，百川智能推出了百亿级别参数的大模型 Baichuan-13B，不仅宣布开源，同样还是免费可商用。虽然 Baichuan-13B 的参数规模不大，但是基于精准的中文语料训练，在百亿规模参数的大模型中，百川经常排名头部。

Baichuan-13B 的免费策略，大大冲击了国内大模型付费行情。目前，智源 AI 就在 14 日宣布，企业登记获得授权，允许免费商业使用 ChatGLM-6B 和 ChatGLM2-6B。

越来越多的大模型开源免费后，大模型的死亡淘汰赛正式开启。一位基于大模型创业公司的 CTO 对 AI 鲸选社表示，智源的大模型从最开始的私域部署要 2000 万元，到年初的调用价格为 180 万到 30 万选包，再到现在的免费，行业变化非常之快。傅盛认为这是市场从大模型参数之争，进入生态规模之争。

互联网大厂并不愁生态建设，由于内部模型非常多，也有免费和付费之分，最主要的大模型目前还是闭源和付费形态。创业公司要建立生态就比较困难，很多初创企业做大模型已花光了力气，做生态就难免力有不逮。据了解目前 MiniMax 是创业公司中，为数不多坚持公有云，做 MaaS 模式的大模型企业。

丁香园 CTO 范凯形容这波开源免费潮，就像把自来水厂（大模型）免费接到用户家里，让每家人手一个水龙头，那些闭源的自来水厂，最好你的水无敌好喝，大家才愿意付费去你那。

四、AGI 发展进入分岔路口

分水岭出现后，当下创业竞争已经发展了三派。

一派是坚持全自研大模型，都是实力选手。这一派主要是百度、阿里、字节等互联网大厂以及智谱、MiniMAX、衔远等创业企业。但这些实力选手也被划分成两类企业。

第一类是坚持做自研的通用大模型，对标 ChatGPT，不断追赶 ChatGPT 的迭代速度。

在云启资本董事合伙人陈昱看来，通用大模型是必经之路，垂直大模型发展受限。" 因为对于通用大模型而言，垂直领域并不需要重新训练，通用大模型可以通过向量数据库做行业深化，垂直大模型却很难智能涌现。"

从目前看，有梦想的肯定还要做通用大模型，毕竟做成了可以成为下一个互联网大厂。ChatGPT 在协同办公、电商、代码生成、辅助设计等领域已经展现出了这种颠覆性潜质。

第二类是认清现实聚焦落地，坚持做垂直大模型，这一派包括最后达成观点统一的朱啸虎和傅盛，二者都认为垂直大模型将更有产业适用性。

通用大模型一般是在千亿参数以上，而垂直大模型则在百亿或者 70 亿规模左右。达观数据的大模型产品曹植，参数就都在 500 亿规模之间。

据达观数据的 CEO 陈运文告诉 AI 鲸选社，" 曹植 " 大模型采用混合训练数据方案，分别是 50% 的通用混合语料 +50% 垂直专业语料。" 我们在金融、政务等领域做文本智能很多年，很多数据是独有的，客户也要求我们做私有化训练。" 陈运文告诉 AI 鲸选社，" 以前四五个人用一个星期做一份报告，现在 AI 半天做好了。"

放弃成为下一个 ChatGPT 的梦想，才能在商业场景中尽早落地，这是很多垂直大模型的清醒认知。

在行业看来，通往 AGI 圣殿的第二条路线，是基于别人的模型（如 GPT），然后结合自己的行业 Know-how 去做训练。" 对于第二类能不能成功，我觉得需要时间去验证，现在还不明确。原因在于大家还不知道如何把行业 Know-how 去和大模型做融合的有效路径，如何在有护城河的同时又有可持续的商业模式，这仍是个未知数。"

" 尤其很多大模型，本身就有套壳的嫌疑，" 投资人张阳告诉 AI 鲸选社，结合行业做商业化的时候，就会面临很多问题。据悉两个知名同姓创业者的大模型，是基于 Faceboook 的开源 Llama；某游戏和防护公司用的是智源大模型的基础框架。

更强的开源大模型正在来袭，Meta 近期发布免费可商用版本 Llama 2，傅盛对此就在朋友圈表示：" 这一下不知道多少公司笑醒在深夜，多少公司哭晕在厕所… ." 朱啸虎对此也评论道：很多人要笑醒了吧，大家都可以 Take free ride（搭便车）了。

傅盛的 " 笑醒 " 所指，和朱啸虎略有不同。傅盛笑醒指的是使用开源大模型开发 AIGC 应用的企业，也能做出更好的产品，朱啸虎笑醒是指那些号称自研实则套壳的大模型企业，最近也要宣布升级了。大家所指的哭晕内容相同，都是那些号称自研的大模型企业，国外大模型最强之一 Llama 2 宣布开源免费，大家都基于相同的开源大模型，怎么在行业中做出特色能力？

AGI 的第三条路线是纯粹做应用，是将模型拿来直接使用，这种的壁垒会较低。朱啸虎也不看好这类模式，认为如果 90% 的能力是 ChatGPT 提供，那么 AIGC 应用就没有什么投资价值。

在 OpenAI 的生态中，山姆 · 奥特曼承诺尽量避免做应用层，和生态开发者竞争，因此效仿 Google 做了 ChatGPT Plugin，从目前看，国内还没有谁做出这种承诺。

文心一言和通义千问，已经有了上百个功能更新，这些功能也覆盖了一些开发者的工作。虽然文心一言也有插件，但目前就两个，一个是百度搜索，另一个是 ChatFile（长文档的分析处理能力）。百度千帆和阿里魔搭的生态发展如何协调，还是个有挑战的命题工作。

坚定看好 AGI 的朱啸虎，认为通用大模型的创业和投资窗口期已过，不绝对依赖某家大模型能力的 AIGC，才是 AGI 时代低垂的果实。比如，近期朋友圈突然蹿火的 " 妙鸭相机 "，算是国内 AIGC 第一个爆火的产品，国外也曾火过类似的产品 "lensa"，月收入曾达到 800 万美元。

时代的浪潮袭来之际，投资人吴世春就曾打趣问道朱啸虎：" 投 AI 赚的钱把投 SaaS 亏的钱，弥补回来了吗？" 朱啸虎回答，还没，但是 AI 的前景无限。

目前，创投圈也都认可朱啸虎表达的道理，但很多人并不期待朱啸虎说出实话，诸如 "ChatGPT 对创业公司很不友好，未来两三年内请大家放弃融资幻想 " 这些带有寒意的话。

" 大模型就是互联网的房地产，就算有泡沫也是美丽的泡沫，"一位刚下场做 AI 职业教育培训的创业者说道，雷军曾在 2013 年互联网红利消失之际疾呼，要相信互联网的力量，今天我们也要相信 AGI，无论它有没有泡沫。

注：本文中李明、张聪、赵辉等为化名。

关键词：

大全能源：2021年净利润同比增长448.56%

3月15日，中来股份发布公告称，公司与太原市人民政府、古交市人民政府签署了《战略合作与投资协议》，公司拟在山西省古交市投资年产20万吨

22-03-18
求是网评论员：弘扬塞罕坝精神，建设美丽中国

　　在中国河北省最北部、内蒙古高原浑善达克沙地南缘，横亘着一片浩瀚的万顷林海——塞罕坝机械林场。这里茂盛生长着世界上面积最大的一片

21-08-30
未严格落实定期核酸检测要求北京多家医疗机构被通报批评

　　中新网8月28日电据健康北京微信公众号消息，北京中康时代康复医院、北京四惠中医医院等多家医疗机构，存在工作人员未严格落实定期进

21-08-30
坚守榆林窟：临退休话往昔，“一无所有”到“世外桃源”

　　中新网兰州8月28日电 (记者殷春永冯志军)“刚开始说待三年，但三年之后又三年……”14年前受上级“委派”，在大漠戈壁深处的峡谷

21-08-30
贵州出台办法规定农村住宅楼层不超三层

　　中新网贵阳8月28日电 (周燕玲)为加强农村宅基地管理，规范农村村民住宅建设，贵州省政府近日印发《贵州省农村村民住宅建设管理办法(试

21-08-30
新疆“月亮姐姐”扎根上海十余年专做新疆农产品的“搬

　　中新网上海8月28日电 (张践)阿依古丽来自新疆阿勒泰地区，2009年来到上海创业。十余年来，阿依古丽身边的小伙伴们都亲切地称呼她为“

21-08-30
河南郑州全市中小学9月15日以前不开学

　　记者从今天(8月28日)下午召开的郑州市新冠肺炎疫情防控新闻发布会上了解到，根据教育部“三条硬性标准”、“两个暂缓要求”，结合郑州

21-08-30
河南周口加快灾后重建受灾群众8月上旬已基本回迁完毕

　　新华社郑州8月28日电(记者翟濯)记者从河南省政府新闻办28日举办的“河南省加快灾后重建”周口专场新闻发布会上获悉，本次洪涝灾害共造

21-08-30
西部陆海新通道重点项目陆续开工中国西部将更便捷对

　　中新网防城港8月28日电(陈思华罗婕李尚珍)8月28日上午，广西防城港火车站增加4条到发线工程正式开工。该工程系广西“十四五”规划

21-08-30
河南第一产粮大市近800万亩未受灾秋粮长势喜人

　　河南第一产粮大市近800万亩未受灾秋粮长势喜人有望以丰补歉　　中新网郑州8月28日电 (记者李贵刚)记者28日从“河南省加快灾后重建

21-08-30
河南郑州市餐厅、影剧院、旅游景点等场所将有序恢复营业

　　今天(8月28日)下午，河南省郑州市召开疫情防控新闻发布会，介绍疫情防控最新情况。　　记者从发布会上获悉，郑州市居民小区继续落实查

21-08-30
北京一“号贩子”开展非法挂号获刑2年

　　新华社北京8月28日电(记者赵旭、吴文诩)记者28日从北京市西城区人民法院获悉，在该院日前审结的一起刑事案件中，“号贩子”孙某指使他

21-08-30
革命先辈田裕民后代捐助家乡贫困学生

　　中新网石家庄8月28日电 (王天译贾昆)28日上午，河北省邯郸市冀南新区光禄镇尧丰村举行第四届革命先辈田裕民家乡助学基金颁发助学仪

21-08-30
江苏南通发布“双减”措施确保学生在校内学足学好

　　新华社南京8月28日电(记者杨丁淼)江苏省南通市27日发布《关于进一步减轻义务教育阶段学生作业负担和校外培训负担的实施意见》，作为“

21-08-30
长城脚下“扫地僧”：与长城有关的上万个日夜

　　中新网石家庄8月28日电 (赵丹媚邢璐)“每一天哟每一年，急匆匆地往前赶，哭了倦了累了，你可千万别为难……”28日一早，天色刚蒙蒙

21-08-30

快讯

行业

公司

当前页面 ： 首页 > 快讯 > 正文 >

大模型创业 300 天：成者 100 亿估值，80% 败者出局

为您推荐

当前页面：首页 > 快讯 > 正文 >