相比于AI的应用,最近一年多中,算法和算力的企业在一、二级市场被吹捧、炒作得非常厉害,大模型中有横空出世的DeepSeek,算力企业里英伟达达到全球市值第一,2024年A股的市值涨得最多的是寒武纪,一年涨了5倍。
AI市场无疑成为当前投资人眼中最大的香饽饽,市场的风云变幻也不可避免地更多的投资人思考具体的投资机遇究竟在哪个戏份赛道。比如,DeepSeek之后大模型还值得投资吗?具体到算法、算力、数据层面,中美存在多大的差距?中国的市场机遇在哪里?AGI真的会到来吗?
这些问题,不同的投资人有不同的答案。
对此,2025年4月16-18日,由投中信息、投中网共同主办的第19届中国投资年会·年度峰会在中关村国际创新中心隆重召开。同创伟业合伙人陈凯、创世伙伴创投合伙人梁宇、清流资本合伙人刘博、五源资本合伙人刘凯、鼎心资本合伙人潘涛、紫光基金董事长阙里、清智资本创始合伙人张煜和山行资本合伙人朱思行,围绕人工智能三大基座进行了深度的讨论,在这场讨论中,以上问题都得到了答案。本次论坛由投中网副主编陶辉东主持。
以下是现场实录,由投中网编辑整理:
陶辉东:相比于AI的应用,这一年多里算法和算力的企业在一、二级市场被吹捧或者炒作得要更加厉害一些,大模型的公司就不用说了,算力像英伟达是全球市值第一,去年A股的市值涨得最多的也是寒武纪,一年涨了5倍。
台上6位都是来自顶级投资机构的嘉宾,在算力、算法和数据方面都有非常深入的投资和布局,相信本场能够贡献出一些有价值的观察和思考。本场会有一个特别的环节,本场panel的最后会有一个投票,在场嘉宾互相投票选出本场发言最精彩的嘉宾成为MVP。
投资人眼中的算法、算力与数据
陶辉东:第一个问题,先从整体的视角展望一下目前国内在这三大基座、这三个方面的发展到了怎样的阶段,尤其是跟美国对比我们的优劣势在哪儿?各自的机构最关注的是什么?首先请陈总。
陈凯:感谢陶总。大家好,我是同创伟业的陈凯,同创伟业在国内是历史比较悠久的老牌创投机构,2000年成立,到目前为止投了600多家企业,大部分都是分布在科技领域,其中新一代信息技术、半导体等是我们都投资布局了完整产业链,我本人主要负责半导体、AI等硬科技领域的投资工作。
刚才陶总说的问题我们一直都在思考,人工智能分成几块,无非是算力、算法、数据。中国与美国在人工智能领域处于全球领先地位,但中国与美国相比仍存在一定差距,这种差距主要体现在量上而非质上,甚至在局部领域中国已具备相对优势。从投资角度来看,算力是整个AI的基座部分,涉及底层硬件,尤其是AI大算力芯片,其发展依赖于全产业链的综合实力,在这块中美差距较大,也是我们重点关注的领域。
目前中国在AI大算力芯片的设计能力上已取得显着进步并快速追赶,但更上游的晶圆先进制程仍存在很大短板。因此,过去几年同创伟业的投资重点集中在包括算力在内的底层支撑性技术领域,例如AI大算力芯片、CPU和GPU等国内头部芯片设计企业;同时,为弥补产业链上游的不足,也在晶圆厂、先进封装厂以及更上游的装备材料(如光刻胶)等领域进行布局。只有补齐这些短板,才能在产业发展当中的根本性问题。
从投资角度而言,当前二级市场的热点(如寒武纪的表现)以及国际环境的不确定性对国产替代总体构成利好,尤其是AI算力及相关赛道,技术领域的补短板和创新超越会同时并存。未来几年,投资主线不会发生重大变化。通过优化投资布局、支持企业发展,获得投资效益和社会效益,通过可持续、良性循环的方式为国家科技实力的提升发挥作用。
陶辉东:谢谢陈总,着重谈了对算力的看法。下面请创世伙伴创投的梁总。
梁宇:谢谢陶总,大家好。创世伙伴创投的管理团队自2007年起在中国从事投资业务,至今已历经近二十年。在人工智能领域,当前正处于至少第二波重大发展浪潮,第一波以“AI四小龙”为代表,而如今又迎来新的高峰。
首先,在上一轮周期中,行业普遍关注中美人工智能的差距,当时中国已实现追赶甚至部分超越。然而,随着以OpenAI为代表的新范式出现,2022年行业一度认为差距再次拉大。美国主流媒体最初评估中国落后约20个百分点,但后续不断修正观点。例如,李飞飞团队的研究表明,中美在人工智能技术和研究领域的差距正在快速缩小。这一过程客观反映了行业参与者——包括创业者、投资人、相关机构及政府——的信心和投入决心不断增强。
第二,在算力、算法、数据三大基座中,创世伙伴更专注于早期投资,并重点关注算法和数据领域。尽管国内在算力底座方面仍存在短板,但我们坚信通过持续努力能够逐步突破,且追赶速度正在加快。我们对中国人工智能的发展前景充满信心。
在算法和数据方面,我们认为关键在于长期积累。上一轮人工智能周期中,企业主要聚焦于专家型模型,并在各行业沉淀数据。今年初,DeepSeek的进展为行业注入了信心,证明通过降低模型成本可以推动更广泛的应用。当经济模型达到临界点,市场需求将被迅速点燃。
中国在这一阶段具备独特优势,能够充分利用过往在RAG模型和技术人才上的积累,实现无缝衔接。我们持续关注并投资这一领域,坚信除了基座大模型外,各行业垂直应用的“小模型”将迎来爆发式增长,呈现百花齐放的局面。
数据作为核心养料,中国的优势在于规模而非整合。国内数据资源丰富,但大量高价值数据分散于政府、国企、民营企业及垂直行业中。目前大模型训练数据约80%来自公开市场,而真正具备商业价值的行业数据仍如冰山般潜藏,占比同样高达80%。这既包括结构化数据,也涵盖海量非结构化数据。
因此,在数据领域存在巨大机会,尤其是在存储格式、治理和流通环节。中国数据规模远超美国,但关键在于如何高效、低成本地释放这些数据价值,赋能各类模型,使其真正发挥作用。这是我的看法。
陶辉东:谢谢梁总。下一位是清流资本的刘总。
刘博:大家下午好,我是清流资本的刘博。我们基金成立于11年前,是一家专注于早期阶段的双币基金。由于创始合伙人王梦秋女士曾是百度早期的技术副总裁,我们的投资风格始终围绕技术范式的变迁调整关注方向。过去两年半,生成式AI是我们重点布局的赛道之一。
在AI三大基座的讨论中,我们持续观察行业动态,尤其关注各大厂商的技术演进,试图厘清大模型的能力边界,并在此过程中逐步建立起对AGI的信念。关于算力问题,近期与同行交流时重点讨论了英伟达在贸易战背景下的处境。我们认为当前算力供给仍远远不足,核心矛盾在于英伟达的商业成功并不等同于算力产业的整体盈利——现阶段主要由大型科技企业为其买单。
今年中美两地的双币基金普遍聚焦应用层投资,因为必须通过应用端的突破来验证算力投资的价值。只有当应用场景充分证明算力投入的商业回报,真正的算力普及才会到来。作为AGI的信仰者,我们判断当前全球算力基础设施仍远未达到支撑AGI发展的需求水平。
在算法和数据领域,我们此前的投资布局主要聚焦于这两个维度,早期投资了包括具身智能领域的星动纪源、AI for Science方向的深势科技等项目。由于早期基金规模限制,我们并未直接布局大模型赛道——考虑到大模型需要长期持续的融资支持,而是选择在垂直领域寻找机会。当时我们称之为”垂直模型”,而如今行业更普遍的做法是基于开源模型进行蒸馏,再结合行业特定数据进行针对性训练。
从应用端反观数据与算法的现状,我们发现许多高价值数据的可获得性仍面临挑战。虽然数据客观存在,但有效获取和利用的难度较大。当前各类应用的核心逻辑,在于通过创新交互方式将非互联网原生数据注入模型。以近期热门的Agent技术为例,其本质是通过人类经验数据的沉淀,构建支持特定任务执行的小模型。尽管目前尚未实现真正的AGI,但至少在数字世界已能完成部分自动化任务。
就数据可得性而言,无论是To B还是To C领域,算法和数据类创业公司都在竭力获取差异化、专项化的数据资源,并通过算法优化提升模型能力。从投资视角出发,今年我们会重点关注这一领域。整个行业正处于关键验证期,需要具体案例来测算中美两国在算力投入的性价比和投资回报。因此,无论是科技企业还是投资机构,都期待在未来两年内能看到清晰的经济收益模型得到验证。
关于中美差异的问题,近期观察到一个有趣的现象:我们接触的很多项目,包括从硅谷回来的创业者,都体现出一些微妙的变化。事实上,美国美元VC投资的很多项目创始团队中,华人占比较高。特别值得注意的是,最近一个季度,不少原本计划长期在硅谷发展的创业者也开始考虑回国创业。
这种现象反映出中美在AI领域的差距正在缩小,包括融资环境的差距。目前国内的融资氛围持续升温,资金层面的差异已不再显着。基于这样的市场环境,我们今年的投资策略将更聚焦于算法和数据领域,重点寻找那些能够巧妙运用技术、真正体现AGI执行力的优质项目。
陶辉东:谢谢刘总,下一位是五源资本的刘总。
刘凯:我们是一家较早成立的投资机构,目前采用双币种投资模式。关于AI基础设施的三大要素——算力、算法和数据,我认为这三者密不可分。
中美的AI发展路径存在显着差异:美国凭借强大的算力基础(包括众多芯片设计公司和像Google、Meta的大厂自研芯片)率先突破,继而发展基座模型算法,最后解决数据应用问题。而中国的发展路径则有所不同,早期在算力领域相对薄弱,这点在一二级市场已有充分体现。中国的寒武纪、摩尔线程等企业,最初市场规模有限,主要客户为互联网公司,但经过三四年发展已逐步进入主流视野。
在算力投资方面,第一波机会确实已经过去。当前上市或排队的企业大多是在2018-2020年间完成投资。当时市场对大算力存在分歧,有人认为大算力在中国很难发展起来,但强劲的需求最终推动了行业发展。未来算力领域仍存在细分机会。
关于算法与数据的关系,我们认为二者紧密相连。即便在美国市场,这一领域的竞争格局也尚未完全明朗。回到中国市场,大模型竞争刚刚进入白热化阶段,DeepSeek在推理端的突破具有启蒙意义,但在训练侧和多模态等领域仍有巨大提升空间。我们内部将这一发展阶段类比计算机发明初期——虽然难以准确预估其最终价值,但只要持续推动成本下降直至研发出最好的模型,必将深刻改变众多行业。
关于AI发展的历史参照,美国电力行业的发展历程提供了很好的借鉴。在GE和西部电气完成电力基础设施布局后,电力行业曾经历相当长的蛰伏期,而正是在这一时期,电力应用实现了在各个领域的快速渗透。相关研究着作详细记载了电力如何推动美国现代化进程,包括郊区化发展、独栋住宅的兴起、有轨电车的没落以及乡村音乐的流行等社会变革,这些都与电力普及密切相关。
这一历史经验表明,重大技术革命往往需要经历较长的演进周期。就AI领域而言,大模型和AGI的发展很可能遵循类似的规律。我们需要以更宏观的视野来观察这一进程,而非局限于三五年时间跨度。但从具体投资机会来看,未来五年内,算力、算法和数据三大领域都将持续涌现重要的投资机遇。
陶辉东:谢谢刘总,看的都是五年以后、十年以后的事情。下一个是潘总。
潘涛:鼎心资本成立至今已有近11年历史,目前管理第四期VC基金。我们的投资方向经历了持续聚焦的过程:从早期的模式创新、互联网投资,到后来的硬科技领域(包括新材料、半导体等),直至第四、第五期基金明确All in AI的战略定位,这与今天讨论的主题高度契合。
早在2021-2022年,我们就开始系统思考AI的本质。当时并未局限于算力、算法、数据的分析框架,更多的是从”数智化”演进的角度进行理解。我们认为技术架构可分为三个层次:最底层是基础设施层(以芯片等为代表),遵循摩尔定律;中间层是通信及硬件+软件融合层,遵循吉尔德定律;最上层是互联网应用平台层,遵循麦特卡夫定律。过去三十年间,信息技术产业正是由这三个”飞轮”交替驱动发展,每个轮子的投资周期在不同的时点有不同的价值体现。
站在2024-2026年的时间节点,当前全球科技产业的核心矛盾集中在底层算力领域。英伟达的崛起及其最新产品(如GB200、H100系列)就是一个体现,且其对中国市场的限制,标志着与互联网时代根本性的差异:中国在移动互联网时代基于开放的底层架构取得了巨大成功(如字节跳动、BAT等),但在当前AI时代,底层技术自主可控已成为生死攸关的问题。这一认知在过去四五年间已逐渐成为行业共识,也使得解决算力瓶颈成为当务之急。
关于算力的定义,我们遵循国家工信部提出的”新型智算”概念,即集异构计算、通信、存储于一体的综合能力体系。基于这一理解,我们的投资布局着重以下几个方面:
在计算领域,我们观察到Transformer架构对GPU算力的需求与传统通信行业对专用算力的要求存在显着差异。尤其是DeepSeek等企业的实践表明,我们发现单纯追求算力规模(如Tflops指标)并非唯一路径,通过MoE架构和算法优化等系统级创新同样能实现突破。这促使我们调整了对算力投资的理解。
在通信基础设施方面,我们重点布局了支持万卡集群互联的技术,包括硅光光源、下一代薄膜铌酸锂(1.6T/3.2T)、ODSP芯片和AFE等关键器件。这些投资在行业向大规模集群计算转型的过程中获得了先发优势。
新型存储领域,在2024-2025年间,我们持续关注新型存储技术的发展。现阶段,随着摩尔定律推动的底层算力进步,我们的投资重点将逐步向上层应用延伸。虽然大模型领域目前仍由巨头主导,但后端大家会用脚做投票。
上世纪70年代IBM高层曾预言”人类只需五台计算机”,而今天单部智能手机的算力就已远超这个规模。这引发我们思考:当前”中美各一个大模型就足够”的论断,是否会像当年的预测一样被未来发展所颠覆?当前也许会,但往后发展我们相信AI演进将呈现更丰富的形态。
未来20-30年,随着技术持续突破(包括摩尔定律、吉尔德定律的持续作用),每个人或将拥有多个智能体。这种演进不会仅停留在规模扩张,而是会向专业化、精细化方向发展。
在当前阶段,我们的投资重点不在基础大模型领域。更关注AI基础设施领域,包括我们刚才讨论的计算、通信、存储于一体的综合能力体系,另外就是应用层机会,特别是具有中国特色的两大方向:一是大模型驱动的传统产业升级,充分发挥中国产业链优势;二是AI与硬件的融合创新,如具身智能等领域。”AI+硬件”方面的突破尤其值得关注。我们认为,中国在这些领域将涌现大量投资机会。
陶辉东:谢谢潘总,重点也是在算力上。下一位是阙总。
阙里:我是紫光基金的负责人。紫光基金作为新紫光集团旗下全资控股的CVC平台,投资聚焦在聚焦在半导体,尤其是芯片设计领域、ICT领域,紧紧围绕着AI时代,从基础设施的建设到终端应用、到智能的各方面的行业的实际落地应用。紫光基金肩负着双重使命:一方面要补强集团核心产业竞争力,另一方面要推动产业链的完整布局。在中美科技竞争的背景下,这种”求全”策略虽然从经济学角度并非最优解,但却是保障产业链安全的必要选择。
在具体实践方面,我们去年完成了疫情后最大规模的对美并购案,以21.43亿美元回购新华三30%股权,使集团持股比例提升至81%,外资所占股权随之降至20%以下。这一举措不仅强化了主营业务,也为企业开拓信创市场和海外扩张扫清了障碍。
针对AI基础设施领域,我们重点布局相对薄弱的算力环节,涵盖计算、存储和传输三大核心领域。通过”内部孵化+外部投资”的双轮驱动,以及与行业龙头企业的战略合作,持续完善产业生态。我们始终秉持开放态度,期待与各界伙伴开展多层次合作,共同推动中国半导体和ICT产业的发展。
陶辉东:谢谢,下一位是清智资本的张总。
张煜:我是清智资本张煜。我们专注于人工智能早期投资,去年一年投资了十余个项目,覆盖AI基础技术、AIGC、生命科学、具身智能等多个领域。同时我们还运营孵化器支持原创项目孵化,位于清华大学,号称中关村最美孵化器。
关于AI发展要素,我们提出五要素模型:算法、算力、数据、系统和应用,其中核心基础同时也是中美竞争方面,算力和算法最为重要。在算法领域,中美差距主要体现在基础算法创新层面,美国在原创性算法研究方面占据主导地位,而中国在工程算法实现上追赶较快。这种差异类似于探索路径与跟随路径的区别。
算力方面,不得不承认,英伟达在芯片架构和生态建设上具有显着优势。国内企业中,华为展现出较强的追赶潜力,特别是在构建完整芯片生态体系方面。数据领域,美国的数据商业化做得非常不错,反观国内,国内的数据行业更像是劳动力行业,并不当作技术行业来看待,所以估值都不高。
系统层面,中国已涌现出一批优秀商业化系统厂商,这与美国大厂自建系统的模式形成差异。应用领域,随着项目数量显着增加和市场预期改善,结合中国丰富的应用场景和制造业基础,有望形成比较优势。
陶辉东:谢谢张总分享,下面是山行资本的朱总。
朱思行:我是山行资本的朱思行,目前我们主要的投资方向是AI。从2022年开始观察这个领域,前年、去年到今年,我们的感受与张总提到的类似。在模型方面,我们尚未看到明显超越的情况,但跟随的速度明显加快了。之前我们与美国之间的差距,或者说追赶上一个版本所需的时间较长,现在这个时间正在缩短。
在过去的两年多时间里,大模型本身在模型和算法上取得了长足的进步,这为许多应用领域的实际使用创造了良好条件。因此,我们认为未来一段时间内,应用层会出现更多创新企业,并逐渐崭露头角。这对投资人来说是很好的现象,也意味着一系列的投资机会。
这一趋势不会瞬间爆发,而是一个持续的过程,可能会延续若干年,类似于移动互联网在2011年、2012年之后的发展局面。
在数据方面,我们的观点是:在中国的环境下,无论是模型训练还是应用的提升与推广,都离不开数据。然而,中国的数据公司很难独立成长为一家规模化的商业机构。虽然可以成为一门生意或小型公司,但受限于客观环境,难以发展成大型企业。因此,这一领域并非我们主要的投资方向。
在算力方面,我们较为关注。此次AGI的发展与上一代AI相比,模型底层架构发生了显着变化。过去模型的底层变化对运算效率的提升可能不到5%,大量时间浪费在内存相关的操作上,这是行业的共识问题,且是全球该类型企业都有的问题。全球范围内的芯片企业,包括国际领先厂商和国内企业,都在寻求解决方案。我们认为,随着AI应用的深入,推理在运算中的占比逐渐扩大,这一问题将愈发关键。基于这一趋势判断,我们认为值得投资人重点关注。
第二个判断是:如果将全部算力重心放在云端,从历史经验和IT合理布局来看,未必是最优方案。回顾PC互联网和移动互联网的发展,端侧算力能力的提升是应用普及的前提条件。如果按照这一逻辑推演至今,未来若手机、笔记本甚至PC能够支持中等规模的大模型运算,将极大促进大模型服务的普及。因此,我们也非常关注端侧推理芯片的投资机会。从全球范围看,这一挑战普遍存在。如果能找到优质标的,其市场机会不仅限于中国,还可能面向全球。
DeepSeek之后,大模型还值得投资吗?
陶辉东:谢谢朱总。这一轮问题听下来,大家谈的最多的都是算力。我下一个问题是关于大模型,自从DeepSeek出来以后,流行的看法是说百模大战结束了,没有必要重复做基座模型了,应该去做一些特定场景的小模型。大家是否认可这样一个说法?如果确实认为现在再做大模型只是同质化的竞争的话,那么还有哪些是值得投的机会?这个问题从朱总开始。
朱思行:这个也是我们最近在考虑的事,我们不是特别专业的技术人员,用类比或者比喻的方式来说,现在大模型进化,特别是语言模型的进化,我们认为它提供了非常好的类似人的基础教育或者是高等教育的基座。人在完成了高中教育或者大学教育以后进入行业里仍然需要各个行业的训练和相应的知识积累,我在垂直领域里面,这样的过程也是同样需要的,且在各个应用领域更贴近于相应的经济循环,所以相应的投资以及经济回报的机会是很明显的、很直接的。
陶辉东:您是说仍然需要专注在小模型、细分场景。
朱思行:细分场景里面肯定是有机会的,但不是把大模型甩掉,而是在大模型的基础上。
陶辉东:OK,理解,张总。
张煜:我们曾将2022年称为大模型元年,2023年为行业模型元年,2024年为Agent元年。但后来发现,基础模型的成熟度未达预期,直到今年才基本可用。因此,2025年可能才是Agent的真正元年。在大模型基础上延伸的应用开始涌现,这类似于一个人从儿童成长到具备通识能力的成年人,但要成为专业人才(如工程师、医生或飞行员),仍需进一步学习专业技能。大模型提供了基础能力,现在基座模型的能力将将可用,行业模型因此得以发展。就像未来机器人帮我们洗衣服,最智能的方式不是手搓,而是选择合适的洗衣程序并执行。
轻量化模型或小模型并不真正”小”——例如在生命科学或具身智能领域,行业数据量仍然庞大。但由于基于基座模型,确实节省了大量训练成本。所谓”小”,是指数据更专用,规模相对较小。但从算法角度看,许多方案尚未真正实现轻量化。这是我们的观察。
陶辉东:阙总有什么看法?
阙里:基座模型发展到今天,越来越多开源化的方式使得大家获得一个可共享的平台,紫光旗下的核心企业,比如新华三是很强的To B企业,它面对的是真正付费的客户,所以从产业发展角度来讲,我们确实现在在着力去发展行业的垂类模型,因为从企业发展的角度来讲,我们也认为这可能是最早能实现变现闭环的切入角度,因此我们特别关注在垂类模型里面真正实现工业化突破的场景。
陶辉东:潘总。
潘涛:我们对大模型的认知在过去一年发生了显着的变化和更新。目前我们将大模型划分为三个主要类别:第一类是通用大模型,以ChatGPT为代表的大语言模型。在这一领域,我们认为投资机会主要在于追随已经确立领先地位的行业头部企业,因为这些企业已经占据了关键的技术、数据和市场优势。
第二类是行业大模型或垂类大模型。虽然这类模型在传统定义上可能不完全符合”大模型”的标准,但我们认为它们这块才是中国真正的机会。首先,中文在互联网语言中的占比相对有限,这使得通用大模型的发展面临天然的数据限制;其次,中国在过去20-30年的制造业发展过程中积累了丰富的行业数据,这些数据对于垂类模型的训练、优化和收敛具有不可替代的价值。
第三类是如果刚才我们说的人均多个智能体,那么这里面将产生更多星辰大海的投资机会,在更长的周期里更值得我们去孵化、挖掘和投资。
陶辉东:刘凯总有什么看法?
刘凯:我们对人工智能领域的投资实践和观察表明,当前对智能本质的理解仍处于相当初级的阶段。通过这两年的投资实践,我们深刻认识到模型竞争仍处于早期发展阶段,这与之前认为格局已定的判断存在显着差异。从全球范围来看,各类模型仍在持续迭代和分化过程中。
通过分析不同应用场景,我们发现一个关键特征:尽管表现形式各异,但智能的核心载体始终是语言。无论是机器人应用的VOA技术(通过语言描述包裹视觉信息),还是我们所投资的华深智药处理的分子结构(将复杂分子转化为语言表征),甚至是自动驾驶系统,其底层都依赖于语言模型的支撑。
当前阶段,我们对智能本质的认知仍然有限。无论是OpenAI的发展路径,还是中国模型的演进方向,都存在着巨大的不确定性。这种认知促使我对智能技术保持敬畏之心,并愿意投入大量时间深入研究。从投资角度看,虽然准确判断技术路线存在难度,但这也意味着孕育着巨大的创新机遇和发展空间。
陶辉东:还有可能有下一个DeepSeek这样的模型出来吗?我们没有投DeepSeek,没有说这个事情就结束了是吗?
刘凯:我觉得一定会有。
陶辉东:下一位刘博总。
刘博:今年基座模型的发展正在引发行业格局的深刻变革,最显着的变化是将模型开发者和创业者划分为两个主要方向。以DeepSeek的崛起为标志,业界开始对预训练模型的本质和发展路径展开深入探讨。如果将预训练过程比作塑造模型的核心智能或基础认知能力,那么这一领域正在呈现出明显的生态分化趋势。
我们看到,来自大模型厂商的创业者正在选择不同的发展路径:一部分转向应用层开发,另一部分则选择建立独立研究实验室,探索新型训练方法。这种分化虽然不一定都适合风险投资,但为预训练技术的未来发展带来了新的思路。当前由少数头部厂商主导的集中式发展模式,由于其固有的商业战略局限性,实际上难以容纳技术路线的多元化发展。
随着技术演进,我们预见未来三年基座模型将面临新的细分的演变。
陶辉东:谢谢刘总。创世伙伴创投的梁总。
梁宇:当前关于大模型发展是否已达瓶颈的讨论,我认为与刘凯总的观点一致——距离真正的终点还很遥远。
首先回到这一轮技术革命的起点Transformer架构,其核心命题”注意力机制是最需要的”开创了全新的技术范式。但在实际应用中,我们发现现有大语言模型存在明显的记忆机制缺失问题。以日常使用体验为例,即便是主流对话系统在交互过程中也难以保持连贯的记忆能力,这种基础功能的缺失反映出当前模型在智能本质定义上的不完整性。OpenAI最新推出的记忆功能更像是后期修补方案,而非架构层面的原生能力。
其次,如何将一个复杂的任务进行合理化的分解,分解成子人物,再由Agent执行继而完成目标,这个问题还没解决。
这些问题的解决不仅需要技术创新,更需要产业生态的协同共建,类似于IBM早年推动的企业级标准制定,但在新范式下需要更适应现代技术架构的解决方案。
基于这些观察,我们对当前大模型技术的实际应用带来的改变持谨慎态度。回到本源,要实现质的飞跃,从根上改变这一切,可能还有新的范式。
陶辉东:谢谢梁总,陈总呢?
陈凯:在算力基础设施和大模型领域的投资布局中,我们发现,一方面,通用大模型是典型的资本密集重投入模式,从这一点来说,大厂依托资金、资源做大模型优势很大。但从投资角度看,可投资机会反而需要谨慎看待;另一方面,大模型迭代非常快,DeepSeek的案例颇具启示性,这家未依赖外部融资的机构通过技术开源实现了后来居上,但形成可持续闭环商业模式似乎还需要探索。相比之下,大模型在垂直类方面的机会很多,例如特别是AI for Science等细分专业类应用方向,这些更值得投资人去关注挖掘。
在专业垂直类模型,初创企业更容易有机会把自己的壁垒建立起来,而非单纯的简单的靠“大力出奇迹”地去堆资源取胜,OpenAI的理论就属于后者,但具体到专业垂直类领域则很大不同,这也是创业者和投资人都可以重点关注的的方向。
AGI到底会不会来?
陶辉东:这个问题可以看到一个很明显的争议,左边更加愿意给AGI未来一个期待,右边好像更加落到实处一点,更加关注能看得见的行业的中模型或者小模型。如果跟美国对比的话,好像在美国没有这样一个讨论——大模型或者基座模型现在已经可以了,我们可以重点放在细化或者行业的模型上。在中国大家更多的关注点还是在能够落地的东西上。我特别好奇一个问题,大家对于AGI这个事情到底怎么看?如果相信AGI会来的话,我们不可能对现在的模型感到满意,无论是DeepSeek还是GPT-40,或者O1或者新的东西,大家到底对AGI怎么看?到底相不相信这件事?是两年、三年还是五年能来?这个问题从陈凯总开始。
陈凯:因为相信所以看见。无论是软件应用,还是具身智能硬件应用,我们都期待AI技术能赋予其灵魂,目前已经看到初步的技术演化路径了,AGI代表未来方向,相信会有大量应用不断涌现。
陶辉东:梁总怎么看?
梁宇:AGI一定会来,但不会很快,至少我们相信科学,从各行各业的,我是指技术行业的统计,Gartner曲线还是一直有它的规律,时间会拉长,一定会到,但不是现在。
刘博:我们很相信AGI会到来,但是节奏上如果突然某一年我们看到大量的人在讨论监管、立法,一定是这件事情已经发生了,但现在它还被关在笼子里,人类有必要先谈一谈监管的问题,那一天就是AGI来临的一天。
刘凯:虽然我们讨论了很多模型,但是我们比较少讨论AGI。AGI是超人的智能,人类无法衡量,这是最难的问题。如比亚迪王传福总分享三个词:敢想、敢做、敢坚持,不要想那么多AGI的事情。
潘涛:大家讨论的是终极AGI,但是AGI也是分阶段实现的。我们投资更多还是基于技术、市场和市场的不同的阶段,按照投资价值去做识别、判断和投资。
阙里:首先回应一下刚才主持人的观察,我觉得分化是必然的,根据不同机构的战略定位不同跟钱的属性不同,一定会有不同的偏好,只有投资市场百花齐放,这才是一个健康的市场。关于AGI的讨论,我对未来始终充满希望。
张煜:人类大概99%的活动其实都是规律性的活动,不具有太多的创造性,如果从这个角度来谈AGI,肯定可以实现。AGI具有自主意识这件事,我持保留意见。
朱思行:总体来说这个问题我回答不了,但是也很简单,它在哪方面的能力够强了,这个赛道足够大,创业者就做,我们就投,就这么简单。
陶辉东:最后进入投票环节。恭喜刘博总成为本场的MVP。
文章来源于网络。发布者:读懂财经,转转请注明出处:https://www.juwfa.com/4767.html