Z Tech｜专访中科大02年白寅岐：让隐式世界模型学会因果，做最快最省落地的世界模型

2026年6月10日

世界模型（World Model），正在成为AI领域新的技术高地。从OpenAI的Sora，到图灵奖得主Yann LeCun力推的JEPA体系，再到李飞飞创办的World Labs，全球最顶尖的一批研究者都在试图回答同一个问题：AI究竟如何像人一样理解世界，而不仅仅是生成语言和图像。

详细介绍

导语

世界模型（World Model），正在成为AI领域新的技术高地。从OpenAI的Sora，到图灵奖得主Yann LeCun力推的JEPA体系，再到李飞飞创办的World Labs，全球最顶尖的一批研究者都在试图回答同一个问题：AI究竟如何像人一样理解世界，而不仅仅是生成语言和图像。相比已经逐渐收敛的大语言模型，世界模型仍是一片尚未被验证的无人区。视频生成、3D空间建模、隐空间表征，不同技术路线并行推进，没有人知道最终答案会从哪里诞生，也没有人能够证明自己就是正确的那一个。

而就在这场全球竞赛刚刚开始的时候，一个23岁的中国年轻人选择押注其中。

2026年6月，合肥的天气已经开始炎热。白寅岐正在实验室为安徽省机器人和具身智能大会的发布环节细心准备材料。这次演讲，他受邀介绍他的自研世界模型路线-Abductive World 溯因式世界模型。相比于半年前刚开始技术探索时的疑虑和困惑，如今这位年轻的科大学子心怀的是一份坚定与自信。

2025年底，白寅岐在中国科学技术大学面临着一个并不轻松的选择。

那一年他研究生在读，专业是人工智能。在创业之前，他的履历已经足够把人生的下一步规划得很清楚：大三即入选首届国家自然科学青年学生基础研究项目（全国108人），科研成果两次帮助团队拿到华为”火花奖”，顶会论文也来到了九篇，严格算下来，他的学术成果已经够得上两个博士毕业要求。

按这条轨迹走下去，读博、做科研、留在体系里，或者拿高薪、去大厂，都是再稳妥不过的答案了。

但他更期待的是一条破局之路，一个他筹备已久的机会 —— 世界模型。”语言模型本质上还是在生成符号，”他说，”想让机器真正理解这个世界，光靠语言很难做到。“ 在他看来，大语言模型已经进入工程优化阶段，范式基本收敛；而世界模型还停在”Transformer出现前夜”那种混沌期，路线并行、没有定论、没有绝对的领先者。对研究者，这是挑战；对创业者，这是机遇。

他选择做一个创业者。

2026年，他在合肥成立了白泽科技。公司名取自山海经里那只”能洞察万物规律”的神兽，这正好对上了他对世界模型的理解：他想让模型学的不是现象，而是现象背后的演化规律。如果模型只记住了苹果下落的轨迹，那换成橘子、香蕉、石头就可能失效；但如果它真正学到了”重力”，任何物体都会遵循同样的规律。这正是白泽整个技术体系的出发点。

围绕这个出发点，白寅岐选了一条把”落地”放在第一位的路线——隐空间 + 因果推理 + 无标注视频 Scaling。它最实在的地方在于”省”：预训练阶段用海量无标注互联网视频，不需要动作标注；最贵、最稀缺的真机数据，只在对齐阶段少量使用。人工成本和数据成本因此被大幅压低，而模型在预训练里就开始自己理解物理规律。用他的话说，”我们在做一件最短路径把世界模型落地的实事。”

白泽聚集的团队，不是单纯的机器人团队或视觉团队，而是一群横跨人工智能、因果推理、多模态学习、工业场景与工程落地的人，成员来自中科大、华为、腾讯、阿里、宾夕法尼亚大学、波士顿大学等机构名校。两位首席科学家分别是新西兰工程院院士王睿俐、国家级领军人才宋红教授，团队累计发表论文 500+ 篇、开源项目 GitHub Star 1000+。

在白寅岐看来，世界模型本来就是一场长期战争。它试图解决的并不是某一个垂直任务，而是机器如何理解真实世界本身。“过去几年，大模型最大的成功在于让机器掌握了人类语言；而世界模型，则试图进一步让机器掌握物理规律、空间结构、行为逻辑以及因果关系。”面对这场旷日持久的全球竞赛，他坚信手中握着最核心的底牌：“把单纯的数据 Scaling，切实转换成模型世界演化能力的 Scaling Law。”

“产品是技术价值最直观的证明。”白寅岐反复强调。相比停留在论文中的SOTA成绩，他更关心的是，这些规律是否能够最终变成机器人、自动驾驶或者其他智能系统里的真实能力。某种程度上，这也解释了为什么一个原本有机会继续走学术道路的年轻研究者，会选择如此早地进入创业战场。在他看来，世界模型最终不会诞生于论文，而会诞生于真实世界。而白泽希望成为那个把世界规律变成机器认知的开拓者。

以下是本次访谈的对话实录，经Z Potentials编辑修改，enjoy～

Highlight

产品是技术价值最直观、最落地的证明。哪怕一项技术在评测基准上超越行业最优方法，但若无法在下游智能系统中稳定落地、真正起效，就不算真正的成功。

我们的核心逻辑，就是通过观测外在世界状态，反推内在演化规律，再用这些规律去模拟预测未来状态。我们这条路线很有差异化，核心是三大关键：隐空间学习、因果推理、无标注视频缩放定律（scaling law），也就是“隐式+因果”的技术体系，在隐空间中挖掘因果规律，再用因果逻辑赋能未来状态预测。

当下多数具身应用是”预训练表征 + 标注数据后训练映射”，两个环节脱节。如果预训练阶段就吃透世界因果规律，后训练再把动作标签映射到成熟的演化空间，效率和效果都会大幅提升。

模型应当从大量“物体下落”的场景中，抽象出重力这条通用底层规律，而不是记住某一个物体的下落轨迹。不管下落的是小球、水果还是其他物体，不管场景如何变化，重力主导的运动轨迹规律是恒定不变的，我们就是要验证模型能学到这种可迁移、可泛化的物理因果。

白泽在做一件最快、最省地把世界模型落地的实事：预训练告别动作标注，真机数据只需少量对齐，把人工和数据成本压低。部署和数据成本低，意味着合作方不必先砸进大笔标注与采集投入就能用起来——这正是我们商业化最现实的切入点。

我们不想再做AI领域跟哨的陪跑了。不是只有等到硅谷的第一枪打响，才算奠定一条赛道；我们也可以做下场定义规则的那支队伍——这需要的不止是技术基础，更是文化自信。

01 从科大青年学者到世界模型创业者：一位00后AI研究者的技术信仰与选择

ZP：欢迎白总做客ZP，首先请先简单介绍一下自己的经历？

白寅岐：我是2002年生人，陕西西安人。本科与硕士均就读于中国科学技术大学，本科在自动化系，目前是科大人工智能专业研二在读，明年毕业。

我的科研经历主要分为三个阶段：本科入学后因为对AI感兴趣，提早修读了基础课。大三时，凭借名列前茅的GPA和实验室积累，成功申请到了国家第一届青年学生基础研究项目（青年基金）。随后通过实验室与华为的合作项目，我开始深入研究 AI for EDA（芯片设计选择）。当时正值国家芯片技术面临外部封锁，希望借此为国产EDA做出贡献。2024年底开始深耕大模型，期间，我作为实验室的小Leader，带领十几个人的团队开展大模型研究，至今已完成了近10篇论文（部分已发表，部分在投）。

去年10月，我结束了在华为的实习。当时我积累的论文数量已基本达到2个科大博士的毕业要求。在思考人生下一站时，我意识到世界模型的终局意义。语言模型本质上只是在生成符号，想要真正理解世界，必须攻克世界模型。当时我面临继续读博或出来创业两个选择。深思熟虑后，我认为只有真正投身商业化，才有可能让Scaling Law（缩放定律）的曲线变得更陡、更快实现目标。于是从去年10月开始，我离开实验室，并且邀请到了另外两位联合创始人，三人共同创业，搭建技术团队，并在今年4月正式成立了公司。过去几个月里，我们完成了前期融资、组建了团队，并持续推进底层研究。

ZP：为什么公司会叫”白泽”这个名字？

白寅岐：白泽在中国上古神话里，是一头”知天下万物之状、通万物之情”的神兽——它不创造世界，但它理解世界，知道每一种事物的名、形、理。我们做世界模型，本质上做的也是同一件事：让 AI 不只是会说话、会生成图像，而是真正”懂得世界为什么是这个样子、会怎么变化”。

所以我们的那句Slogan——”从世界之理，到智能之形”——其实是有递进关系的：先有对世界规律（世界之理）的理解，才谈得上让智能在物理世界里以各种本体（智能之形）行动起来。先理解，后行动；先有理，后有形。白泽这个名字，承载的就是这层”理解先于生成”的判断。

我也喜欢它身上那点东方色彩。世界模型这条赛道几条主线都来自硅谷的实验室，我们想做的，是一条带着中国工程底色、又能在全球技术语境里立得住的独立路线。

ZP：什么时候意识到世界模型会是你的赛道？

白寅岐：这个判断不是某一天突然冒出来的，是我在做大模型推理加速和 AI4EDA 的过程中”撞”出来的。我那几年一直在让大语言模型跑得更快、推理更强。但越往深做，越能清楚地感觉到一个天花板：LLM 再强，它理解世界的方式始终是间接的——它通过人类写下来的文字来”二手地”认识世界，它预测的是下一个 token，而不是下一帧画面、下一步动作、下一个真实世界状态。

这就引出一个很老但很关键的问题——符号接地（symbol grounding）：一个只在符号之间腾挪的系统，它的”理解”到底接不接得上真实世界？我越想越确信，下一代 AI 的瓶颈不在语言，而在与物理世界的因果连接。当我意识到这一点，世界模型对我来说就从”一个有意思的研究方向”变成了”AI 必然要走的下一步”。

我做科研和创业的思路一直没变过——要做就做最难的问题。这不仅符合我个人的技术信仰，也是这一路走来的必然选择。选择世界模型作为创业方向，核心在于我对“技术收敛周期”的判断：当年大模型因为 Transformer 架构的出现，迅速奠定了基础基调，技术路线在极短时间内就走向了收敛。但世界模型现在正处于“技术尚未收敛”的战国时代。目前，每一条技术路线都有其独特的亮点，国内外学者自成一派，还没有像大模型那样形成绝对的共识，正是最充满机遇的窗口期。这时候从底层切入，我们才有机会凭借自己的研究，真正助力并定义下一个世界模型赛道的黄金时代。

说实话，我们不是一开始就喊着”世界模型”四个字出发的。它是从具体问题里逐渐抽象出来的。我做 EDA、做机器人、做推理，反复遇到的是同一类困境：现有模型都缺一个能理解”行为如何改变世界”的底座。当我发现这些看似不相干的场景背后是同一个缺失时，”做物理 AI 时代的核心底层模型公司”这个定位才真正立住——它不是先有口号、再找场景，而是从一线问题里反向收敛出来的。

ZP：提到AI4EDA，你在华为期间具体做了哪些大模型相关的方向？

白寅岐：主要是基座大模型的训练、推理与部署。当时实验室里我是大模型方向的牵头负责人。我们以项目形式与华为合作，课题由老师和我共同拟定，并紧密契合华为的实际工程需求。

这段经历让我对“研究”与“产业”的结合有了极深的感受，主要体现在两个核心工作的落地推进上：

第一是 AI for EDA 的工业级落地。 传统 EDA 方案依赖启发式算子，效率和精度都存在短板。我们另辟蹊径，结合图学习与符号学习，选择“符号学习”路线，正是为了适配产业界的工程落地要求：华为内部工具最终需要转化为 C 语言部署，如果采用常规的 Python 神经网络模型，工程落地难度极大，而符号学习生成的函数能完美适配。该方案最终在华为涉密的海思电路场景（红区、黄区）完成了全指标测试，并拿到了正式的落地应用证明。

第二是大模型推理加速的攻坚。 我曾带队主攻华为诺亚方舟实验室的重点方向，解决大模型在 test-time scaling 场景下精度与速度不可兼顾的痛点。我负责核心思路输出与方案迭代，师弟负责代码落地。历时大半年打磨，该成果不仅成功获奖，还在华为盘古大模型上做了验证。在产业界真实场景下，我们实现了模型吞吐量提升 4 倍，且精度损失控制在 1% 以内的显著效果。

ZP：很多年轻AI研究者会选择继续读博、进大厂实验室，或者去海外发展。你为什么选择在这个阶段创业？

白寅岐：我一直更偏爱解决有实际价值的问题。在我眼里，Scaling Law（缩放定律）通过数据、算力和模型规模的持续增长来沉淀模型能力的过程，是非常优美的，而这个结论完全是从实践中得来的。

之所以放弃学术路线选择创业，主要有两个原因：

第一，在高校或实验室里，资源和场景都是有限的，实验成果往往止步于各种 Benchmark（评测基准）和论文。但哪怕你的指标超越了行业最优，如果无法在下游的智能系统中稳定落地，它就不是一个真正的成功。产品，才是技术价值最直观、最硬核的证明。

第二，世界模型的窗口期等不起。按照原本的规划，我应该继续深造读博。但世界模型是一个日新月异的新兴赛道，读博动辄需要五年。等我拿到学位，整个赛道的格局早就尘埃落定。

第三，合肥跟科大的独特资源支持和人才密度。科大优秀的算法人才跟技术落地能力是很迷人的，加上合肥的具身智能场景需求和政府资源强力支持，感觉是各种力量在耳边对我说冲吧

我意识到，想要以最快的速度去攻克世界模型，创业是比读博更有效的方式。

02 隐式+因果+缩放定律：如何走出区别于Sora、JEPA的第四条世界模型路

Z Tech｜专访中科大02年白寅岐：让隐式世界模型学会因果，做最快最省落地的世界模型

ZP：确定做世界模型后，你怎么思考技术路径？所谓”溯因”是什么？

白寅岐：世间所有状态变化，背后都有演化规律。我们的逻辑是：观测外在世界状态，反推内在演化规律，再用规律去预测未来。三个关键词——隐空间、因果、无标注视频的 scaling。这其实是我一路研究的延续：最早做符号学习，是显式映射、可解释性极强，但有结构性精度上限；后来做大模型，隐式拟合让精度大幅跃升，又在大量消融实验里验证了缩放定律；而因果，是我从这两段里提炼出的结合点——符号学习本就是为了从输入输出里挖出核心影响因子。把”隐式 + 缩放定律”的拟合力，和”因果”的可解释、可泛化结合起来，就是溯因式世界模型。

ZP：这套”因果”具体怎么理解？

白寅岐：是隐式因果。原因不显式定义，而是隐空间里的一组向量概率分布。流程分两步：预训练先学隐空间的基础规律，再用强化学习后训练做校准。纯自学的因果容易出现”歧义”——同一个原因被学成好几个向量，所以我们用人类已验证的物理规律（比如重力）把它们收敛成一个精准的嵌入向量。像重力、碰撞、动量传递这类概念，基本都能在隐空间里找到对应映射。但我认为这是包含关系：能对应人类可解释规律的只是一小部分向量，绝大部分对应的是人类目前还读不懂的世界底层结构。

ZP：World model有Understanding World和Predicting Future两类取向，也就是理解世界和预测未来。从这个划分上讲，你们的溯因式世界模型更偏向哪一类？

白寅岐：在我们看来，这两者并不是割裂的对立面，我们是通过增强理解来提升预测能力。非要说的话更偏理解——我们学因果，正是为了让未来演化得更好。两者都是目标，但做因果这件事本身，更偏向理解世界。

ZP：你怎么看待当下三条主流世界模型路线？也就是Sora代表的2D视频路线、World Labs/李飞飞团队的3D空间路线，以及Meta JEPA的隐空间路线？和白泽的溯因式路线具体有哪些异同？

白寅岐：我不太愿意去评判别人的路线——视频生成、3D 空间、隐空间表征，每条路都有自己的侧重和价值，也都有很优秀的团队在推进。我只说我们为什么这么选、它好在哪。我们的底座沿用了 JEPA 的隐空间建模逻辑；差异是额外补了一层因果学习：单纯的隐空间表征只能做特征抽象，叠加因果之后，模型才能更深地理解世界演化的底层规律，对未来状态的预测和场景预演更精准。再加上无标注视频的 scaling，合起来就是我们想要的——一条能用最快、最省的方式真正落地的路线。

JEPA的隐空间路线是我们最看好、也深受其启发的路线。LeCun 的核心思路是通过编码器将世界的冗余像素信息过滤掉，提炼核心特征映射到高维向量（隐空间）中，让所有的预测和学习都在简洁的表征空间内完成。对比 2D 模型动辄千卡、万卡的算力黑洞，隐空间预训练仅需上百张显卡就能完成，对初创团队极其友好。此外，其技术逻辑已被验证—— 利用高维向量去表征复杂世界，这在大模型领域已经被充分验证，是最适合建模高维物理世界的技术思路。

我们整体沿袭了 JEPA 的隐空间建模逻辑，把复杂世界抽象到简洁的表征空间内以降低建模复杂度。但核心差异在于，我们额外加入了“因果学习层”。单纯的隐空间表征只能完成特征的抽象，它知道“是什么”，但不知道“为什么”。而万物演化的海量视频中，本身就藏着因果规律（就像苹果落地暗藏重力原理）。

我们在 JEPA 的基础上，补齐了因果推理的短板。叠加因果逻辑后，模型能由果溯因，真正吃透世界演化的底层规律。这样一来，模型对未来状态的预测和场景预演就会极其精准、合理。在具身智能的后训练阶段，将动作标签映射到这个已经吃透因果的成熟演化空间里，效率和效果都会迎来质的飞跃。这就是我们区别于行业主流的全新路径。

ZP：引入因果之后，效果有可量化的提升吗？有小实验可以分享吗？

白寅岐：有一组小对照实验。我直接对标 V-JEPA-2，为保证绝对公平，完全保留它原生的编码器不动，只在预测器之前加一层因果学习模块，唯一变量就是”因果”。我们在物理规律理解数据集Physion++上的三个评测指标（模型输出与人类一致性对齐、与真实物理世界预演结果、预演未来质量）均超过 JAPA V2，展现更强物理理解能力。但我得说清楚：这只用了 8 张 A100、训练大半天，是前期快速消融，不足以证明整套架构全面超越 JEPA，只能说明在完全公平的对照下，因果模块确实在物理规律理解上体现出了优势——这给了我们继续深耕的信心。

Z Tech｜专访中科大02年白寅岐：让隐式世界模型学会因果，做最快最省落地的世界模型

ZP：如果模型训练时从没见过某条物理规则，还能泛化吗？

白寅岐：能，靠因果强化后训练。我们给模型大量初始状态，让它自己 rollout 未来轨迹，再用物理奖励校正：真实的重力下落有加速度、由慢变快，如果它推演成先快后慢，就给负向奖励。反复迭代，就把这条规律注入了隐空间，之后它一看到物体悬空，就会自主预判加速下落。这和大模型相通——预训练打通用基础，后训练用专项规则补强，哪怕预训练数据里缺了某条规律，也能在后训练补回来。不止物理规律，人类的行为先验（比如老人捡东西的动作）也能用同样的方式注入。

ZP：如果让你把核心优势压成一句话？

白寅岐：一句话——我们在做”最快、最省地把世界模型落地”这件实事。技术上，用海量无标注视频做基座、吃满数据规模红利，再用因果让模型理解世界运行的底层逻辑而不只是拟合画面，把单纯的”数据 scaling”转换成”世界演化能力的 scaling”；落到现实，它的意义是预训练告别动作标注、真机数据只需少量对齐，人工和数据成本都被压到最低。

04 搭建世界模型的金字塔式数据体系

ZP：回到训练数据层面，白泽正在搭建专属的世界模型训练数据体系，你们目前具体的数据规划是怎样的？为什么预训练、后训练和下游具身场景，需要采用完全不同类型的数据？

白寅岐：整体是金字塔阶梯式架构。预训练用大规模无标注视频，分两类——互联网海量的第三人称视频，和高速增长的第一人称交互视频，目前配比八比二，年底打算调到五比五，长期以第一人称为主。后训练用少量带标注的第一人称视频，加上贴合物理规律的原生视频和自研奖励模型自动打分。下游具身则靠仿真数据和真机数据互补。关键是：预训练这一层几乎零标注成本，真正花钱的真机数据只在最顶层少量使用——整套数据成本因此比依赖大规模标注的路线低得多。我们自己有真实工业场景，可以持续采到高质量真机数据，这是短期落地的核心场景。

ZP：你们会布局ego-centric数据，今年很多公司都在做。

白寅岐：自研采集 + 外部开源双向结合。工业场景我们自己采——合作工厂有近五千名一线工人，可以配套设备常态化采集，合作期内数据免费使用，这是我们独有的、贴合落地的高质量 ego 数据，但场景维度相对单一。

通用类第一人称数据，我们顺势等行业开源生态成熟后直接复用——目前业内对 ego 数据的采集热情很高，大量高质量开源数据集正在快速开放。我一直觉得，AI 创业不必所有环节都从零自建，行业共性的数据基建等成熟了再用，把精力聚焦在核心技术上。更重要的是，我们的路线本身对数据适配性强：主打无标注视频预训练，不依赖人工标注，对”数据稀缺、标注昂贵”的容错率很高。也是我们在数据层面的一大核心优势。

05 对标DeepSeek、OpenAI：白泽理想中的世界模型

ZP：你期待做成的世界模型是什么样的

白寅岐：四个要求：能理解物理因果（不只是统计相关）、能跨本体迁移（一套大脑驱动多类本体）、能闭环行动（实时、可纠错）、能少样本泛化（面对新工件、新场景不需要重新采海量数据）。这四条同时满足，才是我心里”真正的”世界模型。

ZP：你们会自己做机器人本体吗？

白寅岐：不会。我们把具身、硬件落地定位为核心验证场景，用来佐证世界模型的真实对接能力，但不是现阶段的主攻重心。基础世界模型的核心价值是通用推演能力，会被各类硬件和具身大脑厂商接入。只要我们在未来推演、世界规律理解上持续领先，单是输出高质量基础模型，就有足够的行业价值。

ZP：如果要做本体落地或合作，你们会如何处理模型和真实硬件之间的适配与验证？

白寅岐：不管是 JEPA、Sora 这类基础世界模型，核心价值都是通用基础能力，后续会被各类硬件厂商、具身大脑厂商接入，用来做未来场景预演和智能决策迭代。基础世界模型主打通用推演能力，赋能各类下游硬件场景。只要我们的溯因式世界模型在未来推演、世界规律理解上持续优于同行，单单输出高质量基础模型，就具备足够的行业价值。

当然，我们不会只做纯基础模型研发，未来也不会局限于基础模型赛道。如果我们迭代出的具身大脑能力足够优质，后续可以选择轻量化本地部署，搭配机器人硬件一体推出。现阶段我们的核心重心依然是打磨迭代具身世界模型本身。

ZP：你们是如何排序这些场景的落地优先级的呢？

白寅岐：所有场景优先级，全部依托基础世界模型的核心能力来定。下游落地思路以开放合作为主。所以各类具身、智驾等下游场景我们都会持续跟进、保持合作，但不会急于重资产下场。

ZP：最近几年世界模型成为AI领域非常热的关键词，也有人认为它存在泡沫。你怎么看这种关注度和泡沫争议？

白寅岐：首先，从资本市场来看，世界模型的热度确实非常高。但我认同黄仁勋前两天的演讲观点：可能大家现在觉得 AI 是泡沫，但过了三五年后再回头看，会明白这些不是泡沫，而是在为未来世界打下 AI 基础设施。

做世界模型，投再多钱，一旦突破了，带来的收益一定非常大。像马斯克、黄仁勋，他们也是因为实现了跨时代的技术突破，才造就了现在上万亿市值的公司。在 AI 时代，世界模型是学界和业界公认最前沿的领域。泡沫的意思是估值远大于真正价值，但我觉得不是。世界模型目前的价值是无穷大的。

ZP：如果拉长到5年甚至更长，白泽科技最终想成为一家什么样的公司？

白寅岐：我希望在世界模型领域，能对标 DeepSeek，甚至 OpenAI、Anthropic，做最头部的公司。这是目标，不是现状——但只有把目标定在这里，才知道自己能走多远。

ZP：你提到想发起一个中国世界模型开放联盟？

白寅岐：对，这是我特别想推动的一件事。世界模型这条路太大，不是一家公司能走完的，需要把高校、科研院所、做本体的、做数据的、做下游场景的力量都聚到一起。我希望能发起一个中国世界模型开放联盟，大家开放交流、共享数据和认知，一起把标准和生态做起来。说到底，我不想我们只是跟在别人后面陪跑——我更期待大家能在学术上充分交流、融合，在彼此启发里共同超越，真正做出属于我们自己的、能定义这条赛道的东西。

06 炉边闲话

ZP：从学生研究者转向公司负责人，你觉得自己最大的变化是什么？

白寅岐：真正看到了更多的世界。以前局限在实验室和工业界，讨论的都很学术；出来之后，很多商业的东西让我着迷，对我整个人是颠覆性的——怎么跟人交流、怎么管理团队、怎么让投资人对你做的事感兴趣。最底层的一点是：跟任何人交流，展现真实的自己就好。

ZP：这个时间点创业，学校跟老师支持吗？

白寅岐：都很支持我。科大给我最重要的东西不是某项具体技能，而是一种”凡事要回到第一性原理”的习惯。科大的训练特别重数理根基，逼着你不满足于”能跑通”，而要追问”为什么成立、边界在哪”。这种技术品味后来直接决定了白泽的路线选择。理论品味和工程洁癖这两件事，其实是同时在科大长出来的。

导师对我的影响，是研究态度上的——做真问题、不做表面新但本质空的工作。这一点在我做世界模型时体现得很直接：溯因式这条路一开始并不”性感”，但它解决的是真问题。

很感谢我的老师，很感谢实验室对我的栽培。我确实在实验室里面收获了很多东西，除了显性的成果，还有很多隐性的、思想上的成长。。

ZP：对你影响比较大的创业者是谁？

白寅岐：创业者里面我最敬佩马斯克。他能够永远对自己保持 10000% 的信任，在所有人都不信任他的时候，依然坚持去做他觉得正确的方向。我觉得这是伟大创业者该有的底层信仰和底层坚持。

ZP：你最喜欢的一篇AI论文是哪篇？

白寅岐：Attention Is All You Need。

ZP：你目前最常用的AI工具是什么？

白寅岐：Codex。

ZP：除了科研之外，你还有什么兴趣爱好吗？

白寅岐：打篮球，有时候也会健身。我还挺喜欢通过打篮球降低皮质醇level哈哈哈

ZP：用一句话形容你心目中的AGI是什么？

白寅岐：我觉得，让AI能够理解世界，像人一样思考并解决问题，就是我心目里的AGI。

文章来自于”Z Potentials”，作者 “武静静”。

联系方式

赞赏支持

累计赞赏 0 积分 0 人支持

登录后赞赏

💬 发表评论取消回复

要发表评论，您必须先登录。

Z Tech｜专访中科大02年白寅岐：让隐式世界模型学会因果，做最快最省落地的世界模型

详细介绍

导语

Highlight

01 从科大青年学者到世界模型创业者：一位00后AI研究者的技术信仰与选择

02 隐式+因果+缩放定律：如何走出区别于Sora、JEPA的第四条世界模型路

04 搭建世界模型的金字塔式数据体系

05 对标DeepSeek、OpenAI：白泽理想中的世界模型

06 炉边闲话

联系方式

赞赏支持

💬 发表评论 取消回复

💬 发表评论取消回复