MIT 研究人员开发了一套新的计算框架,使科学家能够在人工智能代理中模拟并研究视觉系统在长期演化过程中的形成机制。
由于无法回到过去直接观察自然界中不同视觉系统所经历的环境压力,研究团队通过这一框架,在虚拟环境中让“具身 AI 代理”在多代演化中逐步形成“眼睛”并学习如何感知世界。研究人员可以通过调整环境结构和任务类型(例如导航、寻找食物或区分物体),来构建不同的演化路径,从而探究不同视觉结构形成的原因。
借助这一框架,研究人员发现,不同任务会对视觉系统的演化方向产生显著影响。例如,当 AI 代理的主要任务是空间导航时,更容易演化出由多个感光单元组成的复眼结构,类似昆虫或甲壳类动物的眼睛;而当任务以物体识别为主时,代理则更倾向于形成类似相机的视觉结构,具备虹膜和视网膜等特征。
研究人员表示,该框架有助于回答一些在现实实验中难以验证的“假设性问题”,并可为机器人、无人机或可穿戴设备中传感器与相机的设计提供参考,在性能、能耗与制造约束之间进行权衡。
该研究由 MIT 媒体实验室牵头,联合多所高校研究人员共同完成,相关成果发表于《Science Advances》。
在方法层面,研究团队将相机系统的关键组成部分(如传感器、镜头、光圈与处理单元)转化为 AI 代理可以学习和调整的参数,并通过演化算法在不同环境约束下进行组合。代理在生命周期内使用强化学习完成任务,并在代际迭代中通过类似遗传编码的方式对视觉系统进行调整。
研究结果显示,环境约束和任务目标会共同塑造视觉系统的结构。例如,在传感器数量受限的情况下,单纯增加神经处理能力并不一定带来感知效果的提升,这提示在现实工程设计中需要考虑资源配置的平衡。
未来,研究人员希望利用该框架探索特定应用场景下更合适的视觉系统设计,并引入大语言模型,使用户能够更直观地提出问题并拓展研究空间。









