Meta出走华人创业团队, 种子轮800万美元, 要打造视觉AI记忆大脑

  • 2025-07-26 07:35:17
  • 513

机器之心报道

机器之心编辑部

大家都在关注硅谷 AI 领头羊们的抢人大戏,尤其是 Meta 近期又挖去了三位来自谷歌的 IMO 金牌研究者。

虽然说小扎(扎克伯格)铆足了劲儿要重振 Llama 雄风,正如火如荼的进行人才大引进。

但是吧,挖进去的人在 Meta 显山露水还需要一段时间,而从 Meta 离开的人的创业成果已经崭露头角了。

Dr. Shawn Shen,联合创始人兼首席执行官(左);Ben (Enmin) Zhou,联合创始人兼首席技术官(右)。

由前 Meta Reality Labs 顶尖科学家团队创立的 AI 研究实验室 Memories.ai,正式宣布完成 800 万美元种子轮融资。本轮融资由 Susa Ventures 领投,三星风投(Samsung Next)、Fusion Fund 等知名机构跟投。

Memories.ai 团队已经在大模型领域完成了一项重大的突破成果,剑指 AI 系统的「记忆缺失」问题,为视觉模型创造了强大的「记忆大脑」。

「最强大脑」

众所周知,大模型是标标准准的「金鱼记忆」。

比如,大多数 AI 系统都缺乏对历史画面的记忆,难以理解前后之间的关联。

就像我们经常开的玩笑,「记忆是个先进先出栈」,只不过大模型的栈容量似乎总是不够用。

这种「金鱼记忆」限制了它们在需要深入理解场景和动态变化的应用中发挥作用,尤其是在视频密集型任务里表现不佳。

为了彻底解决这个问题,Memories.ai 通过其核心创新 —— 大视觉记忆模型(LVMM),为 AI 系统引入了一个革命性的视觉记忆层。

该模型突破了传统 AI 在视频处理中仅限于片段式分析的范式,转而能够持续捕获、存储和结构化海量的视觉数据,从而使 AI 模型能够:

永久保留上下文信息: 从孤立的帧转向对事件因果链的深度理解。

精准识别时序模式: 实现对人脸、物体和行为在时间轴上的持续追踪和识别。

智能对比分析: 快速对比新旧视觉信息,有效识别变化和异常。

该平台把原始视频转化成可搜索、带上下文关联的数据库,让 AI 系统具备类似人类的持续学习能力,给 AI 系统配备了无限视觉记忆的「最强大脑」。这一突破让 AI 在理解视频和实际应用方面,迈出了里程碑式的一步。

该团队的大视觉记忆模型不仅在多个视觉理解任务中刷新了 SOTA 基准,更提供了一种全新的视角来解决复杂视觉信息检索与理解的挑战。

这些结果充分证明了模型在视频分类、视频检索和视频问答领域的「卓越性能」。

尤其在视觉记忆检索方面,能够高效处理那些需要大规模内容检索作为辅助参考的复杂查询,从而显著提升了模型的应用广度与深度。

「巨大潜能」

LVMM 技术在多个关键领域展现出巨大的应用潜力,其核心优势在于:

时间跨度无限制: 能够处理并记忆数月甚至数年的视频数据。

上下文深度理解: 不仅识别物体,更能理解事件的因果链和时序模式。

高效检索与分析: 将原始视频转化为可搜索数据库,实现秒级检索和分析。

该团队已与多个领域的合作伙伴展开合作,推动 LVMM 技术的应用落地:

安防安全: 显著提升监控录像的检索效率,在数秒内搜索数月的数据。

媒体娱乐: 实现对数十年内容库中特定场景或视觉元素的即时查找。

市场营销: 对数百万社交视频进行深度情感和提及分析,捕捉新兴趋势。

消费电子: 为下一代移动体验引入强大的视觉记忆能力,多家手机公司,如三星已成为首批合作对象之一。

Memories.ai 联合创始人兼首席执行官沈博士强调:「人类的智慧源于丰富的、相互关联的视觉记忆。我们的使命是赋予 AI 这种深度的情境感知能力,以共同构建一个更安全、更智能的世界。」

「便捷交互」

为了让用户更直观地体验 LVMM(大视觉记忆模型)的强大能力,该团队已将核心技术通过 API 接口全面开放,并同步推出直观、可交互的网页应用。用户可以便捷地上传视频或接入现有视频库,实现快速、精准的内容检索与深度分析。

借助毫秒级精度的检索引擎,在视频问答场景中展现了卓越的视频帧级引用能力,真正实现了对视频的多模态深度解析。

还有一系列的 Demo Agents,展示了模型在不同场景下的应用能力,例如:

Video Creator 对话式视频创作助手,基于全球首个大视觉记忆模型,通过可自由编辑的提示词模板,仅用简单对话即可生成多剪辑高质量视频。

Video Marketer 是一个基于大视觉记忆模型的智能营销工具,依托海量视频数据,能即时洞察 TikTok 的爆款趋势、热门开场白和头部网红策略,助力高效实现社交视频营销。

这些 Demo Agents 不仅是技术能力的展示,更是探索未来应用的起点。

如果你是一家公司,正被海量视频数据淹没;或者是一位对视觉记忆与智能交叉点着迷的研究者;又或者只是好奇当人工智能拥有记忆之后会变成什么样 —— 欢迎访问 https://memories.ai。