2025年10月24日程序员节当天,智元机器人正式发布了全球首个无需代码、零门槛的机器人内容创作平台——「灵创」平台。该平台秉持“让创作更简单,让表达更灵动”的核心理念,首次深度整合AI动作捕捉、云端模仿学习与多模态编排技术,为普通用户解锁了人形机器人内容创作的无限潜力。
无需编程基础、无需专业设备,用户只需上传一段人类动作视频,就能借助「灵创」平台完成从真人表演到机器人精准复刻的端到端转化。从此,每个人都可以成为机器人的“导演”与“编舞师”,轻松打造出专属的机器人表演作品。
长期以来,人形机器人的动作开发依赖复杂的流程——包括专业动捕设备、算法建模、强化学习训练与工程调参,技术壁垒极高。绝大多数终端用户因缺乏编程或机器人控制知识,难以真正参与内容创作。
“灵创”平台的出现彻底打破了这一障碍。借助AI视觉动作提取、智能重定向算法以及高效的云端模仿学习框架,该平台能够自动将人类行为转化为机器人的控制策略。不管是舞蹈、武术,还是日常的交互动作,用户只要用一部手机拍摄视频并上传,就能让机器人“掌握”这些动作并精准地表现出来。
值得关注的是,「灵创」平台的动作模仿功能,不仅可以完成肢体动作复刻,未来也可以实现手指级别精细动作的模仿与展现。
除根据视频模仿生成动作外,「灵创」平台还为用户提供了“语音演绎”功能,该功能为用户提供了音频上传、在线录音和语音合成三种模式。
用户上传文本内容或音频后,“语音演绎”功能会智能识别语义,并利用多模态大模型生成与语音内容匹配的机器人肢体动作与表情,从而实现自然拟人表达。
“语音演绎”功能的语音合成赋予用户定制音色与情绪的能力,系统配备了男性、女性及自定义等多种音色类型,用户可自主挑选自然鲜活的音色和情绪表达,从而确保机器人的语气更契合应用场景,增强机器人在动作、语音与表情演绎过程中的情感传递效果与沉浸体验。
在机器人的商业表演、商场导购以及商务接待等场景中,情感力与沉浸感是极为关键的要素。不仅如此,这些场景往往还要求机器人能够完成连贯且持续的长程展示任务,而这就需要机器人拥有多动作组合的创作能力,智元机器人「灵创」平台的产品团队将这种能力称为“机器人故事片”式的创作。
为了提升用户创作“机器人故事片”的能力,「灵创」平台打造了动作混剪、组合与故事线编排功能,帮助用户做“导演”,让用户像剪视频一样,完成长程表演中的叙事化动作设计。
该功能支持用户利用多个动作,像剪辑视频一样编排机器人声音、动作与表情,精准控制每一帧动作节奏,为机器人设计丝滑过度的连续动作组合展示,堪称机器人动作设计领域的“剪映”。
目前,商业演出服务是机器人较为普遍的落地应用场景之一,在实际表演过程中,常常需要多台机器人相互配合来完成任务。「灵创」平台的“设备联动与群控管理”功能,在传统机器人批量协同完成统一表演的基础上,能够支持多设备、多样化动作任务的一键下发,进而实现多台机器人的群编群控,让它们分角色以不同的动作、语音和表情协同进行演绎。
除了借助视频、音频辅助用户开发动作外,为了提高用户的创作效率和便捷性,「灵创」平台还为用户配备了官方素材库,其中包含11类场景下的180多套标准化动作以及140套表情模板,用户能够直接从素材库中调用动作和表情来进行动作组合创作。
不仅如此,用户利用动作模仿、语音演绎设计的创意作品,还可以一键分享到创意广场,让创意灵感被更多用户发现、使用。
2025年,人形机器人迎来了突破性进展,在行为表达能力上愈发丰富,从拟人化的步态、舞蹈、武术到各类特技动作都有精彩呈现。智元机器人推出的「灵创」平台,向大众开放接口,重新定义了机器人内容创作的形式与效率,这将进一步丰富机器人的行为表达。
智元机器人「灵创」平台已经适配智元旗下的灵犀 X2 机器人,未来将进一步扩展至远征A2等多类型、多形态机器人产品。
智元灵犀X2机器人是智元在半尺寸人形机器人领域布局的核心产品,目前已实现量产交付,预计2025年交付量将达到数千台。依托「灵创」动作创作平台,该机器人已在文娱商演、门店接待、科研教育等场景成功落地并高效应用,助力人形机器人从“技术展示”阶段向“规模应用”阶段迈进。感兴趣的读者可访问灵创平台官网进一步了解:linkcraft.agibot.com。
据智元透露,除了开放技能创作平台「灵创」,智元还将于下个月上线一个机器人的个性化性格定义平台「灵心」,从能力到个性,全面赋能智能体的“人格化”成长,真是好戏连台,令人期待!