生成 - 智狐AI导航

Luma Photon

Luma Photon是一款由Luma AI开发的先进图像生成工具，具备高分辨率图像生成、自然语言理解及多图像参考等功能，支持个性化和多轮迭代操作。它能显著提升设计师、电影制作人等专业人士的创作效率，广泛应用于影视制作、游戏开发、广告设计等多个领域，同时保持较低的成本投入。

AI项目与工具 2025年06月12日 66 点赞 0 评论 634 浏览

InstructMove

InstructMove是由东京大学与Adobe合作开发的图像编辑模型，基于视频帧对变化学习如何根据指令进行图像操作。它能够执行非刚性编辑、视角调整和元素重排等任务，同时支持精确的局部编辑。该模型采用真实视频数据训练，提升编辑自然性与真实性，适用于影视、广告、设计等多个领域。其技术基于多模态语言模型和扩散模型，结合掩码和ControlNet等控制机制，实现灵活高效的图像编辑。

AI项目与工具 2025年06月12日 21 点赞 0 评论 634 浏览

悟道大模型

北京智源研究院开发的一系列超大规模智能模型系统，悟道大模型旨在在语言处理领域达到或超越国际先进水平。

Ai平台模型 2025年06月05日 62 点赞 0 评论 634 浏览

VideoPhy

VideoPhy是一款由UCLA和谷歌研究院联合开发的基准测试工具，旨在评估视频生成模型的物理常识能力。它包含688条描述性字幕，通过人类和自动评估方式，衡量生成视频是否符合物理规则。VideoPhy不仅揭示了现有模型的不足，还推出了自动评估工具VideoCon-Physics，以推动模型性能的提升。其应用场景广泛，包括视频生成模型开发、计算机视觉研究、教育与培训以及娱乐产业等。

AI项目与工具 2025年06月12日 84 点赞 0 评论 634 浏览

DashPlayer

一款专为英语学习者打造的视频播放器，DashPlayer 助您沉浸真实语境，轻松提升英语水平。

教育学习 2025年06月05日 48 点赞 0 评论 634 浏览

OpenVoice

OpenVoice是一款由MyShell开发的免费开源AI语音克隆工具，其主要功能包括精准的音色和音调克隆及灵活的语音风格控制。该工具能够捕捉并复制不同语言或口音的音色，生成自然流畅的语音，并支持零样本跨语言语音克隆。开发者可以通过GitHub项目地址进行本地安装和运行，也可以通过Lepton AI、MyShell或HuggingFace提供的在线演示体验该工具。

AI项目与工具 2025年06月12日 49 点赞 0 评论 634 浏览