生成

YuE

YuE 是一款由香港科技大学与 Multimodal Art Projection 联合开发的开源 AI 音乐生成模型,支持多语言和多种音乐风格,如流行、金属、爵士、嘻哈等。通过语义增强音频分词器、双分词技术和三阶段训练方案,解决长上下文处理与音乐生成难题,生成结构连贯、旋律优美的歌曲。模型完全开源,用户可自由使用和定制,适用于音乐创作、影视配乐、游戏音效及社交媒体内容制作等多个场景。

ReadPo

ReadPo是一款基于AI技术的知识创作辅助工具,集成了内容聚合、智能分析、写作指导等功能,支持从多种渠道获取信息,并将其转化为高质量内容。其特色包括自动评分排序、主题阅读支持、个性化定制选项以及Markdown转图文海报功能,广泛应用于公众号运营、博客写作、新闻编辑等领域,旨在提升内容生产效率和质量。

eeChat

简洁易用的大模型本地部署工具,支持开源模型 DeepSeek-R1, DLlama 3, Phi-4, Mistral, Gemma 3 等模型的本地化部署,专注于数据安全、隐私保护和高效的AI对话体验。

KeySync

KeySync是一种高分辨率口型同步工具,由帝国理工学院和弗罗茨瓦夫大学联合开发。其采用两阶段生成框架,结合掩码策略和视频分割模型,实现音频与唇部动作的精准对齐。支持高清视频生成,具备遮挡处理、减少表情泄露等功能,在视觉质量、时间连贯性和同步精度上优于现有方法,适用于自动配音、虚拟形象、视频会议等多场景应用。

KAPWING

KAPWING是一款基于AI技术的在线视频编辑平台,提供从视频生成到编辑的一站式解决方案。其核心功能涵盖AI视频生成器、文档转视频、文本转语音、字幕生成及高级编辑工具,支持用户轻松创建和定制视频内容。此外,KAPWING还具备团队协作能力,适合教育、企业宣传及内容创作等多个应用场景。

AI拥抱生成器

一款可以将您的静态图像轻松生成两人拥抱的的动态视频AI工具。只需点击几次,您就可以自定义拥抱视频的风格、动作和氛围。

In3D

In3D把人变成逼真的化身,使用手机摄像头在一分钟内为您的元宇宙、游戏或应用程序创建逼真且可自定义的头像

PHOTOG

PHOTOG 是一款专业的AI图像生成工具,能够将真实物品无缝嵌入任意场景,提供高精度的真实感和细节表现。其功能涵盖自由模式、精确模式、局部重绘、参数调整、描述语生成及商品库上传等,适用于家居装饰、电子商务、室内设计、房地产及产品营销等多个领域,助力用户高效完成创意设计和预决策。

AgentRefine

AgentRefine 是由北京邮电大学与美团联合开发的智能体合成框架,采用“精炼调整”方法提升基于大语言模型的智能体在多样化任务中的泛化能力。它通过轨迹中的观察实现错误纠正与自我优化,增强智能体在复杂环境中的适应性和鲁棒性。该框架支持多样化推理路径,广泛应用于自动化决策、游戏 AI、代码生成及自然语言处理等领域。

AvatarGO

AvatarGO是由南洋理工大学、上海AI Lab和香港大学联合开发的AI框架,能够根据文本描述生成高质量的4D人体与物体交互场景。其核心在于利用LLM引导的接触重定位、空间感知的分数蒸馏采样和运动优化技术,实现精确的接触识别与动画生成,有效解决穿透问题。支持多种人物与物体组合,适用于虚拟导购、展厅讲解、VR/AR内容创作等多个领域。