AI

VITA

VITA-Audio 是一款开源的端到端多模态语音大模型,具备低延迟、高推理效率和多模态交互能力。其核心创新包括轻量级 MCTP 模块和四阶段渐进式训练策略,使模型在语音识别、文本转语音和口语问答等任务中表现优异。支持实时对话、智能客服、教育辅助、医疗辅助及内容创作等多种应用场景,适用于各类语音交互系统。

100+ AI Prompts

一个有组织的关于ChatGPT, Dall-e, Midjourney和Stable Diffusion的提示板,任何人都可以使用或从他们自己的提示中获得灵感。

I2V

I2V-01-Live是一款基于深度学习技术的图生视频工具,可将静态二维图像转化为动态视频,具有高度流畅的动作表现和多样化的艺术风格适配能力。其核心功能包括动态呈现、动作效果增强及稳定的表情管理,广泛应用于社交媒体、广告营销、动画制作、教育培训以及游戏开发等领域。

HRAvatar

HRAvatar是由清华大学联合IDEA团队推出的单目视频重建技术,能够从普通单目视频中生成高质量、可重光照的3D头像。它采用可学习的形变基和线性蒙皮技术,结合精确的表情编码器和物理渲染模型,实现高精度重建和实时渲染(约155 FPS)。支持材质编辑、跨视角渲染和动画化,适用于数字人、虚拟主播、AR/VR、游戏开发和影视制作等领域。

妙问

妙问是腾讯广告推出的AI营销辅助工具,支持7×24小时在线服务,覆盖广告主从筹备到复盘的全流程需求。其核心功能包括快问快答、深度分析、移动办公等,能提供实时数据支持、爆款素材建议、广告审核答疑及多账户管理。适用于广告咨询、投放优化、效果分析及移动管理等场景,提升营销效率与决策质量。</p>

Smartcat

Smartcat 是一款先进的AI翻译平台,提供自动化的翻译服务和本地化解决方案。它集成了AI翻译、计算机辅助翻译(CAT)工具及翻译管理系统(TMS),支持超过280种语言和50多种文件格式。Smartcat通过内置市场连接全球翻译专家和客户,提供高效、准确的翻译服务。此外,该平台还配备了项目管理和自动化工作流工具,帮助企业简化翻译流程,加快内容的全球化进程。

Edicho

Edicho 是一种基于扩散模型的图像编辑工具,能够在多图像间实现一致性编辑,无需额外训练。其核心技术包括 Corr-Attention 注意力模块和 Corr-CFG 去噪策略,通过显式图像对应关系提升编辑质量与一致性。适用于图像修复、风格转换、内容创作、医学影像增强等场景,具备良好的兼容性与扩展性。

AgentSociety

AgentSociety是由清华大学开发的基于大语言模型的社会模拟平台,通过构建具有“类人心智”的智能体,模拟复杂的社会行为与现象。平台支持城市环境建模、大规模社会模拟和科研工具集成,适用于社会舆论传播、政策评估、社会极化分析及灾害响应研究。其技术特点包括异步模拟架构、分布式计算和MQTT通信,具备高度可扩展性和实时交互能力。

Toucan

Toucan是一个全面的人工智能...

酷家乐AI

支持免费使用,没有专业设计软件能力,也能快速制作AI