模型

Takin AudioLLM

Takin AudioLLM是一套由喜马拉雅Everest团队研发的语音生成模型,包含文本转语音(Takin TTS)、音色转换(Takin VC)及声音风格变换(Takin Morphing)。它采用最新大型语言模型技术,可生成接近真人的高质量语音,并支持个性化定制与零样本学习。该工具广泛应用于有声书制作、虚拟助手、电影配音等领域,具有音色精准、风格多样等特点。

LegoGPT

LegoGPT是一款由卡内基梅隆大学开发的AI工具,可根据文本描述生成稳定、可组装的乐高积木模型。它结合自回归语言模型与大规模数据集,支持自动纹理上色、物理稳定性验证及手动或机器人组装。该工具能有效提升创意设计效率,适用于教育、玩具开发及自动化生产等多个场景。

左医医疗大语言模型

左手医生通过开放平台赋能医疗健康行业,为医疗机构、信息化厂商、医药企业、连锁药店、健康管理机构、智能硬件等合作伙伴提供多种类型的高质量智能医生服务。

MatterGen

MatterGen是由微软开发的生成式AI模型,专注于无机材料的设计与生成。它通过扩散过程逐步优化原子结构,生成稳定、多样化且符合特定性能要求的材料。支持化学组成、磁性、电子和机械性能等多维度约束,适用于逆向材料设计,提升新材料研发效率。已应用于能源、催化、电子等领域,推动材料科学进步。

商汤日日新大模型

商汤日日新大模型体现了商汤科技在人工智能领域的深入研究和创新能力。通过结合大模型和大算力,商汤科技致力于提供全面的AI解决方案,推动通用人工智能技术的发展,并在多个应用...

autoMate

autoMate是一款基于AI与RPA技术的本地化自动化工具,用户可通过自然语言描述任务,无需编程即可完成复杂操作。支持本地部署,确保数据安全,兼容主流大模型,具备智能学习能力。适用于数据处理、报告生成、邮件自动化、跨平台流程管理及日常任务调度等场景,提升工作效率并释放创造力。

Stable Diffusion整合包

Stable Diffusion整合包是一款专为新手用户设计的本地部署解决方案,由B站UP主秋葉aaaki开发。它包含Stable Diffusion WebUI、必要的运行环境、预装模型及常用插件,使得用户无需复杂的技术背景就能便捷地安装和使用AI绘画工具。最新版本支持自动更新和多版本切换,并提供了丰富的预装资源和汉化界面,极大地简化了环境配置过程。

云锦天章

云锦天章是一款基于DCFormer架构的通用大模型,能够高效地进行文字扩写、缩写和风格变换,具备问答、数学、编程等基础能力。它通过动态组合多头注意力机制,大幅提升模型效率并降低能耗,适用于小说创作、教育辅导、内容生成、企业服务及娱乐等多个领域。

FantasyID

FantasyID是由阿里巴巴集团与北京邮电大学联合开发的视频生成框架,基于扩散变换器和3D面部几何先验,实现高质量、身份一致的视频生成。其通过多视角增强和分层特征注入技术,提升面部动态表现,同时保持身份稳定性。支持多种应用场景,如虚拟形象、内容创作和数字人交互,具备无需微调的高效生成能力。

WeDraw

WeDraw专注于人工智能AI绘画和大模型语料数据合成领域,是一支充满激情和创意的团队。