模型 - 智狐AI导航

EliGen

EliGen是由浙江大学与阿里巴巴集团联合开发的实体级可控图像生成框架，采用区域注意力机制实现对图像中实体的精确控制，支持多实体修复、风格化生成及交互式编辑。基于50万高质量注释样本训练，具备强大泛化能力，适用于虚拟场景、角色设计、数据合成及产品展示等场景。

AI项目与工具 2025年06月12日 97 点赞 0 评论 802 浏览

天壤小白

天壤小白是基于自研语言大模型的AI应用开发平台，无需代码开发，即可快速、灵活地搭建个性化的AI应用。

Ai平台模型 2025年06月05日 76 点赞 0 评论 802 浏览

Perplexity

Perplexity AI 是一款对话式AI搜索引擎，通过自然语言处理技术，能够从多种来源收集信息并提供准确答案。它支持用户通过聊天方式进行提问，确保信息来源可靠，并适用于多种职业背景的用户。与传统搜索引擎相比，Perplexity AI 提供了简洁无广告的体验和更高效的搜索结果。

AI项目与工具 2025年06月12日 11 点赞 0 评论 802 浏览

Playground v3

Playground v3是一款基于大型语言模型（LLM）的文本到图像生成工具，具备240亿参数量的潜扩散架构（LDM），能够精准理解和生成复杂的图像内容，支持RGB颜色控制和多语言文本生成。其核心功能包括文本到图像生成、图形设计、RGB颜色控制和多语言支持，广泛应用于设计、内容创作、游戏开发、广告等多个领域。

AI项目与工具 2025年06月12日 52 点赞 0 评论 803 浏览

TokenVerse

TokenVerse 是一种基于扩散模型的多概念图像生成工具，支持从单图或多图中解耦并组合视觉元素，如物体、材质、姿势等。通过优化调制空间，实现对复杂概念的局部控制，无需微调模型即可生成个性化图像，适用于创意设计、艺术创作和内容生成等多种场景。

AI项目与工具 2025年06月12日 38 点赞 0 评论 803 浏览

Bing Video Creator

Bing Video Creator是微软推出的AI视频生成工具，基于OpenAI的Sora模型，用户可通过输入文本描述快速生成5秒短视频。支持9:16格式，提供快速模式和标准模式，初始有10次免费生成机会。功能包括视频生成、多种风格选择、视频存储和分享等，适用于广告、教学、创意和个人娱乐等多种场景。

AI项目与工具 2025年06月11日 80 点赞 0 评论 803 浏览

Amazon Nova是亚马逊云服务推出的一套强大的AI基础模型系列，涵盖文本、图像和视频生成等多个领域。其核心产品包括Amazon Nova Micro（专注文本处理）、Amazon Nova Lite（多模态低成本模型）、Amazon Nova Pro（多模态平衡型模型）、Amazon Nova Premier（复杂推理模型）、Amazon Nova Canvas（图像生成模型）和Amazon

AI项目与工具 2025年06月12日 74 点赞 0 评论 804 浏览

LatentSync

LatentSync是由字节跳动与北京交通大学联合研发的端到端唇形同步框架，基于音频条件的潜在扩散模型，无需中间3D或2D表示，可生成高分辨率、动态逼真的唇同步视频。其核心技术包括Temporal Representation Alignment (TREPA)方法，提升视频时间一致性，并结合SyncNet监督机制确保唇部动作准确。适用于影视制作、教育、广告、远程会议及游戏开发等多个领域。

AI项目与工具 2025年06月12日 95 点赞 0 评论 804 浏览

Bark

Bark是一款开源的文本到音频转换模型，由Suno AI开发，能够生成逼真的多语言语音及多种音频类型，包括音乐和背景噪音，并支持非语言交流的声音。该模型提供预训练模型，适用于研究和商业用途。其主要功能涵盖文本到音频转换、多语言支持、音频多样性和非语言交流模拟。Bark在多语言内容创作、音频内容生成和非语言交流场景中具有广泛应用。

AI项目与工具 2025年06月12日 28 点赞 0 评论 804 浏览

Mind GPT

Mind GPT-3o是一款由理想汽车推出的大规模多模态端到端人工智能模型，集成了语音、视觉与语言理解技术，具备记忆、规划、工具集成及表达能力。它不仅能理解复杂信息，还能提供个性化服务，如智能驾驶辅助、家居设备控制、日程管理和健康咨询等。通过强化逻辑推理与上下文理解，该模型实现了从感知到表达的智能化跨越，为用户提供全面的支持。

AI项目与工具 2025年06月12日 65 点赞 0 评论 804 浏览

模型

首页

模型

列表

默认

浏览次数

发布日期