模型 - 智狐AI导航

Fashion

Fashion-VDM是一款由谷歌和华盛顿大学合作研发的虚拟试穿技术，利用视频扩散模型生成人物穿着指定服装的高质量试穿视频，具有高保真度、时间一致性及强大的服装细节还原能力。它结合了扩散模型架构、分割分类器自由引导与渐进式时间训练策略，并在图像与视频数据联合训练的基础上实现了高效稳定的视频生成过程。

AI项目与工具 2025年06月12日 58 点赞 0 评论 1027 浏览

GigaTok

GigaTok 是一款基于语义正则化的高参数视觉分词器，支持自回归图像生成，具备优异的图像重建与生成能力。通过一维架构和非对称扩展策略，实现高效计算与稳定训练。适用于图像生成、编辑、数据增强及多模态应用，具有广泛的技术拓展性。

AI项目与工具 2025年06月11日 74 点赞 0 评论 1026 浏览

NotebookLlama

NotebookLlama是一款基于Meta开发的开源工具，能够将PDF文档自动转换为高质量播客内容。它通过LLaMa模型完成PDF预处理、文本转播客脚本、增加戏剧性元素以及文本转语音合成等步骤，无需人工干预即可生成专业水准的播客。NotebookLlama提供了详细的教程和操作指南，并支持多种应用场景，包括教育、新闻、企业培训和有声书制作等。

AI项目与工具 2025年06月12日 29 点赞 0 评论 1026 浏览

AutoDroid

AutoDroid-V2是由清华大学人工智能产业研究院开发的基于小型语言模型（SLM）的移动端GUI自动化工具，支持多步脚本生成与执行，提升任务完成效率并减少对云端模型的依赖。其核心功能包括自动化UI操作、代码生成与执行、应用文档生成，适用于日常辅助、办公、测试、智能家居及医疗等多个场景，具有较高的实用性和技术前瞻性。

AI项目与工具 2025年06月12日 61 点赞 0 评论 1025 浏览

CodeArena

CodeArena是一个在线平台，用于实时比较多个大型语言模型（LLM）的代码生成能力。它通过实时渲染和排名机制，帮助开发者评估LLM的性能，包括代码的可读性、效率和准确性。CodeArena集成了开发者工具，支持企业选型、学术研究、编程教育和技能提升等多种应用场景。

AI项目与工具 2025年06月12日 92 点赞 0 评论 1020 浏览

MiniCPM 4.0

MiniCPM 4.0是面壁智能推出的高效端侧大模型，包含8B和0.5B两种参数规模。其采用创新稀疏架构和三值量化技术，实现模型体积缩小90%并保持高性能。自研CPM.cu推理框架在极限场景下可提升220倍速度，支持多种开源框架部署，并适配主流芯片。具备高效双频换挡机制、多平台适配和多种版本选择，适用于智能辅导、医疗辅助、客服、游戏剧情生成等场景。

AI项目与工具 2025年06月11日 59 点赞 0 评论 1019 浏览

unsloth

Unsloth 是一款高效开源的LLM微调工具，通过优化计算流程和GPU内核设计，大幅提升训练速度并降低内存占用。支持多种主流大模型，提供动态量化、长上下文支持等功能，适用于学术研究、企业应用及资源受限环境中的模型优化。

AI项目与工具 2025年06月12日 44 点赞 0 评论 1018 浏览

Piece it Together

Piece it Together 是一款基于AI的图像生成工具，能够将零散的视觉元素整合成完整概念图像，并智能补全缺失部分。依托IP+空间和IP-Prior模型，支持语义编辑与文本控制，提升图像生成的准确性和多样性。适用于角色设计、产品开发、艺术创作等多个领域，助力创意探索与设计验证。

AI项目与工具 2025年06月12日 41 点赞 0 评论 1017 浏览

TestSprite

TestSprite 是一款基于 AI 的自动化测试平台，支持后端 API、前端 UI、数据及 AI 模型的测试，能够自动生成测试计划、执行测试并输出详细报告。其核心优势在于提升测试效率、减少人工干预，并适用于多种测试场景，如软件发布前验证、CI/CD 集成、生产环境监控等，帮助企业提升软件质量与交付速度。

AI项目与工具 2025年06月12日 39 点赞 0 评论 1015 浏览

ChatTTSPlus

ChatTTSPlus 是一款基于深度学习的语音合成工具，它通过 TensorRT 技术实现了显著的性能提升，同时支持语音克隆、模型压缩与加速等功能。该工具不仅适用于桌面端，还能够部署于移动设备，满足多种应用场景需求，包括有声读物制作、语言学习辅助、客户服务及娱乐等领域。 ---

AI项目与工具 2025年06月12日 13 点赞 0 评论 1015 浏览

模型

首页

模型

列表

默认

浏览次数

发布日期