场景 - 智狐AI导航

Boow

Boow-VTON是一种基于先进图像生成技术和数据增强方法的虚拟试衣技术，无需精确遮罩即可实现高质量试穿效果。该工具通过试穿定位损失和注意力机制，精准识别试穿区域并确保服装自然贴合人体，支持多服装试穿且操作简便。其应用场景包括在线购物、时尚零售、个性化推荐、社交媒体互动及服装设计等多个领域，具有广泛的商业应用价值。

AI项目与工具 2025年06月12日 49 点赞 0 评论 744 浏览

DNA-RENDERING数字人库

DNA-Rendering是一个具有高多样性和高保真度的神经演员渲染库，它为广泛的研究任务提供了丰富的数据和高质量的注释。

Ai视频生成 1970年01月01日 0 点赞 0 评论 744 浏览

Klap

Klap是一款利用AI技术的视频编辑工具，主要功能包括将长视频快速转换为适合社交媒体平台的短视频、智能场景分析、自动裁剪与布局优化、多语言字幕生成等。它支持一键分享至各大社交平台，帮助用户提高内容传播效率。适用于个人、品牌及教育机构等多种场景。

AI项目与工具 2025年06月12日 40 点赞 0 评论 746 浏览

秒祝

它聚焦于视频AI生成领域。该平台拥有众多明星大咖入驻并给出预授权书，用户可以在线制作视频，无需等待录制，即刻下单即可完成。

创作工具 1970年01月01日 0 点赞 0 评论 747 浏览

小虫快读

小虫快读（BugQR）是一款集成OCR技术和AI大语言模型的高效阅读工具，支持拍照识别、文字提取、核心内容总结及语音播放等功能。其三大总结模式（Summary、Explain、Note）满足多样化阅读需求，适用于学生、教师、研究人员、商业分析人士及法律专业人士等多个领域。免费版提供基础功能，高级版本支持内容导出。

AI项目与工具 2025年06月12日 24 点赞 0 评论 748 浏览

烽火研报

实时全面的行业报告聚合检索平台

GPTs应用 1970年01月01日 0 点赞 0 评论 750 浏览

Universal

Universal-1是一款由AssemblyAI开发的多语言语音识别和转录模型，经过大量多语种音频数据训练，支持英语、西班牙语、法语和德语等。该模型在各种复杂环境中提供高精度的语音转文字服务，具备快速响应能力和改进的时间戳准确性。Universal-1在准确率、响应时间、时间戳估计和用户偏好等方面表现优异，适用于对话智能平台、AI记事本、创作者工具和远程医疗平台等多个应用场景。

AI项目与工具 2024年01月01日 88 点赞 0 评论 750 浏览

文心iRAG

文心iRAG是百度推出的一种检索增强型文生图技术，它通过结合百度搜索引擎中的海量图片资源与先进基础模型能力，解决了大模型在文生图时容易出现的幻觉问题，显著提高了生成图片的真实性和准确性。此技术不仅适用于广告、媒体、教育等多个领域，还具备低成本、高效率的特点，能够快速生成满足需求的高质量图像。

AI项目与工具 2025年06月12日 66 点赞 0 评论 750 浏览

CogView

CogView-3-Plus是智谱AI研发的AI文生图模型，采用Transformer架构替代传统的UNet，优化了扩散模型中的噪声规划。它能够根据用户指令生成高质量、高美学评分的图像，支持多种分辨率，并具有实时生成图像的能力。该模型已被集成到“智谱清言”APP中，并提供API服务，适用于艺术创作、游戏设计、广告制作等多个图像生成领域。

AI项目与工具 2025年06月12日 64 点赞 0 评论 750 浏览

LLaVA

LLaVA-OneVision是字节跳动开发的开源多模态AI模型，主要功能包括多模态理解、任务迁移、跨场景能力、开源贡献及高性能。该模型采用多模态架构，集成了视觉和语言信息，通过Siglip视觉编码器和Qwen-2语言模型，实现高效特征映射和任务迁移学习。广泛应用于图像和视频分析、内容创作辅助、聊天机器人、教育和培训以及安全监控等领域。

AI项目与工具 2025年06月12日 34 点赞 0 评论 751 浏览

场景

首页

场景

列表

默认

浏览次数

发布日期