增强 - 智狐AI导航

ClearerVoice

ClearerVoice-Studio 是一个基于复数域深度学习算法的开源语音处理框架，集成了语音增强、分离及音视频说话人提取等功能。它通过先进的 FRCRN 和 MossFormer 系列模型，实现了高效的语音信号处理，并具备强大的预训练能力和灵活的接口设计。该框架广泛应用于智能助手、会议记录、电话会议、公共安全等领域，助力提升语音处理技术的实际应用价值。

AI项目与工具 2025年06月12日 81 点赞 0 评论 837 浏览

ImageFusion AI

ImageFusion AI 是一款基于人工智能的在线图像合成工具，支持快速、高质量的图像融合与风格转换。用户可通过预设样式或自定义参考图创建独特视觉效果，适用于艺术创作、设计、营销等多个场景。操作简便，输出清晰，适合个人及专业用户使用。

AI项目与工具 2025年06月11日 99 点赞 0 评论 837 浏览

Epsilla

Epsilla 是一个面向多行业用户的 AI 工具平台，支持通过领域专业知识定制 AI 代理，具备直观的界面和灵活的定制选项，内置检索增强生成（RAG）技术，简化了从概念到生产的 AI 应用部署流程。主要应用于内容生成、投资研究、法律案例分析、客户服务及教育等领域。

AI项目与工具 2025年06月12日 92 点赞 0 评论 839 浏览

BAG

BAG是一项由香港中文大学与腾讯联合研发的3D可穿戴资产生成技术，结合多视图图像扩散模型与控制网络，根据人体形状和姿态信息生成高质量的服装和配饰。该技术具备高效适配、多样化生成和物理模拟优化等特点，广泛应用于虚拟试衣、游戏开发、VR/AR及时尚设计等领域，有效提升用户体验与设计效率。

AI项目与工具 2025年06月12日 53 点赞 0 评论 839 浏览

ChatPDFLocal

一款专为Mac用户设计的本地PDF阅读和处理工具，它结合了原生 macOS 界面和强大的大型语言模型（LLM），能够快速、安全地处理 PDF 文件。

Ai办公效率 2025年06月05日 72 点赞 0 评论 840 浏览

AnchorCrafter

AnchorCrafter是一款基于扩散模型的智能视频生成工具，利用人-物交互（HOI）技术生成高质量主播风格产品推广视频。它支持物体外观保持、运动控制、遮挡处理及细节增强学习，适用于在线购物、社交媒体营销、电视广告制作等多个领域，显著提升视频真实感和互动性。

AI项目与工具 2025年06月12日 20 点赞 0 评论 840 浏览

SimpleAR

SimpleAR是一款由复旦大学与字节跳动联合研发的纯自回归图像生成模型，采用简洁架构实现高质量图像生成。其通过“预训练-有监督微调-强化学习”三阶段训练方法，提升文本跟随能力与生成效果。支持文本到图像及多模态融合生成，兼容加速技术，推理速度快。适用于创意设计、虚拟场景构建、多模态翻译、AR/VR等多个领域。

AI项目与工具 2025年06月11日 76 点赞 0 评论 845 浏览

Hypic

Hypic是一款集AI照片编辑与艺术生成于一体的多功能工具，支持图像优化、滤镜应用、艺术风格转换及海报设计等功能。它采用先进的AI算法，提供自然且高效的编辑体验，适合初学者和专业人士使用。用户可轻松进行照片美化、批量处理和创意艺术创作，广泛应用于社交媒体、设计和个人内容制作领域。

AI项目与工具 2025年06月12日 69 点赞 0 评论 846 浏览

Search

Search-o1是由中国人民大学和清华大学联合开发的AI工具，旨在提升大型推理模型在复杂任务中的表现。其核心在于结合RAG机制与Reason-in-Documents模块，实现动态知识检索与精炼处理，增强推理的准确性和连贯性。该工具在科研、数学、编程、问答等多个领域展现出广泛适用性，为构建更可靠的智能系统提供了新路径。

AI项目与工具 2025年06月12日 16 点赞 0 评论 847 浏览

DriveDreamer4D

DriveDreamer4D是一个专注于提升自动驾驶场景4D重建质量的框架，通过整合世界模型先验知识生成新的轨迹视频，同时确保时空一致性，从而增强训练数据集的多样性和真实性。它具备4D场景重建、新轨迹视频合成、时空一致性控制以及提升渲染质量等功能，广泛应用于自动驾驶系统开发、闭环仿真测试及传感器数据模拟等领域。 ---

AI项目与工具 2025年06月12日 83 点赞 0 评论 847 浏览

增强

首页

增强

列表

默认

浏览次数

发布日期