AI项目与工具

NVILA

NVILA是一款由NVIDIA开发的视觉语言模型，通过“扩展-压缩”策略优化处理高分辨率图像和长视频，兼具效率与准确性。它在图像和视频基准测试中表现优异，支持时间定位、机器人导航和医疗成像等应用场景，并通过参数高效微调和量化技术提升模型性能。未来将在GitHub和HuggingFace平台上开源。

AI项目与工具 2025年06月12日 68 点赞 0 评论 865 浏览

Markdown

Markdown-to-Image 是一个基于 React 的开源工具，可将 Markdown 文本转换为图像，支持多种输出格式和自定义样式。其应用场景包括社交媒体内容创作、技术文档可视化、博客标题设计以及教育和营销材料制作，具备强大的灵活性和易用性。

AI项目与工具 2025年06月12日 21 点赞 0 评论 948 浏览

MiLoRA

MiLoRA是一种参数高效的大型语言模型微调方法，通过奇异值分解将权重矩阵分为主要和次要两部分，专注于次要部分的优化以降低计算成本，同时保持模型的高精度和高效性。它在自然语言处理任务中表现出色，适用于文本分类、情感分析、问答系统等多个领域，并在多租户环境和实时内容生成中展现出显著优势。 ---

AI项目与工具 2025年06月12日 47 点赞 0 评论 731 浏览

TouchRetouch

TouchRetouch是一款专业的图像编辑软件，专注于去除照片中的多余物体或瑕疵。其核心功能包括对象感知修饰、灵活的线条移除以及智能网格移除，能够高效处理各种复杂的编辑需求。该软件界面友好，操作简便，广泛适用于照片修复、产品摄影、旅行摄影等多个领域。

AI项目与工具 2025年06月12日 20 点赞 0 评论 877 浏览

MM1.5

MM1.5是苹果公司研发的多模态大型语言模型，具备强大的文本与图像理解能力，包括视觉指代、定位及多图像推理功能。它通过数据驱动的训练方法，实现了从1B到30B参数规模的性能提升，并推出了视频和移动UI专用版本，为多模态AI技术发展提供重要参考。主要应用场景涵盖图像与视频理解、视觉搜索、辅助驾驶、智能助手及教育领域。

AI项目与工具 2025年06月12日 64 点赞 0 评论 857 浏览

Musicfy AI

Musicfy AI是一个利用人工智能技术简化音乐制作流程的平台，主要功能包括AI虚拟歌手、AI文本到音乐转换、AI模仿声音等。用户可以上传自己的声音样本，创建个性化的AI声音模型，并轻松创作出具有个人特色的音乐作品。无论是专业音乐制作人还是音乐爱好者，都可以在该平台上找到适合自己的创作方式。

AI项目与工具 2025年06月12日 93 点赞 0 评论 851 浏览

Chirp 3

Chirp 3 是谷歌云推出的高清语音合成工具，支持 31 种语言和 248 种声音，能生成自然流畅的语音。具备多语言支持、自定义语音、流式合成等功能，适用于智能助手、有声读物、视频配音等场景。支持多种音频格式，注重数据安全与合规性。

AI项目与工具 2025年06月12日 16 点赞 0 评论 833 浏览

All Voice Lab

All Voice Lab是一款基于AI技术的语音创作平台，提供文本转语音、声音克隆、视频翻译、变声等多种功能，支持多语言及多音色转换。平台具备高精度的语音生成能力，可应用于内容创作、视频制作、教育及娱乐等领域，提升内容表现力与国际化传播效率。

AI项目与工具 2025年06月12日 14 点赞 0 评论 764 浏览

问小白上线DeepSeek

“问小白”平台提供免费且无限使用的DeepSeek R1满血版服务，支持联网搜索、文件上传、多模态处理等功能，运行流畅稳定。平台在多项实测中表现优异，具备深度思考能力、智能追问及语音交互功能，适用于多种场景，用户体验良好，且完全免费。

AI项目与工具 2025年06月12日 12 点赞 0 评论 787 浏览

FaceLift

FaceLift是一种由Adobe与加州大学默塞德分校联合开发的AI工具，能够从单张人脸图像中重建出高精度的3D头部模型。其核心技术包括多视图扩散模型和GS-LRM重建器，支持多视角一致性、身份保持和4D新视图合成，适用于虚拟现实、数字娱乐、远程交互等多个领域。该工具具备强大的几何与纹理细节表现能力，且可与2D面部重动画技术集成，广泛应用于内容创作与科研场景。

AI项目与工具 2025年06月12日 74 点赞 0 评论 748 浏览

AI项目与工具 默认 浏览次数 发布时间

AI项目与工具

默认

浏览次数

发布时间