AI - 智狐AI导航

BAGEL

BAGEL是字节跳动开源的多模态基础模型，拥有140亿参数，采用混合变换器专家架构（MoT），通过两个独立编码器捕捉图像的像素级和语义级特征。它能够进行图像与文本融合理解、视频内容理解、文本到图像生成、图像编辑与修改、视频帧预测、三维场景理解与操作、世界导航以及跨模态检索等任务。BAGEL在多模态理解基准测试中表现优异，生成质量接近SD3，并适用于内容创作、三维场景生成、可视化学习和创意广告生成等

AI项目与工具 2025年06月11日 92 点赞 0 评论 502 浏览

Indic Parler

Indic Parler-TTS 是一款由 Hugging Face 与 AI4Bharat 联合开发的多语言文本到语音模型，支持 20 种印度语言和英语，提供 69 种独特语音。该模型基于深度学习架构，通过描述性文本输入实现对音调、语速、情感等参数的灵活控制，适用于多种语音合成场景。在低资源语言上表现优异，具备高自然度和清晰度的语音输出能力。

AI项目与工具 2025年06月12日 55 点赞 0 评论 502 浏览

Magick

有了Magick，你只需点击几下...

Ai编程建站 2026年06月25日 0 点赞 0 评论 502 浏览

Recall AI：电脑的照片记忆功能

微软在Windows 11中推出的一项新特性，旨在通过人工智能技术记录和搜索用户在计算机上的所有操作。

Ai办公效率 2025年06月05日 10 点赞 0 评论 502 浏览

ZOO

ZOO 是一款 AI 驱动的 CAD 软件平台，主打 Text-to-CAD 功能，可通过文本提示快速生成 3D CAD 模型，降低设计门槛。支持实时编辑、模型 APP 创建、DIFF 查看器及远程 GPU 和 API 接口。适用于工程设计、制造、教育、科研和娱乐等多个领域，提升设计效率与灵活性。

AI项目与工具 2025年06月12日 57 点赞 0 评论 502 浏览

ThinkAny

一款新时代AI搜索引擎，利用RAG技术检索和聚合优质内容，结合AI的智能答疑功能，高效解答用户问题。

Ai学习资源 2025年06月05日 33 点赞 0 评论 502 浏览

AnyCharV

AnyCharV是一款由多所高校联合研发的角色可控视频生成框架，能够将任意角色图像与目标场景结合，生成高质量视频。它采用两阶段训练策略，确保角色细节的高保真保留，并支持复杂的人-物交互和背景融合。该工具兼容多种文本生成模型，具备良好的泛化能力，适用于影视制作、艺术创作、虚拟现实等多个领域。

AI项目与工具 2025年06月12日 73 点赞 0 评论 502 浏览

IndexTTS

IndexTTS 是一款由 B 站开发的高性能文本转语音系统，专注于中文语音合成，支持拼音纠正、精准停顿控制和高自然度语音输出。采用混合建模方法，结合汉字与拼音，提升发音准确性。系统具备零样本语音克隆能力，音质优秀，广泛应用于内容创作、在线教育、智能客服等领域。训练数据丰富，性能指标优异，包括低字词错误率、高扬声器相似性和高主观音质评分。

AI项目与工具 2025年06月12日 15 点赞 0 评论 502 浏览

oli

oli 是一款开源的智能代码助手，结合 Rust 后端与 React/Ink 前端，提供高效的代码辅助、文件操作、命令执行等功能。支持多模型集成，包括云 API 和本地 LLM，适用于代码理解、优化、开发调试及项目管理等场景，提升开发效率和用户体验。

AI项目与工具 2025年06月11日 35 点赞 0 评论 502 浏览

Luzia

Luzia是由西班牙初创公司Amperity开发的一款人工智能聊天机器人，主要服务于西语和葡语市场。它具备个性化设计和人性化交流的特点，能够模拟不同角色以适应各种对话场景。此外，Luzia还集成了数学问题解答、PDF阅读器和图像识别等多种实用工具，增强了其实用性和用户体验。

AI项目与工具 2025年06月12日 45 点赞 0 评论 503 浏览

AI

首页

AI

列表

默认

浏览次数

发布日期