AI工具

AutoRAG

AutoRAG是一款由中科院相关机构研发的自主迭代检索模型,专为大型语言模型设计,通过多轮对话实现检索规划与查询细化,具备动态调整迭代次数、增强可解释性的特点。它在复杂任务处理方面表现出色,支持智能问答、学术研究、市场分析、在线教育及客户服务等多样化应用场景。 ---

Reweb

Reweb 是一款面向开发者的 AI 可视化构建工具,支持基于 Next.js 和 Tailwind CSS 快速生成和定制用户界面。它结合 AI 生成能力与可视化编辑功能,允许从空白画布或 Figma 文件开始设计,并导出高质量代码。适用于快速原型设计、前端开发加速、设计与开发协作以及教学场景,提升开发效率并增强代码可扩展性。

LyricStudio

LyricStudio是一款利用AI技术辅助歌词创作的工具,能够根据用户设定的主题和风格生成个性化歌词建议,并提供押韵词推荐、歌词结构优化等功能。它支持团队协作创作,兼容多种音乐流派,适用于个人创作、团队协作及教育等多个场景,同时确保用户对生成内容享有完整版权。

Asyncflow v1.0

Asyncflow v1.0 是一款基于 AI 的文本转语音工具,支持超过 450 种语音选项,涵盖多种语言和风格。通过 Magic Dust AI 技术,实现快速语音克隆与高质量输出,降低训练成本。提供 API 接口,便于开发集成,适用于播客、广告、教育等多种场景,具备高效、易用和高性价比的特点。

SmolVLA

SmolVLA是Hugging Face开源的轻量级视觉-语言-行动(VLA)模型,专为经济高效的机器人设计。拥有4.5亿参数,可在CPU上运行,单个消费级GPU即可训练,适合在MacBook上部署。它能够处理多模态输入,生成动作序列,并通过异步推理提高控制效率。适用于物体抓取、家务劳动、货物搬运和机器人教育等场景。

VITRON

VITRON是一款由多家顶尖机构联合研发的像素级视觉大型语言模型,具备强大的图像与视频处理能力,涵盖理解、生成、分割及编辑等功能。它融合了编码器-LLM-解码器架构、视觉-语言编码和视觉专家系统,支持多种视觉任务,广泛应用于图像编辑、视频创作、教育辅助、电商营销和新闻报道等领域。

Phot.AI

Phot.AI 是一款基于AI技术的在线图片编辑平台,主要功能包括自动图像修复、高级色彩校正、边缘检测和锐化等。它支持批量处理多张图片,具备AI照片生成能力,并提供直观的用户界面。Phot.AI 可用于社交媒体内容创作、专业摄影后期处理、电子商务产品展示以及广告和营销材料制作等多个场景,帮助用户提升图片质量和工作效率。

WhisperChain

WhisperChain 是一款开源语音识别工具,支持实时语音转文本并提供文本优化功能,可去除填充词、优化语法。用户可通过全局热键快速启动语音输入,处理结果自动复制到剪贴板。支持 Streamlit 界面与 FastAPI 架构,适用于会议记录、写作辅助等场景。

Browser Use

Browser Use是一款基于大语言模型的智能浏览器工具,支持多标签页管理和视觉识别,可提取网页内容并记录操作步骤。它允许开发者自定义动作,如保存文件或推送至数据库,并兼容多种主流LLM模型,具备并行运行和自我修正能力,旨在提升任务执行效率与准确性。

Food Mood

Food Mood 是 Google AI 推出的创意菜谱生成工具,支持用户将两种不同国家的菜系进行融合,创造出独特的食谱。用户可选择菜品类别、用餐人数、添加特定食材,并根据饮食偏好(如素食、无麸质)进行定制。工具提供随机生成功能,帮助用户获得灵感,生成的食谱包含详细食材清单、制作步骤、精致插图和实用贴士。