AI工具

QBot

QBot是由腾讯QQ浏览器推出的AI驱动型工具,整合了搜索、浏览、办公、学习和写作等多项功能。支持文字、语音和图片搜索,可精准获取信息并进行内容总结、思维导图生成及多语言翻译。同时具备文件处理、文档编辑等办公功能,并集成多个AI代理,提升用户体验与效率。适用于个人投资者、办公、学习及日常信息处理等多种场景。

SmolVLA

SmolVLA是Hugging Face开源的轻量级视觉-语言-行动(VLA)模型,专为经济高效的机器人设计。拥有4.5亿参数,可在CPU上运行,单个消费级GPU即可训练,适合在MacBook上部署。它能够处理多模态输入,生成动作序列,并通过异步推理提高控制效率。适用于物体抓取、家务劳动、货物搬运和机器人教育等场景。

讯飞译制

讯飞译制是一款基于语音识别与机器翻译技术的智能字幕制作与翻译平台,支持多语言转换与自动字幕生成,提供高精度识别、智能时间码匹配、多格式导出及配音功能,适用于短视频出海、教学视频、广告宣传等多种场景,提升内容传播效率与国际化水平。

Refly

Refly是一款基于“自由画布”理念的AI原生创作平台,支持多线程对话、知识库管理、上下文记忆和智能写作等功能。用户可通过其便捷的工具实现创意转化、内容优化与团队协作,适用于学术研究、内容创作及商业文档撰写等多种场景。平台强调高效、专业与个性化,助力用户提升创作效率与内容质量。

Ai2 PaperFinder

Ai2 PaperFinder 是由艾伦人工智能研究所开发的基于大型语言模型的学术文献检索工具,支持多领域精准搜索,具备语义驱动、多Agent协同、引用网络分析等功能,能自动规划关键词、挖掘小众文献,助力研究人员快速获取高质量学术成果。

GenFM

GenFM是一款由ElevenLabs开发的AI工具,可将PDF、文章、电子书等内容转换为多角色播客音频。它支持32种语言,具备自动化声音选择、人性化填充词添加及高度定制化功能,适用于教育、播客制作、有声书创作、商业推广等多个领域。

AutoRAG

AutoRAG是一款由中科院相关机构研发的自主迭代检索模型,专为大型语言模型设计,通过多轮对话实现检索规划与查询细化,具备动态调整迭代次数、增强可解释性的特点。它在复杂任务处理方面表现出色,支持智能问答、学术研究、市场分析、在线教育及客户服务等多样化应用场景。 ---

PhotoApp

PhotoApp 是一款基于AI技术的照片处理工具,可修复模糊、低质量图像并提升为高清版本。主要功能包括面部增强、颜色调整、背景优化、照片放大及旧照片修复,操作简便且效果显著,适用于社交媒体、电子商务、教育等多个领域。

Stable Virtual Camera

Stable Virtual Camera 是 Stability AI 推出的 AI 工具,能够将 2D 图像转换为具有真实深度和透视感的 3D 视频。用户可通过自定义相机轨迹生成多种宽高比的视频,支持最长 1000 帧的高质量输出。其核心技术包括生成式 AI、神经渲染和多视图一致性优化,确保视频在不同视角间过渡自然且保持 3D 一致性。适用于广告、内容创作及教育等多个领域。

MTVCrafter

MTVCrafter是由中国科学院深圳先进技术研究院计算机视觉与模式识别实验室、中国电信人工智能研究所等机构推出的新型人类图像动画框架,基于4D运动标记化(4DMoT)和运动感知视频扩散Transformer(MV-DiT)实现高质量动画生成。该工具直接对3D运动序列建模,支持泛化到多种角色和风格,保持身份一致性,并在TikTok基准测试中取得优异成绩。其应用场景包括数字人动画、虚拟试穿、沉浸式内