AI项目与工具

讯飞译制

讯飞译制是一款基于语音识别与机器翻译技术的智能字幕制作与翻译平台,支持多语言转换与自动字幕生成,提供高精度识别、智能时间码匹配、多格式导出及配音功能,适用于短视频出海、教学视频、广告宣传等多种场景,提升内容传播效率与国际化水平。

SignGemma

SignGemma是由谷歌DeepMind团队开发的全球最强大的手语翻译AI模型,专注于将美国手语(ASL)实时翻译成英语文本。通过多模态训练方法,结合视觉和文本数据,实现高准确率和低延迟的翻译,响应时间低于0.5秒。支持端侧部署,保护用户隐私,适用于教育、医疗和公共服务等场景。

Poify

Poify是一款由快手推出的AI图像生成工具,支持AI模特试衣、背景更换、局部重绘等功能,帮助商家和创作者高效生成高质量商品展示图及创意内容。用户可通过文字或图片输入,快速生成符合需求的视觉作品,适用于电商营销、海报设计、社交媒体等内容创作场景,提升视觉吸引力和传播效果。

交交

交交是上海交通大学研发的口语对话情感大模型,支持多人对话、多语言交流、方言识别、角色扮演、情感互动及知识问答。具备端到端语音处理、多语言理解、实时音色克隆等功能,适用于教育、家庭、商务、客服等多个场景,展现出强大的语音交互能力与应用潜力。

Fairies

Fairies 是一款功能强大的 AI Agent 智能体,支持 1000 多种操作,包括文件管理、代码生成、邮件发送等。用户可通过自然语言与 Fairies 交互,实现多任务执行。它注重隐私保护,采用端到端加密,所有数据处理在本地完成。Fairies 可与 Slack、Gmail、Google Drive 等应用集成,提供免费版和 Pro 版,适合个人和团队提升生产力。

Scenethesis

Scenethesis是NVIDIA推出的AI框架,可通过文本生成高质量的3D场景。它结合LLM与视觉技术,经过布局规划、视觉细化、物理优化和场景验证四个阶段,确保生成结果具备物理合理性和空间连贯性。支持用户交互与多样化场景构建,广泛应用于VR/AR、游戏开发、具身智能及虚拟内容创作等领域。

爱派

AiPy 是一款基于大语言模型与 Python 深度整合的 AI 工具,支持自然语言生成代码、数据处理与分析、可视化、API 调用、任务自动化等功能。具备本地部署能力,保障数据安全,适用于开发、数据分析、自动化任务等场景。用户可通过自然语言或直接输入代码进行交互,支持多种操作系统与环境配置,提升编程效率与灵活性。

Fish Audio

Fish Audio是一款生成式AI文本转语音(TTS)和声音克隆平台,支持多种语言和声音风格,可将文本转换为自然流畅的语音。用户可上传音频样本克隆特定人物的声音,并通过API接口集成到应用程序中。Fish Audio适用于视频制作、有声读物、语音助手、教育与培训以及娱乐创意等领域,满足个性化语音内容生成需求。

Mogao

Mogao是由字节跳动开发的多模态生成基础模型,结合双视觉编码器和先进位置嵌入技术,实现高质量的图像与文本生成。支持零样本图像编辑、多模态理解与生成、高分辨率图像输出以及优化的中文文本渲染。适用于内容创作、智能交互、医疗影像分析等多个领域,具备强大的跨模态处理能力和生成稳定性。

Supaboard

Supaboard是一款基于AI的数据分析平台,支持连接110多种数据源,通过自然语言交互实现快速数据处理与可视化。用户可生成图表、洞察报告并进行团队协作,同时保障数据安全。适用于销售分析、营销优化、风险管理等多个场景,适合各类企业提升数据驱动决策能力。