AI项目与工具

Automa

Automa是一款低代码/无代码的浏览器自动化工具,支持通过可视化界面实现网页操作自动化,如数据抓取、表单填写、定时任务等。用户无需编程基础,可轻松构建和运行自动化流程。具备工作流录制、任务调度、多浏览器支持及第三方服务集成等功能,适用于数据采集、办公自动化和个人任务管理等场景。

Phantom

Phantom是由字节跳动研发的视频生成框架,支持从参考图像中提取主体并生成符合文本描述的视频内容。它采用跨模态对齐技术,结合文本和图像提示,实现高质量、主体一致的视频生成。支持多主体交互、身份保留等功能,适用于虚拟试穿、数字人生成、广告制作等多种场景。模型基于文本-图像-视频三元组数据训练,具备强大的跨模态理解和生成能力。

OmniAlign

OmniAlign-V是由多所高校联合开发的多模态大语言模型对齐数据集,包含约20万个多模态样本,涵盖自然图像和信息图表。其核心功能包括提供高质量训练数据、提升模型的开放式问答能力、增强推理与创造力,并支持模型持续优化。数据集通过图像筛选、任务设计及后处理优化确保数据质量,适用于多模态对话系统、图像辅助问答、创意生成等多个应用场景。

AI材料星

AI材料星是一款基于AI技术的公文写作辅助平台,支持生成多种类型的高质量公文内容,具备AI纠错、原创度检测、PPT生成等功能。平台提供丰富的范文和金句资源,适用于政府、企业及学术研究场景,提升写作效率与规范性。

千颜

千颜是一款依托AI技术的照片和视频编辑工具,提供多样化的穿搭风格与视频模板,支持用户快速生成写真照片和视频。其主要功能包括AI一键换装、海量风格模板、视频换装以及图片动态化处理,满足个性化创意需求。应用场景广泛,包括个人娱乐、社交媒体内容创作、教育学习等。

MiniMax Audio

MiniMax Audio是一款基于人工智能的语音合成工具,支持多语言、多情感及声音克隆功能,可将文本快速转换为自然流畅的语音。它具备降噪、超长文本合成、实时语音生成等特性,适用于视频配音、播客制作、游戏配音等多种应用场景。

摩笔天书

摩笔天书是一款由摩尔线程研发的AI辅助绘本创作工具,它结合了故事生成、图像生成、语音合成及音乐创作等多种AI技术,为用户提供从文字到完整绘本的全流程自动化创作服务。用户可轻松调整生成内容,满足个性化需求。该工具以其卓越的图文一致性、易读性及自动生成的音乐和旁白,成为无设计经验者快速产出高质量绘本的理想选择。

ASSEMBO.AI

ASSEMBO.AI 是一款 AI 驱动的多功能平台,支持电商商家快速生成高质量的营销图片和视频。用户可上传产品图片,选择背景或风格,轻松创建适合多平台展示的内容。平台提供多样化的模板和个性化调整选项,适用于电商、社交媒体营销、广告制作等多个场景,有效提升产品吸引力和品牌曝光率。

逗哥配音

逗哥配音是一款基于AI技术的在线配音平台,专为短视频创作者设计。它提供多样化的语音风格选择、智能配音制作工具以及声音克隆功能,支持无损音质输出。用户可以利用该平台轻松生成个性化配音作品,广泛适用于广告宣传、教育培训、游戏开发等多个领域。

Gemma 3n

Gemma 3n 是谷歌 I/O 开发者大会推出的端侧多模态 AI 模型,基于 Gemini Nano 架构,采用逐层嵌入技术,将内存占用压缩至 2-4B 参数模型水平。支持文本、图像、短视频和音频输入,可生成结构化文本输出,并具备音频转录、情感分析等功能。可在本地设备运行,响应时间低至 50 毫秒,适用于语音助手、内容生成和学术任务定制。