AI项目与工具

海豚AI配音

海豚AI配音是一款支持多语言、多音色的文本转语音工具,提供超过500种真人音色和1000多种二次元音色,适用于有声书、自媒体、教育、动漫及广告等领域。支持多人配音、声音克隆、变声等功能,操作简便,适合各类内容创作者提升作品质量。

GradeAssist

GradeAssist是一款面向教师的AI辅助论文评分工具,支持自定义评分标准、抄袭检测及AI写作分析等功能,可快速生成客观一致的评分结果并提供个性化反馈,有助于提升评分效率、维护学术诚信及减轻教师工作压力。

LOKI

LOKI是一个由中山大学与上海AI实验室联合推出的合成数据检测基准,用于评估大型多模态模型在识别视频、图像、3D模型、文本及音频等多模态合成数据方面的性能。它包含超过18,000个问题,涵盖26个子类别,支持多层次标注和细粒度异常注释,并通过自然语言解释增强模型的可解释性。LOKI还通过对比多种开源和闭源模型的表现,揭示了这些模型在合成数据检测任务中的优势与不足。

Playmate

Playmate是由广州趣丸科技开发的人脸动画生成框架,基于3D隐式空间引导扩散模型和双阶段训练框架,能够根据音频和指令精准控制人物表情和头部姿态,生成高质量动态肖像视频。其支持情感控制、姿态控制和独立控制,可生成多种风格的动态肖像,适用于影视制作、游戏开发、虚拟现实、互动媒体及教育等多个领域。

Meissonic

Meissonic是一款由阿里巴巴集团与多家高校联合开发的文本到图像合成模型,基于掩蔽图像建模技术,结合多模态和单模态Transformer层、高级位置编码策略及优化采样条件,实现了高分辨率图像生成、文本到图像转换、零样本图像编辑等功能。其高效性能使其适用于多种场景,包括艺术创作、媒体娱乐、广告营销、教育及电子商务等领域。 ---

33字幕

33字幕是一款集语音识别与文本翻译于一体的AI字幕生成工具,支持多种语言的语音转文字及翻译,可实现实时字幕生成与同步翻译。用户可通过本地AI模型免费运行,显著降低使用成本。该工具具备边识别边生成字幕、台词搜索等功能,广泛应用于视频创作、教育培训、企业会议等领域。

Spotter Studio

Spotter Studio 是一款专为 YouTube 创作者设计的 AI 创意工具,通过个性化头脑风暴、数据驱动的研究和全面的项目管理工具,帮助创作者生成新视频的创意、优化内容策略,并提高团队协作效率。该平台利用 AI 分析创作者的内容和观众偏好,提供定制化的视频概念和缩略图建议,从而提升视频表现并增加观众参与度。

Open NotebookLM

Open NotebookLM是一个开源工具,能够将PDF文档转换为播客形式的音频内容。它基于Llama 3.1 405B、MeloTTS和Bark等先进AI模型,生成自然流畅的对话式音频,并支持多语言及个性化音调设置。用户可通过简单易用的Gradio界面上传PDF文件并下载MP3格式的音频文件,适用于教育、科研、商业分析等多个领域。

Q.AI

Q.AI是一款基于AI技术的视频创作平台,涵盖AI写真、视频生成、文生图及帧库管理等功能。它能够将文字描述转化为高质量的视频或图像,并提供智能配音、自动字幕匹配等辅助工具,助力个人与企业快速完成视频创作。主要应用场景包括视频制作、内容创作、社交媒体运营、广告营销以及教育培训等领域。

Poe AI新功能「Previews」

Poe AI是一个集成多个强大AI聊天机器人的平台,用户可以通过统一界面与多个AI聊天机器人互动,获得多样化的信息和解决方案。Poe AI的新功能“Previews”允许用户实时预览AI生成的Web应用,支持交互体验,简化编程和设计流程,提高开发效率。该功能支持多种类型的应用程序,包括游戏、文本编辑器、数据分析工具等。用户可以与多个AI聊天机器人进行对话,并且可以无缝切换,获取不同的解决方案或优化