生成

Gemini 2.0 Flash

Gemini 2.0 Flash是Google推出的多模态AI模型,支持文本与图像生成及对话式编辑,能根据自然语言生成连贯图像,并保持上下文一致性。其在长文本渲染方面表现优异,适用于广告、社交媒体、教育等领域。开发者可通过Google AI Studio或Gemini API进行测试和集成,广泛应用于创意插图、互动故事、设计辅助等场景。

Diffuse

Diffuse 是一款基于 AI 技术的视频编辑工具,支持用户通过自拍照生成个性化虚拟角色,并结合文本或图像生成高质量视频内容。其功能包括动作模仿、文本到视频生成、预剪辑选择及提示编辑,适用于社交媒体、广告、教育等多种场景。该工具专注于移动端使用,提升视频创作的便捷性与灵活性。

美图AI Logo

美图AI Logo,用户只需输入一句想法,即可生成多个不同风格的Logo。

CleanS2S

CleanS2S是一款流式语音到语音交互智能体原型,通过集成自动语音识别(ASR)、大型语言模型(LLM)、文本到语音(TTS)以及WebSockets等技术,提供高质量、实时的语音交互体验。它支持全双工交互和打断功能,可整合网络搜索和RAG模型以增强回答能力,适用于客户服务、智能家居控制、教育辅助、健康咨询及车载系统等多个领域。

Elai.io

了解Elai如何帮助您提高转化率,增加有机流量和提高观众与视频的互动。

BoomCut

BoomCut是小影科技推出的AI视频本地化工具,支持视频换脸、多语言口播、字幕翻译、声音克隆及字幕擦除等功能,适用于跨境营销和多语言内容制作。用户可通过简单操作生成高质量视频,降低制作成本,提升内容传播效率。适用于广告投放、市场拓展及个性化营销场景。

Amphion

Amphion是一款开源音频生成工具包,包含文本转语音(TTS)、歌声合成(SVS)、语音转换(VC)、歌声转换(SVC)、文本转音频(TTA)和文本转音乐(TTM)等功能。它支持多种神经声码器,并提供可视化模型架构,帮助用户快速掌握音频生成技术。通过统一框架和预训练模型,Amphion推动了音频生成领域的研究和应用发展。

AIGC电商解决方案 | @未来力场

生成式 AI 在跨境电商业务流程里能转化为生产力的环节和对应的解决方案有几种分类:按对人力的替换分类,按通用工具分类,按电商场景,按生成对象。

Kiddo Worksheets

一个专为3到10岁孩子打造的免费教育资源平台。它提供从学前班到五年级的英语、数学、阅读、书写等多学科练习册,内容丰富多样,比如字母描红、自然拼读、数字运算、形状认知等。