生成

小以思AI

小以思AI是一个综合性的AI工具,提供了包括智能对话、一键创作、智能绘画、思维导图等多种功能。该平台适用于个人和企业,可以用于生成各种类型的文本和图像内容。

薯图宝

一款高效的图文批量生成工具,一款通用的图文批量生成工具,可以通过个性化的自定义模板和多种文案数据组合,快速批量生成图片,帮助用户快速生成用于小红书及其他平台的图文内容。

Charmed AI

Charmed AI是一个强大的3D创作工具,它通过AI技术简化了3D建模和动画制作的流程。无论是生成3D几何体、应用纹理、还是动画绑定,Charmed AI都提供了高效的解决方案,使用户能够快...

StableCode

StableCode,一个用于代码生成的大语言模型。StableCode 基于 GPT-NeoX 构建,该模型通过指令模型和具体应用示例进行改进,用于解决复杂的编程任务。

OpenAudio S1

OpenAudio S1是Fish Audio推出的文本转语音(TTS)模型,基于200万小时音频数据训练,支持13种语言。采用双自回归架构和RLHF技术,生成自然流畅的语音,支持50多种情感和语调标记。具备零样本和少样本语音克隆功能,仅需10到30秒音频即可生成高保真声音。适用于视频配音、播客、游戏角色语音、虚拟助手、游戏娱乐、教育培训及客服系统等场景。提供40亿参数完整版和5亿参数开源版,满足

Crack Coder

Crack Coder 是一款开源的 AI 编程辅助工具,专为技术面试设计。它能够在后台运行,不被检测到,并提供实时代码建议,支持多种编程语言。该工具具备精准的上下文分析能力,适用于面试准备、编程学习及算法练习等场景,同时支持本地部署以保障隐私和性能。

讯飞译制

讯飞译制是一款基于语音识别与机器翻译技术的智能字幕制作与翻译平台,支持多语言转换与自动字幕生成,提供高精度识别、智能时间码匹配、多格式导出及配音功能,适用于短视频出海、教学视频、广告宣传等多种场景,提升内容传播效率与国际化水平。

FancyVideo

FancyVideo是一款由360公司与中山大学合作开发的AI文生视频模型,采用创新的跨帧文本引导模块(CTGM)。它能够根据文本描述生成连贯且动态丰富的视频内容,支持高分辨率视频输出,并保持时间上的连贯性。作为开源项目,FancyVideo提供了详尽的文档和代码库,便于研究者和开发者深入研究和应用。主要功能包括文本到视频生成、跨帧文本引导、时间信息注入及时间亲和度细化等。

Act

Act-One是一款由Runway开发的AI生成式角色表演工具,能够基于简单视频输入生成逼真的虚拟角色动画。它简化了面部动画制作流程,无需复杂设备,仅需单一摄像头即可完成,同时支持多样化角色表现和多轮对话场景生成,广泛应用于电影、动画、角色设计及叙事内容创作等领域。

DiffEditor

DiffEditor是由北京大学深圳研究生院与腾讯PCG联合研发的图像编辑工具,基于扩散模型,结合图像与文本提示,支持细粒度对象移动、尺寸调整、内容拖动及跨图像编辑。采用区域随机微分方程(Regional SDE)和时间旅行策略,提升编辑准确性和灵活性。无需额外训练即可实现高效图像处理,适用于创意设计、人像修复和风景优化等场景。