深度学习

猫头音

猫头音是一款基于深度学习技术的AI配音与翻唱工具,支持将文字转化为高质量语音输出,并提供多样化音色选择及丰富的音频处理功能。用户可通过简单操作实现个性化配音、修音翻唱以及音频编辑,广泛适用于视频创作、广告制作、有声读物开发及音乐翻唱等多个领域。

DreamClear

DreamClear是一款由中国科学院自动化研究所与字节跳动团队联合开发的高性能图像修复工具,利用深度学习技术将低质量图像恢复为高质量图像,同时注重隐私保护。其核心技术包括深度扩散先验、方差保持采样和自适应调制器混合模块,广泛应用于图像质量提升、细节恢复、隐私保护及商业项目开发等领域。

易我人声分离

易我人声分离是一款基于AI技术的音频编辑工具,可智能分离音频或视频中的人声与背景音乐,支持多种格式,并具备一键操作的便捷性。它不仅适用于音乐创作和视频剪辑,还支持精确分离乐器声音,广泛应用于语言学习、影视后期制作等多个领域。

Wonder Animation

Wonder Animation是一款基于AI的视频到3D场景转换工具,由Autodesk的Wonder Dynamics研发。它能够将视频序列转化为包含摄像机设置和角色动画的3D动画场景,支持多剪辑和多种镜头处理。通过深度学习和计算机视觉技术,Wonder Animation在3D空间中重建场景,并确保动作和场景的高度同步与一致。此工具特别适合动画电影制作、视频游戏开发、虚拟制作以及增强现实和虚

夸克灵知大模型

夸克灵知大模型是一款具备高阶推理能力的智能学习工具,专为不同阶段的学习者设计。它提供详尽的题目解析、启发式教学及实时互动功能,涵盖K12教育、高等教育及成人教育等多个领域,助力用户全面提升学习效率和理解力。

MobileLLM

MobileLLM是一款针对移动设备优化的大型语言模型,具有语言理解与生成、零样本常识推理、聊天交互、API调用、文本重写与摘要生成以及数学问题解决等功能。它通过深度薄型架构、SwiGLU激活函数、嵌入共享和分组查询注意力机制等技术,在低参数环境下实现高效性能,适用于移动聊天、语音助手、内容推荐、教育辅助和移动搜索等多种应用场景。

Genmoai

Genmoai-smol 是一款专为单 GPU 设备设计的开源视频生成模型,能够将文本描述转化为高质量视频内容。其核心优势在于高保真度运动表现、强大的文本提示遵循能力及显存优化技术,支持用户在资源受限条件下开展视频创作。该工具提供了 Gradio UI 和命令行界面两种操作方式,并广泛应用于视频内容创作、超现实效果视频制作和技术研究等领域。

Infinity AI

Infinity AI是一款基于深度学习技术的人工智能工具,可将输入的剧本或对话内容转化为高质量视频。其核心功能包括生成式视频模型、数字人克隆技术和视频定制服务。用户可通过简单的操作实现一键视频生成,并利用AI克隆体制作个性化视频内容。这款工具广泛应用于教育、娱乐、新闻传媒、企业培训等场景,显著提升内容创作效率。

DeOldify

DeOldify是一款利用深度学习技术的AI工具,可为黑白照片和视频上色并增强其视觉效果。它支持静态图像转动态视频、跨时代人物模拟等功能,适用于家庭相册修复、历史档案管理、教育演示及影视制作等多个场景,帮助用户更生动地记录和分享历史记忆。

Fish Agent

Fish Agent是一款集成了自动语音识别(ASR)与文本到语音(TTS)技术的端到端语音处理工具,能够直接实现语音到语音的转换,无需传统语义编码器/解码器。它支持多种语言,适用于语音转换、环境音频信息捕捉等场景,并基于深度学习技术优化了语音处理性能。Fish Agent可广泛应用于内容创作、教育、客户服务及娱乐等领域。