深度学习

PGTFormer

PGTFormer是一款先进的视频人脸修复框架,通过解析引导的时间一致性变换器恢复视频中的高保真细节,同时增强时间连贯性。该方法无需预对齐,通过语义解析选择最佳人脸先验,并结合时空Transformer模块和时序保真度调节器,实现了高效且自然的修复效果。其主要功能包括盲视频人脸修复、语义解析引导、时间一致性增强、时空特征提取、端到端修复和时序保真度调节。PGTFormer适用于电影和视频制作、视频

微软VASA

微软亚洲研究院开发的一种前沿人工智能技术,VASA-1能够将单一静态图像和一段语音音频转换成逼真的对话面部动画。

SigStyle

SigStyle是一款由多所高校与Adobe合作开发的签名风格迁移框架,能将单张风格图像的视觉特征(如几何结构、色彩和笔触)精准迁移到目标图像,同时保持内容的语义和结构。其核心技术基于个性化文本到图像扩散模型,结合超网络和时间感知注意力交换技术,实现高效且高质量的风格迁移。支持多种应用场景,如艺术创作、时尚设计、影视制作等,具备灵活性和广泛适用性。

Fish Agent

Fish Agent是一款集成了自动语音识别(ASR)与文本到语音(TTS)技术的端到端语音处理工具,能够直接实现语音到语音的转换,无需传统语义编码器/解码器。它支持多种语言,适用于语音转换、环境音频信息捕捉等场景,并基于深度学习技术优化了语音处理性能。Fish Agent可广泛应用于内容创作、教育、客户服务及娱乐等领域。

Web2GPT

Web2GPT 是一款由长亭科技推出的智能工具,可将传统网站快速转化为功能完善的 AI 应用。它支持自然语言交互、多轮对话和个性化服务,具备强大的安全性和多平台集成能力。用户可通过一键转化、智能问答、智能操作等功能快速部署 AI 助手,广泛应用于客服、教育、金融等领域。工具支持自动学习、内容采集与知识库构建,简化了 AI 应用的开发流程,提升了用户体验和运营效率。

月之暗面Moonshot AI

一家专注于人工智能技术的公司,由杨植麟于2023年3月创立。公司致力于开发大型AI模型,其核心产品是Kimi智能助手。

AlphaFold 3

AlphaFold 3 是一款由 DeepMind 开发的基于深度学习的 AI 工具,能够准确预测蛋白质、核酸、小分子等多种生物分子的三维结构。它在药物设计、疫苗研发、基础科研以及疾病研究等领域展现出强大的应用潜力。通过创新技术如 Pairformer 模块和扩散模块,AlphaFold 3 实现了更高的预测精度,并支持复杂生物系统的建模。

Gemini Robotics

Gemini Robotics 是谷歌 DeepMind 基于 Gemini 2.0 开发的机器人系统,融合视觉-语言-动作模型,支持复杂任务执行与环境适应。具备三维空间理解、物体检测、轨迹预测和开放词汇指令执行能力,适用于工业制造、物流仓储、家庭服务、医疗健康等多个领域。系统通过数据驱动训练,结合真实操作与多模态信息,实现高效、灵活的机器人控制。

夸克灵知大模型

夸克灵知大模型是一款具备高阶推理能力的智能学习工具,专为不同阶段的学习者设计。它提供详尽的题目解析、启发式教学及实时互动功能,涵盖K12教育、高等教育及成人教育等多个领域,助力用户全面提升学习效率和理解力。

DeepFaceLab

DeepFaceLab 是一种利用深度学习识别来交换图片和视频中的人脸的工具。