AI技术 - 智狐AI导航

FantasyID

FantasyID是由阿里巴巴集团与北京邮电大学联合开发的视频生成框架，基于扩散变换器和3D面部几何先验，实现高质量、身份一致的视频生成。其通过多视角增强和分层特征注入技术，提升面部动态表现，同时保持身份稳定性。支持多种应用场景，如虚拟形象、内容创作和数字人交互，具备无需微调的高效生成能力。

AI项目与工具 2025年06月12日 81 点赞 0 评论 511 浏览

DualPipe

DualPipe是由DeepSeek开发的开源双向流水线并行技术，通过将前向和反向计算分离为独立管道并行执行，显著提升大规模深度学习模型的训练效率。该技术优化了计算与通信的重叠，降低内存峰值，提高资源利用率，并支持多模态处理、多任务学习等应用场景。适用于需要高效训练和推理的AI系统。

AI项目与工具 2025年06月12日 92 点赞 0 评论 702 浏览

Mobius

Mobius 是一款基于人工智能的视频生成工具，能根据文本描述自动生成无缝循环的视频内容。其核心技术包括潜在循环技术和时间一致性优化，确保视频流畅自然。支持多场景应用，如社交媒体、广告、艺术创作和教育领域，简化视频制作流程，提升创作效率与质量。

AI项目与工具 2025年06月12日 90 点赞 0 评论 455 浏览

LCVD

LCVD是一种由四川大学开发的高保真肖像动画生成框架，支持光照可控的动态视频生成。它通过分离肖像的内在与外在特征，并结合多条件分类器自由引导机制，实现对光照和姿态的精细控制。LCVD在图像质量、视频一致性和光照真实感方面表现突出，适用于虚拟现实、视频会议、影视制作及内容创作等多个领域。

AI项目与工具 2025年06月12日 93 点赞 0 评论 639 浏览

PRefLexOR

PRefLexOR是由MIT开发的一种基于偏好优化和递归推理的自学习AI框架，能通过多步推理、反思和优化提升输出准确性。其核心技术包括ORPO和DPO，结合“思考令牌”与“反思令牌”实现更精准的推理路径对齐。具备动态知识图谱构建、跨领域推理和自主学习能力，适用于材料科学、信息学等复杂场景，支持开放域问题解决和持续优化。

AI项目与工具 2025年06月12日 56 点赞 0 评论 528 浏览

PodAgent

PodAgent是一款由多所高校与企业联合开发的播客生成框架，采用多智能体协作机制，模拟真实脱口秀场景，自动生成高质量对话内容。系统具备声音匹配、语音合成与表现力增强功能，并提供多语言支持和完整播客结构生成能力。同时，PodAgent引入评估指标，确保内容的专业性与多样性，适用于媒体、教育、企业推广等多个领域。

AI项目与工具 2025年06月12日 87 点赞 0 评论 656 浏览

NEXUS

NEXUS-O是一款由多家知名机构联合开发的多模态AI模型，能够处理音频、图像、视频和文本等多种输入，并以相应形式输出结果。它在视觉理解、音频问答、语音识别和翻译等方面表现出色，具备强大的跨模态对齐与交互能力。模型基于视觉语言预训练，结合高质量音频数据提升性能，并通过多模态任务联合训练增强泛化能力。适用于智能语音助手、视频会议、教育、智能驾驶、医疗健康等多个领域。

AI项目与工具 2025年06月12日 84 点赞 0 评论 494 浏览

LaWGPT

LaWGPT 是南京大学研发的中文法律大语言模型，基于 LLaMA 进行二次预训练，融合大量法律知识，支持法律咨询、文书生成、司法考试辅助等功能。模型通过法律词表扩展、大规模语料训练及指令微调提升专业性，适用于法律研究、案件分析及政策研究等场景，助力法律行业智能化发展。

AI项目与工具 2025年06月12日 38 点赞 0 评论 745 浏览

InternVL

InternVL是由上海人工智能实验室开发的多模态大模型，融合视觉与语言处理能力，支持图像、视频、文本等多种输入。其基于ViT-MLP-LLM架构，具备多模态理解、多语言处理、文档解析、科学推理等能力，广泛应用于视觉问答、智能客服、图像分析等领域。模型采用动态高分辨率与渐进式训练策略，提升处理效率与准确性。

AI项目与工具 2025年06月12日 78 点赞 0 评论 662 浏览

Shining Yourself

Shining Yourself是商汤科技推出的高保真饰品虚拟试戴技术，基于扩散模型实现逼真试戴效果。支持多饰品、个性化调整、多场景模拟及动态展示，适用于电商、设计、社交及品牌推广等场景，提升用户体验与决策效率。

AI项目与工具 2025年06月12日 58 点赞 0 评论 774 浏览

AI技术

首页

AI技术

列表

默认

浏览次数

发布日期