模型 - 智狐AI导航

可图(Kolors)

可图(Kolors)：用于真实感文本到图像合成的扩散模型的有效训练，快手文生图大模型，支持中文，效果超越Midjourney V6

文生图 2025年06月26日 0 点赞 0 评论 489 浏览

讯飞文书

讯飞文书是一款基于星火大模型开发的AI公文写作工具，支持从素材筹备到审稿核稿的全流程服务。它提供了丰富的范文和参考模板，并能通过AI技术自动生成、润色和优化公文内容，确保公文质量的同时提高工作效率。

AI项目与工具 2025年06月12日 95 点赞 0 评论 704 浏览

Animate Anyone

Animate Anyone是一款由阿里巴巴智能计算研究院开发的开源框架，旨在将静态图像中的角色或人物动态化。它采用扩散模型，结合ReferenceNet、Pose Guider姿态引导器和时序生成模块等技术，确保输出的动态视频具有高度一致性和稳定性。该框架支持多种应用，包括角色动态化、时尚视频合成及人类舞蹈生成，用户可通过GitHub或Hugging Face社区轻松体验。

AI项目与工具 2025年06月12日 19 点赞 0 评论 976 浏览

Perplexity

Perplexity AI 是一款对话式AI搜索引擎，通过自然语言处理技术，能够从多种来源收集信息并提供准确答案。它支持用户通过聊天方式进行提问，确保信息来源可靠，并适用于多种职业背景的用户。与传统搜索引擎相比，Perplexity AI 提供了简洁无广告的体验和更高效的搜索结果。

AI项目与工具 2025年06月12日 11 点赞 0 评论 941 浏览

Comflowy

Comflowy 是一个专注于将 ComfyUI 工作流转化为实用工具的平台，提供超过 100 个预安装的扩展，支持多种主流 AI 模型，包括一些闭源模型。它具备强大的云 GPU 支持，用户友好的界面设计以及灵活的节点系统，帮助用户高效管理和生成高质量的工作流，适用于多种应用场景，如室内设计、快速手绘生成、艺术风格转换及视频生成等。

AI项目与工具 2025年06月12日 70 点赞 0 评论 863 浏览

AniPortrait

AniPortrait是一款由腾讯开源的AI视频生成框架，通过音频和一张参考肖像图片生成高质量的动画。该框架包含两个核心模块：Audio2Lmk模块将音频转换为2D面部标记点，而Lmk2Video模块则基于这些标记点生成连贯且逼真的视频动画。AniPortrait以其高质量的视觉效果、时间一致性和灵活的编辑能力著称，能够精确捕捉面部表情和嘴唇动作。

AI项目与工具 2025年06月12日 68 点赞 0 评论 971 浏览

VASA

VASA-1是一个由微软亚洲研究院开发的生成框架，能够将静态照片转化为动态的口型同步视频。该框架利用精确的唇音同步、丰富的面部表情和自然的头部运动，创造出高度逼真的虚拟人物形象。VASA-1支持在线生成高分辨率视频，具有低延迟的特点，并且能够处理多种类型的输入，如艺术照片、歌唱音频和非英语语音。此外，通过灵活的生成控制，用户可以调整输出的多样性和适应性。

AI项目与工具 2025年06月12日 83 点赞 0 评论 794 浏览

Llama 3

Llama 3是Meta公司开发的一款最新大型语言模型，提供了8B和70B两种参数规模的模型。它通过增加参数规模、扩大训练数据集、优化模型架构和增强安全性等功能，显著提升了自然语言处理能力，适用于编程、问题解决、翻译和对话生成等多种应用场景。Llama 3在多个基准测试中表现出色，并且通过指令微调进一步增强了特定任务的表现。

AI项目与工具 2025年06月12日 40 点赞 0 评论 727 浏览

Hyper

Hyper-SD是由字节跳动研究人员开发的高效图像合成框架，通过轨迹分割一致性蒸馏（TSCD）、人类反馈学习（ReFL）和分数蒸馏等技术，显著降低了扩散模型在多步推理过程中的计算成本。该框架在保持高图像质量的同时，大幅减少了推理步骤，实现了快速生成高分辨率图像，推动了生成式AI技术的发展。

AI项目与工具 2025年06月12日 73 点赞 0 评论 613 浏览

AniTalker

AniTalker是一款先进的AI工具，能将单张静态人像与音频同步转化为生动的动画对话视频。它通过自监督学习捕捉面部动态，采用通用运动表示和身份解耦技术减少对标记数据的依赖，同时结合扩散模型和方差适配器生成多样且可控的面部动画。AniTalker支持视频驱动和语音驱动两种方式，并具备实时控制动画生成的能力。

AI项目与工具 2025年06月12日 62 点赞 0 评论 920 浏览

模型

首页

模型

列表

默认

浏览次数

发布日期