模型 - 智狐AI导航

VASA

VASA-1是一个由微软亚洲研究院开发的生成框架，能够将静态照片转化为动态的口型同步视频。该框架利用精确的唇音同步、丰富的面部表情和自然的头部运动，创造出高度逼真的虚拟人物形象。VASA-1支持在线生成高分辨率视频，具有低延迟的特点，并且能够处理多种类型的输入，如艺术照片、歌唱音频和非英语语音。此外，通过灵活的生成控制，用户可以调整输出的多样性和适应性。

AI项目与工具 2025年06月12日 83 点赞 0 评论 534 浏览

云锦天章

云锦天章是一款基于DCFormer架构的通用大模型，能够高效地进行文字扩写、缩写和风格变换，具备问答、数学、编程等基础能力。它通过动态组合多头注意力机制，大幅提升模型效率并降低能耗，适用于小说创作、教育辅导、内容生成、企业服务及娱乐等多个领域。

AI项目与工具 2025年06月12日 48 点赞 0 评论 534 浏览

JoyCoder

JoyCoder是一款由京东开发的AI编程助手，旨在提升研发效率。它提供了代码预测生成、注释生成代码、一键生成单元测试和接口文档等功能，并与主流IDE无缝集成。JoyCoder集成了本地行云DevOps能力，支持多种编程语言。其核心技术包括AI算法、代码上下文理解、模型训练和智能问答系统等，能够显著提升代码质量和开发效率。

AI项目与工具 2025年06月12日 52 点赞 0 评论 535 浏览

ChatTTS

ChatTTS是一个开源的专为对话场景设计的语音生成模型，特别适用于大语言模型(LLM)助手的对话任务，以及诸如对话式音频和视频介绍等应用。ChatTTS 不仅能说中文，英文也能 hold 住...

创作工具 1970年01月01日 0 点赞 0 评论 535 浏览

龙猫LongCat

龙猫LongCat是美团自主研发的生成式AI大模型，具备多模态处理能力，可支持文本、图像等内容生成任务。其核心功能涵盖智能编程、会议记录、文档编辑、图形设计与视频脚本生成等，适用于多种办公场景。通过大规模预训练与混合训练策略，龙猫在实际应用中展现出高效、精准的特点，有效提升工作效率与创新能力。

AI项目与工具 2025年06月12日 70 点赞 0 评论 535 浏览

R1

R1-Onevision 是一款基于 Qwen2.5-VL 微调的开源多模态大语言模型，擅长处理图像与文本信息，具备强大的视觉推理能力。它在数学、科学、图像理解等领域表现优异，支持多模态融合与复杂逻辑推理。模型采用形式化语言和强化学习技术，提升推理准确性与可解释性，适用于科研、教育、医疗及自动驾驶等场景。

AI项目与工具 2025年06月12日 92 点赞 0 评论 535 浏览

WiS

WiS是一个基于“谁是卧底”游戏规则的在线AI竞赛平台，专为评估和分析大型语言模型（LLMs）在多智能体系统中的行为而设计。平台提供统一的模型评估接口、实时排行榜、全面的行为评估功能以及详尽的数据可视化支持，旨在为研究人员和开发者提供一个直观且高效的工具，用于测试和优化智能体在复杂交互环境中的表现。

AI项目与工具 2025年06月12日 20 点赞 0 评论 536 浏览

Lingua

Lingua是Meta AI推出的轻量级代码库，专注于大规模语言模型的训练与推理。它基于PyTorch框架，具有模块化设计、分布式训练支持以及灵活的自定义能力，适用于学术研究、工业部署及模型优化等多个领域。Lingua支持端到端训练、性能优化、多GPU协作，并提供丰富的工具来管理和保存模型。

AI项目与工具 2025年06月12日 71 点赞 0 评论 536 浏览

OmniAlign

OmniAlign-V是由多所高校联合开发的多模态大语言模型对齐数据集，包含约20万个多模态样本，涵盖自然图像和信息图表。其核心功能包括提供高质量训练数据、提升模型的开放式问答能力、增强推理与创造力，并支持模型持续优化。数据集通过图像筛选、任务设计及后处理优化确保数据质量，适用于多模态对话系统、图像辅助问答、创意生成等多个应用场景。

AI项目与工具 2025年06月12日 99 点赞 0 评论 536 浏览

LongWriter

LongWriter是一款由清华大学与智谱AI合作开发的长文本生成模型，能够生成超过10,000字的连贯文本。该模型基于增强的长上下文大型语言模型，采用了直接偏好优化（DPO）技术和AgentWrite方法，能够处理超过100,000个token的历史记录。LongWriter适用于多种应用场景，包括学术研究、内容创作、出版行业、教育领域和新闻媒体等。

AI项目与工具 2025年06月12日 67 点赞 0 评论 537 浏览

模型

首页

模型

列表

默认

浏览次数

发布日期