模型 - 智狐AI导航

混元DiT

混元DiT（Hunyuan-DiT）是腾讯混元团队开源的高性能文本到图像的扩散Transformer模型，具备细粒度的中英文理解能力，能够生成多分辨率的高质量图像。该模型结合了双语CLIP和多语言T5编码器，通过精心设计的数据管道进行训练和优化。混元DiT的主要功能包括双语文本到图像生成、细粒度中文元素理解、长文本处理能力、多尺寸图像生成、多轮对话和上下文理解、高一致性和艺术性。此外，混元DiT在

AI项目与工具 2024年01月01日 64 点赞 0 评论 714 浏览

OmniThink

OmniThink是由浙江大学与阿里巴巴通义实验室联合开发的机器写作框架，通过模拟人类学习和反思机制，提升文章的知识密度与深度。支持多种语言模型，具备信息树与概念池结构化管理功能，适用于学术写作、新闻报道、教育内容创作等多个领域，有效提高生成内容的质量与多样性。

AI项目与工具 2025年06月12日 10 点赞 0 评论 714 浏览

Gradio

Gradio 是一款开源 Python 工具，用于快速构建和共享机器学习模型的交互式网页界面。支持多类型输入输出组件，具备实时交互能力，并通过服务器端渲染优化性能。Gradio 5 引入性能提升、界面更新及安全性改进，支持实验性 AI Playground，广泛应用于模型演示、教育、原型开发及远程协作等领域。

AI项目与工具 2025年06月12日 43 点赞 0 评论 715 浏览

LanDiff

LanDiff是一种结合自回归语言模型和扩散模型的文本到视频生成框架，采用粗到细的生成策略，有效提升语义理解与视觉质量。其核心功能包括高效语义压缩、高质量视频生成、语义一致性保障及灵活控制能力。支持长视频生成，降低计算成本，适用于视频制作、VR/AR、教育及社交媒体等多个领域。

AI项目与工具 2025年06月12日 92 点赞 0 评论 715 浏览

ChatTTS

ChatTTS是一个开源的专为对话场景设计的语音生成模型，特别适用于大语言模型(LLM)助手的对话任务，以及诸如对话式音频和视频介绍等应用。ChatTTS 不仅能说中文，英文也能 hold 住...

创作工具 2026年07月30日 0 点赞 0 评论 715 浏览

Askchat.ai

一个基于chatGPT,提供永久角色扮演和prompt工具的人工智能网站，Askchat.ai使用GPT-3.5和GPT-4.0算法进行训练。能够理解和解释人类自然语言，并用合适的方式进行回答。

AI写作对话 2025年06月05日 64 点赞 0 评论 716 浏览

Mistral Medium 3

Mistral Medium 3是Mistral AI推出的一款多模态语言模型，兼具高性能与低成本优势，适用于企业级应用。支持混合云部署、定制化微调及多模态任务处理，可广泛应用于编程辅助、智能客服、数据分析及知识管理等领域，具备良好的扩展性和系统集成能力。

AI项目与工具 2025年06月11日 76 点赞 0 评论 716 浏览

启元重症大模型

启元重症大模型是一款面向ICU环境的医疗人工智能系统，依托于腾讯的混元大模型架构，集成了庞大的医学知识库和先进的自然语言处理技术，能够快速生成病历、总结病情、提供诊疗建议等，大幅提升了重症医疗的服务质量和工作效率。其核心技术包括医学知识图谱构建、数据处理与分析、模型压缩优化以及临床逻辑推理能力，适用于多种应用场景如ICU监护、智能辅助诊疗、病历自动化生成等。

AI项目与工具 2025年06月12日 10 点赞 0 评论 716 浏览

HumanDiT

HumanDiT是一种由浙江大学与字节跳动联合开发的高保真人体视频生成框架，基于扩散变换器（DiT）实现姿态引导的视频生成。它支持长序列、多分辨率视频生成，并通过关键点扩散变换器（Keypoint-DiT）确保动作的连贯性与自然性。引入前缀潜在参考策略以保持个性化特征，结合姿态适配器和细化模块提升细节质量。适用于虚拟人、动画制作、沉浸式体验及视频续写等多种场景。

AI项目与工具 2025年06月12日 41 点赞 0 评论 717 浏览

OpenAI o1模型

OpenAI的最新推理系列AI大模型“Strawberry”，包括“o1-preview”和成本较低的“o1 mini”版本。该模型通过强化学习训练，具备复杂的推理能力和多模态理解能力。它采用了“思维链”机制，增强推理透明度，具备自我纠错功能。在国际数学奥林匹克等基准测试中表现出色，展现出强大的性能。设计时考虑了安全性、可靠性和成本效率。 ---

AI项目与工具 2025年06月12日 14 点赞 0 评论 717 浏览

模型

首页

模型

列表

默认

浏览次数

发布日期