模型 - 智狐AI导航

混元图像2.0

混元图像2.0是腾讯开发的AI图像生成工具，支持文本、语音、草图等多种输入方式，具备实时生成能力。其采用单双流DiT架构和多模态大语言模型，生成图像写实性强、细节丰富，且响应速度快，适用于创意设计、广告营销、教育、游戏等多个领域。用户可通过网页端直接操作，实现高效的图像创作体验。

AI项目与工具 2025年06月11日 41 点赞 0 评论 488 浏览

AgentGen

AgentGen是一款由香港大学与微软联合研发的AI项目框架，旨在通过自动生成多样化环境和任务，显著提升大语言模型（LLM）的规划能力。其核心技术包括环境生成、任务生成和动态难度调节，支持零样本生成和指令微调，适用于机器人控制、智能家居等多个领域。

AI项目与工具 2025年06月12日 71 点赞 0 评论 488 浏览

CodeFuse

CodeFuse-muAgent是由蚂蚁集团CodeFuse团队开发的一款多智能体框架，通过知识图谱引擎驱动智能体的编排和协作，简化复杂工作流程的自动化。它支持多种智能体类型，包括问答、工具使用和代码执行，并具备通信、记忆管理和自定义模型支持等功能，促进智能体间的高效协作。应用场景广泛，涵盖自动化办公流程、客户服务自动化、智能监控和安全、个性化推荐系统以及教育和培训等多个领域。

AI项目与工具 2025年06月12日 35 点赞 0 评论 490 浏览

MobileLLM

MobileLLM是一款针对移动设备优化的大型语言模型，具有语言理解与生成、零样本常识推理、聊天交互、API调用、文本重写与摘要生成以及数学问题解决等功能。它通过深度薄型架构、SwiGLU激活函数、嵌入共享和分组查询注意力机制等技术，在低参数环境下实现高效性能，适用于移动聊天、语音助手、内容推荐、教育辅助和移动搜索等多种应用场景。

AI项目与工具 2025年06月12日 52 点赞 0 评论 490 浏览

GameFactory

GameFactory 是由香港大学与快手科技联合研发的AI框架，专注于解决游戏视频生成中的场景泛化问题。它基于预训练视频扩散模型，结合开放域数据与高质量游戏数据，通过多阶段训练实现动作可控的多样化场景生成。具备高精度动作控制、交互式视频生成及丰富场景支持，适用于游戏开发、自动驾驶模拟及具身智能研究等领域。

AI项目与工具 2025年06月12日 31 点赞 0 评论 490 浏览

ReCapture

ReCapture是一种先进的视频处理技术，由谷歌与新加坡国立大学联合研发。它通过多视图扩散模型和点云渲染生成新视角视频，同时使用掩码视频微调技术优化视频质量，保留场景运动并补全不可见部分，广泛应用于电影制作、视频编辑、虚拟现实及新闻报道等领域。

AI项目与工具 2025年06月12日 55 点赞 0 评论 491 浏览

狸谱

狸谱是一款集AI图像处理与互动创作于一体的多功能工具，提供“灵魂提取器”功能用于生成物体相关人设形象，同时拥有AI壁纸漫画创作、跑团剧情互动及自定义画风等功能。狸谱凭借其多模态大模型技术和丰富的应用场景，满足用户在娱乐、创意、教育等多个领域的多样化需求。

AI项目与工具 2025年06月12日 96 点赞 0 评论 491 浏览

Truewind

Truewind是一款人工智能记账和财务工具，旨在让创业公司的后台财务更简单、更高效。它提供人工智能和礼宾服务的结合，通过准确的簿记、详细的财务模型和更快的月度结帐，提供令人...

财经投资 1970年01月01日 0 点赞 0 评论 491 浏览

CatVTON

CatVTON是一款基于先进AI算法的虚拟试衣工具，能够将服装从一个人无缝转移到另一个人身上，同时保留服装细节的一致性。该工具采用轻量级网络架构，减少了计算资源的需求，无需复杂的预处理步骤，即可实现高效的服装试穿效果。CatVTON适用于电子商务、时尚设计、个性化推荐等多个领域，为用户提供了便捷且真实感强的虚拟试衣体验。

AI项目与工具 2025年06月12日 42 点赞 0 评论 491 浏览

ELLA（Efficient Large Language Model Adapter）是一种由腾讯研究人员开发的方法，旨在提升文本到图像生成模型的语义对齐能力。它通过引入时序感知语义连接器（TSC），动态提取预训练大型语言模型（LLM）中的时序依赖条件，从而提高模型对复杂文本提示的理解能力。ELLA无需重新训练，可以直接应用于预训练的LLM和U-Net模型，且能与现有模型和工具无缝集成，显著提升

AI项目与工具 2024年01月01日 74 点赞 0 评论 491 浏览

模型

首页

模型

列表

默认

浏览次数

发布日期