模型 - 智狐AI导航

xAI Grok-2

xAI的Grok-2代表了语言模型技术的新进展，特别是其推理能力，为处理复杂的数据分析和自然语言理解任务提供了强大的工具。

Ai平台模型 1970年01月01日 0 点赞 0 评论 405 浏览

Chromox AI

一个由AlkaidVision开发的文生视频、图生视频的AI工具，专注于将创意转化为视觉故事，适用于各种动态内容生成。

Ai视频生成 2025年06月05日 74 点赞 0 评论 405 浏览

Open-Sora是一个开源视频生成模型，基于DiT架构，通过三个阶段的训练（大规模图像预训练、大规模视频预训练和高质量视频数据微调），生成与文本描述相符的视频内容。该模型包括预训练的VAE、文本编码器和STDiT（Spatial-Temporal Diffusion Transformer）核心组件，利用空间-时间注意力机制和交叉注意力模块实现视频生成。项目旨在提供全面的视频生成模型训练过程，供

AI项目与工具 2024年01月01日 97 点赞 0 评论 405 浏览

Magic3D

Magic3D是GPU制造商Nvidia在2023年2月宣布推出Magic3D，这是一种生成式AI技术，可以根据文本提示生成3D模型。

Ai绘画生成 1970年01月01日 0 点赞 0 评论 405 浏览

Aero

Aero-1-Audio 是一款基于 Qwen-2.5-1.5B 的轻量级音频模型，拥有 1.5 亿参数，专注于长音频处理，支持连续 15 分钟音频输入并保持上下文连贯性。在语音识别、复杂音频分析及指令驱动任务中表现出色，具备高效的训练方法和多任务处理能力，适用于语音助手、实时转写、归档理解等场景。

AI项目与工具 2025年06月11日 43 点赞 0 评论 406 浏览

MedGemma

MedGemma是谷歌推出的开源AI模型，专注于医疗图像与文本分析。它包含4B参数的多模态模型和27B参数的纯文本模型。4B模型擅长解读医疗图像并生成诊断报告，27B模型则用于医疗文本理解与临床推理。支持本地运行或通过Google Cloud部署，适用于医疗诊断、患者分诊、临床决策辅助等场景，提升医疗服务效率与准确性。

AI项目与工具 2025年06月11日 81 点赞 0 评论 406 浏览

llama

这个存储库旨在作为一个最小...

Ai平台模型 1970年01月01日 0 点赞 0 评论 406 浏览

MobileLLM

MobileLLM是一款针对移动设备优化的大型语言模型，具有语言理解与生成、零样本常识推理、聊天交互、API调用、文本重写与摘要生成以及数学问题解决等功能。它通过深度薄型架构、SwiGLU激活函数、嵌入共享和分组查询注意力机制等技术，在低参数环境下实现高效性能，适用于移动聊天、语音助手、内容推荐、教育辅助和移动搜索等多种应用场景。

AI项目与工具 2025年06月12日 52 点赞 0 评论 406 浏览

Spellbook

一款人工智能合同起草和审查助手，Spellbook将AI合同起草与审核集成在Microsoft Word中。它旨在帮助律师和法律专业人士高效起草和审核合同。

生活创意 2025年06月05日 83 点赞 0 评论 406 浏览

SearchAgent

SearchAgent-X是由南开大学和伊利诺伊大学厄巴纳香槟分校（UIUC）研究人员开发的高效推理框架，旨在提升基于大型语言模型（LLM）的搜索Agent效率。通过高召回率的近似检索、优先级感知调度和无停顿检索等技术，显著提高系统吞吐量（1.3至3.4倍），降低延迟（降至原来的1/1.7至1/5），同时保持生成质量。该框架优化资源利用率，适用于智能客服、搜索引擎、企业知识管理等多种场景，为复杂A

AI项目与工具 2025年06月11日 56 点赞 0 评论 406 浏览

模型

首页

模型

列表

默认

浏览次数

发布日期