AI模型 - 智狐AI导航

TIGER

TIGER是由清华大学研发的轻量级语音分离模型，采用时频交叉建模策略与多尺度注意力机制，有效提升语音分离性能，同时显著降低计算和参数开销。模型通过频带切分优化资源利用，适应复杂声学环境，广泛应用于会议记录、视频剪辑、电影音频处理及智能语音助手等领域。

AI项目与工具 2025年06月12日 98 点赞 0 评论 790 浏览

ENEL

ENEL是一种无编码器架构的3D大型多模态模型，通过直接处理点云数据并结合LLM实现高效语义编码与几何结构理解。其核心技术包括LLM嵌入的语义编码和分层几何聚合策略，在3D对象分类、字幕生成和视觉问答等任务中表现出色，性能接近更大规模模型。该模型适用于工业自动化、虚拟现实及复杂3D结构分析等领域。

AI项目与工具 2025年06月12日 53 点赞 0 评论 691 浏览

通古大模型

通古大模型是由华南理工大学研发的古籍文言文处理AI工具，基于百川2-7B-Base进行增量预训练，结合24.1亿古籍语料和400万对话数据，采用RAT和RAG技术提升古籍处理效果。支持古文句读、文白翻译、诗词创作、古籍赏析、检索问答及辅助整理等功能，广泛应用于古籍数字化、教育、文化传承与学术研究等领域。

AI项目与工具 2025年06月12日 61 点赞 0 评论 741 浏览

Sa2VA

Sa2VA是由字节跳动联合多所高校开发的多模态大语言模型，结合SAM2与LLaVA技术，实现对图像和视频的密集、细粒度理解。它支持指代分割、视觉对话、视觉提示理解等多种任务，具备零样本推理能力和复杂场景下的高精度分割效果。适用于视频编辑、智能监控、机器人交互、内容创作及自动驾驶等多个领域。

AI项目与工具 2025年06月12日 66 点赞 0 评论 615 浏览

OpenThinker

OpenThinker-32B 是一款由多所高校联合开发的开源推理模型，拥有 328 亿参数和 16,000 token 上下文支持，以高效的数据利用和严格的质量控制著称。模型基于少量数据实现优异性能，适用于数学、科学、代码生成等多种推理任务。全面开源，提供模型权重、代码和数据集，支持研究与开发扩展。

AI项目与工具 2025年06月12日 23 点赞 0 评论 750 浏览

UltraMem

UltraMem是字节跳动推出的超稀疏模型架构，通过优化内存访问和计算效率，显著降低推理成本并提升速度。其核心技术包括多层结构改进、TDQKR和IVE，使模型在保持性能的同时具备更强的扩展性。适用于实时推理、大规模模型部署及多个行业场景。

AI项目与工具 2025年06月12日 11 点赞 0 评论 553 浏览

YAYI

YAYI-Ultra是中科闻歌研发的企业级大语言模型，具备多领域专业能力与多模态内容生成能力，支持数学、代码、金融、中医等领域。模型支持超长文本处理、数据分析、任务规划及联网创作，适用于媒体、医疗、财税等行业。采用混合专家架构，结合指令微调技术，在多项评测中表现优异，提供高效、精准的智能化服务。

AI项目与工具 2025年06月12日 25 点赞 0 评论 812 浏览

Satori

Satori是一款由MIT和哈佛大学等机构联合开发的7B参数大语言模型，专注于提升推理能力。其采用COAT机制和两阶段训练框架，结合强化学习优化模型性能，具备自回归搜索、数学推理、跨领域任务处理以及自我纠错等核心能力。Satori在数学和逻辑推理任务中表现突出，广泛应用于科研、教育、智能客服等多个领域，代码、数据和模型均已开源。

AI项目与工具 2025年06月12日 79 点赞 0 评论 761 浏览

Kiln AI

Kiln AI 是一款开源 AI 开发工具，支持多平台使用，提供零代码微调、合成数据生成及团队协作功能。内置交互式工具，兼容多种模型和 AI 提供商，支持 Git 版本控制与自动部署，适用于智能客服、医疗、教育、金融等场景，注重数据隐私与安全性。

AI项目与工具 2025年06月12日 59 点赞 0 评论 637 浏览

WorldSense

WorldSense是由小红书与上海交通大学联合开发的多模态基准测试工具，用于评估大型语言模型在现实场景中对视频、音频和文本的综合理解能力。该平台包含1662个同步视频、3172个问答对，覆盖8大领域及26类认知任务，强调音频与视频信息的紧密耦合。所有数据经专家标注并多重验证，确保准确性。适用于自动驾驶、智能教育、监控、客服及内容创作等多个领域，推动AI模型在多模态场景下的性能提升。

AI项目与工具 2025年06月12日 61 点赞 0 评论 528 浏览

AI模型

首页

AI模型

列表

默认

浏览次数

发布日期