模型 - 智狐AI导航

Ola

Ola是一款由多机构联合开发的全模态语言模型，支持文本、图像、视频和音频等多种输入形式。通过渐进式模态对齐策略，逐步扩展模型的多模态理解能力，同时采用流式解码技术提升交互体验。其架构融合多种编码器与解码器，结合局部-全局注意力机制，实现高效多模态处理，在多项任务中表现优异。

AI项目与工具 2025年06月12日 98 点赞 0 评论 780 浏览

IterComp

IterComp是一种基于迭代反馈学习机制的文本到图像生成框架，由多所顶尖高校的研究团队联合开发。它通过整合多个开源扩散模型的优势，利用奖励模型和迭代优化策略，显著提升了生成图像的质量和准确性，尤其在多类别对象组合与复杂语义对齐方面表现突出，同时保持较低的计算开销。IterComp适用于艺术创作、游戏开发、广告设计、教育和媒体等多个领域。

AI项目与工具 2025年06月12日 31 点赞 0 评论 780 浏览

Seaweed APT

Seaweed APT是字节跳动研发的对抗性后训练模型，支持图像和视频的一站式生成。其通过在真实数据上进行对抗性训练，实现单步高质量输出，包括1024px图像和1280×720、24fps视频。该模型采用先进的生成器和判别器设计，结合近似R1正则化技术，提升训练稳定性和生成质量。适用于视频广告、影视创作、社交媒体等内容生产场景。

AI项目与工具 2025年06月12日 52 点赞 0 评论 780 浏览

MiniRAG

MiniRAG是由香港大学开发的检索增强生成（RAG）系统，专为资源受限环境下的小型语言模型（SLMs）优化。其核心在于语义感知的异构图索引和轻量级拓扑增强检索方法，能够在降低存储需求的同时实现高性能知识检索与推理。该工具适用于即时通讯、个人内容管理、本地文档检索及隐私敏感场景，具备良好的适应性和实用性，为边缘计算和低功耗设备提供高效解决方案。

AI项目与工具 2025年06月12日 79 点赞 0 评论 780 浏览

Paper2Coder

Paper2Code是一款由韩国科学技术院与DeepAuto.ai联合开发的AI工具，基于多Agent大语言模型，能够将机器学习论文自动转换为可运行的代码仓库。其核心流程包括规划、分析和代码生成三个阶段，确保生成的代码结构清晰、逻辑严谨，并忠实于原始论文。该工具显著提升了研究复现效率，适用于学术研究、教学、工业应用等多个场景，是推动AI研究落地的重要工具。

AI项目与工具 2025年06月11日 91 点赞 0 评论 781 浏览

Darwin模型

Darwin模型是一个专门为自然科学领域（尤其是物理、化学和材料科学）设计的大语言模型（LLM），只要通过整合结构化和非结构化的科学知识，提升语言模型在科学研究

Ai平台模型 2025年06月05日 19 点赞 0 评论 781 浏览

SongCreator

SongCreator是一款基于AI技术的音乐生成工具，由清华大学深圳国际研究生院与香港中文大学等机构联合开发。它采用双序列语言模型（DSLM）和注意力掩码策略，支持歌词到歌曲、歌词到声乐、伴奏到歌曲等多种音乐生成任务，并允许用户灵活调整生成内容的声学特性。SongCreator适用于音乐制作、教育、娱乐、内容创作等多个领域，为用户提供高效便捷的音乐解决方案。

AI项目与工具 2025年06月12日 88 点赞 0 评论 781 浏览

Kimi+

Kimi 是由月之暗面科技有限公司开发的人工智能助手。它具备多语言对话能力，擅长中文和英文，能够处理长文本，支持文件阅读和网址解析，具备搜索能力，并且能够结合搜索结果为用户...

Ai编程建站 2026年07月29日 0 点赞 0 评论 781 浏览

eeChat

简洁易用的大模型本地部署工具，支持开源模型 DeepSeek-R1， DLlama 3, Phi-4, Mistral, Gemma 3 等模型的本地化部署，专注于数据安全、隐私保护和高效的AI对话体验。

Ai开源项目 2025年06月05日 69 点赞 0 评论 782 浏览

Gemma 3n

Gemma 3n 是谷歌 I/O 开发者大会推出的端侧多模态 AI 模型，基于 Gemini Nano 架构，采用逐层嵌入技术，将内存占用压缩至 2-4B 参数模型水平。支持文本、图像、短视频和音频输入，可生成结构化文本输出，并具备音频转录、情感分析等功能。可在本地设备运行，响应时间低至 50 毫秒，适用于语音助手、内容生成和学术任务定制。

AI项目与工具 2025年06月11日 87 点赞 0 评论 782 浏览

模型

首页

模型

列表

默认

浏览次数

发布日期

Ola