训练 - 智狐AI导航

Pixel Reasoner

Pixel Reasoner是由多所高校联合开发的视觉语言模型，通过像素空间推理增强对视觉信息的理解和分析能力。它支持直接对图像和视频进行操作，如放大区域或选择帧，以捕捉细节。采用两阶段训练方法，结合指令调优和好奇心驱动的强化学习，提升视觉推理性能。在多个基准测试中表现优异，适用于视觉问答、视频理解等任务，广泛应用于科研、教育、工业质检和内容创作等领域。

AI项目与工具 2025年06月11日 30 点赞 0 评论 553 浏览

LabelLLM

一款开源免费的大模型对话标注平台

Ai平台模型 1970年01月01日 0 点赞 0 评论 553 浏览

PixelWave Flux

PixelWave Flux.1-dev 03 是一款基于 FLUX.1-dev 模型优化的 AI 图像生成工具，具备卓越的模型泛化能力和细节处理能力。它支持多种艺术风格生成，如摄影、动漫等，同时通过微调提升了图像的写实性和审美质量。该工具采用混合精度训练和多分辨率采样技术，适用于艺术创作、游戏开发、电影制作及广告设计等多个领域。 ---

AI项目与工具 2025年06月12日 68 点赞 0 评论 552 浏览

WeDraw

WeDraw专注于人工智能AI绘画和大模型语料数据合成领域，是一支充满激情和创意的团队。

AI服务商 2025年06月05日 77 点赞 0 评论 551 浏览

Crawl4LLM

Crawl4LLM是由清华与CMU联合开发的智能爬虫系统，通过评估网页对大语言模型预训练的价值，提升数据获取效率。支持多种爬取模式，具备状态保存、数据可视化功能，并与DCLM框架兼容。采用多维度评分机制优化爬取策略，减少低价值内容抓取，降低对网站负担，适用于LLM预训练、数据集构建等场景。

AI项目与工具 2025年06月12日 55 点赞 0 评论 550 浏览

Gemma 3 QAT

Gemma 3 QAT 是谷歌推出的开源 AI 模型，采用量化感知训练技术，在降低显存需求的同时保持高性能。它支持多模态任务，具备 128,000-token 长上下文处理能力，并可在消费级 GPU 和边缘设备上运行。适用于视觉问答、文档分析、长文本生成等场景，同时兼容多种推理框架，便于部署。

AI项目与工具 2025年06月11日 44 点赞 0 评论 550 浏览

Mistral Medium 3

Mistral Medium 3是Mistral AI推出的一款多模态语言模型，兼具高性能与低成本优势，适用于企业级应用。支持混合云部署、定制化微调及多模态任务处理，可广泛应用于编程辅助、智能客服、数据分析及知识管理等领域，具备良好的扩展性和系统集成能力。

AI项目与工具 2025年06月11日 76 点赞 0 评论 545 浏览

DreamOmni

DreamOmni是一款由香港中文大学、字节跳动与香港科技大学联合研发的统一图像生成与编辑模型。它集成了文本到图像生成（T2I）及多种编辑功能，包括指令式编辑、修复、拖拽编辑和参考图像生成。DreamOmni利用合成数据管道高效生成高质量编辑数据，并通过联合训练提升图像生成与编辑质量。该模型在多任务处理、复杂提示兼容性及训练效率优化上表现优异，适用于数字艺术、影视特效、广告设计等多个领域。

AI项目与工具 2025年06月12日 97 点赞 0 评论 542 浏览