训练 - 智狐AI导航

3DIS

3DIS-FLUX是一种基于深度学习的多实例图像生成框架，采用两阶段流程：先生成场景深度图，再进行细节渲染。通过注意力机制实现文本与图像的精准对齐，无需额外训练即可保持高生成质量。适用于电商设计、创意艺术、虚拟场景构建及广告内容生成等领域，具备良好的兼容性和性能优势。

AI项目与工具 2025年06月12日 32 点赞 0 评论 590 浏览

BoldVoice

BoldVoice 是一款专注于英语发音训练的工具，结合专业口音课程与AI语音分析技术，帮助非英语母语者提升发音准确性和口语自信。用户可通过录音获得实时反馈与改进建议，并根据个人母语背景定制学习计划。应用还提供发音测试、口音对比和多场景练习功能，适用于职场、考试、日常交流及表演等领域，有效提升英语口语能力。

AI项目与工具 2025年06月12日 100 点赞 0 评论 498 浏览

ELSA Speak

ELSA Speak是一款AI驱动的英语学习工具，专注于提升用户的发音、语法、词汇及沟通能力。它提供即时发音反馈、个性化学习计划、水平评估测试以及趣味化学习内容，适用于个人学习、课堂教学、企业培训等多种场景，助力用户在学术和职业发展中提升英语水平。

AI项目与工具 2025年06月12日 12 点赞 0 评论 551 浏览

Tarsier2

Tarsier2是字节跳动研发的大规模视觉语言模型，擅长生成高精度视频描述并在多项视频理解任务中表现优异。其核心技术包括大规模数据预训练、细粒度时间对齐微调以及直接偏好优化（DPO）。该模型在视频问答、定位、幻觉检测及具身问答等任务中均取得领先成绩，支持多语言处理，具有广泛的应用潜力。

AI项目与工具 2025年06月12日 59 点赞 0 评论 359 浏览

YuE

YuE 是一款由香港科技大学与 Multimodal Art Projection 联合开发的开源 AI 音乐生成模型，支持多语言和多种音乐风格，如流行、金属、爵士、嘻哈等。通过语义增强音频分词器、双分词技术和三阶段训练方案，解决长上下文处理与音乐生成难题，生成结构连贯、旋律优美的歌曲。模型完全开源，用户可自由使用和定制，适用于音乐创作、影视配乐、游戏音效及社交媒体内容制作等多个场景。

AI项目与工具 2025年06月12日 23 点赞 0 评论 572 浏览

《DeepSeek从入门到精通》

《DeepSeek从入门到精通》是一份系统介绍DeepSeek技术特点、应用场景及使用方法的指南。文章涵盖提示语设计、模型选择、AI伦理、实战案例等内容，旨在帮助用户提升AI交互效率，掌握高级提示语设计技巧，推动人机协作能力的发展。适用于开发者、研究人员及AI初学者。

AI项目与工具 2025年06月12日 99 点赞 0 评论 478 浏览

Oumi

Oumi 是一个开源 AI 平台，支持从数据准备到模型部署的全流程开发。它提供零样板代码体验，支持多种训练方法和多模态模型，适用于自动驾驶、人机交互、学术研究等多个场景。平台具备高效的分布式训练能力和灵活的部署选项，适合企业和研究机构使用。

AI项目与工具 2025年06月12日 26 点赞 0 评论 523 浏览

MILS

MILS是由Meta AI开发的一种无需额外训练即可为大型语言模型（LLM）提供多模态能力的框架。它通过多步推理、评分反馈和迭代优化，实现图像、视频、音频等多模态内容的生成与理解。MILS支持零样本描述生成、风格迁移、跨模态推理等任务，适用于内容生成、多模态检索、视觉问答等多个场景，具备高效、灵活和无需训练的优势。

AI项目与工具 2025年06月12日 31 点赞 0 评论 384 浏览

SynCD

SynCD是由卡内基梅隆大学与Meta联合开发的高质量合成训练数据集，用于提升文本到图像模型的定制化能力。它通过生成同一对象在不同视角、光照和背景下的图像，结合共享注意力机制和3D资产引导，确保对象一致性。该数据集支持无调优模型训练，提升图像质量和身份保持能力，广泛应用于个性化内容生成、创意设计、虚拟场景构建等领域。

AI项目与工具 2025年06月12日 92 点赞 0 评论 431 浏览

LIMO

LIMO是由上海交通大学研发的一种高效推理方法，通过少量高质量训练样本激活大语言模型的复杂推理能力。其核心假设是“少即是多推理假设”，即在预训练阶段已具备丰富知识的模型中，复杂推理能力可通过精心设计的样本被有效激发。LIMO在多个数学推理基准测试中表现优异，且数据使用效率极高，仅需1%的数据即可达到显著效果。适用于教育、科研、工业和医疗等多个领域。

AI项目与工具 2025年06月12日 96 点赞 0 评论 518 浏览

训练

首页

训练

列表

默认

浏览次数

发布日期