AI项目与工具

Buildin.AI

Buildin.AI 是一款集 AI 技术与知识管理于一体的云端协作平台，支持文档编辑、项目管理、智能写作和数据分析等功能。平台提供多端同步、实时协作和安全存储，适用于团队协作、个人知识管理及企业应用，旨在提升工作效率与信息处理能力。

AI项目与工具 2025年06月12日 54 点赞 0 评论 866 浏览

MakeAnything

MakeAnything是由新加坡国立大学Show Lab团队开发的多领域程序性序列生成框架，能够根据文本或图像生成高质量的分步教程。它采用扩散变换器和ReCraft模型，支持从文本到过程和从图像到过程的双向生成。覆盖21个领域，包含超24,000个标注序列，具备良好的逻辑连贯性和视觉一致性，适用于教育、艺术、工艺传承及内容创作等多种场景。

AI项目与工具 2025年06月12日 85 点赞 0 评论 590 浏览

MILS

MILS是由Meta AI开发的一种无需额外训练即可为大型语言模型（LLM）提供多模态能力的框架。它通过多步推理、评分反馈和迭代优化，实现图像、视频、音频等多模态内容的生成与理解。MILS支持零样本描述生成、风格迁移、跨模态推理等任务，适用于内容生成、多模态检索、视觉问答等多个场景，具备高效、灵活和无需训练的优势。

AI项目与工具 2025年06月12日 31 点赞 0 评论 638 浏览

OmAgent

OmAgent是由Om AI与浙江大学滨江研究院联合开发的多模态语言代理框架，支持文本、图像、视频等多种输入形式，简化设备端智能代理的开发流程。它具备高效模型集成、灵活算法接口和复杂任务处理能力，适用于视频监控、内容推荐、教育辅助等场景，提升设备智能化水平和用户体验。

AI项目与工具 2025年06月12日 97 点赞 0 评论 785 浏览

Flowin

Flowin是一款结合AI技术的内容创作与协作平台，提供文案生成、文档续写、智能助手等功能，支持多人实时协同编辑和权限管理，适用于教学、学术、商业写作及项目管理等场景，助力高效内容创作与团队协作。

AI项目与工具 2025年06月12日 22 点赞 0 评论 894 浏览

Insight

Insight-V是一款由南洋理工大学、腾讯和清华大学联合研发的多模态大型语言模型，专为提升长链视觉推理能力而设计。该模型通过多智能体系统将任务分解为推理与总结两步，并采用两阶段训练流程优化性能。其渐进式数据生成和多粒度评估方法进一步提升了模型的推理精度，在多个视觉推理基准测试中表现出色。

AI项目与工具 2025年06月12日 98 点赞 0 评论 651 浏览

SmolVLM是一款由Hugging Face开发的轻量级视觉语言模型，专为设备端推理设计。该模型具有三个版本，包括SmolVLM-Base、SmolVLM-Synthetic和SmolVLM-Instruct，分别适用于不同的应用场景。SmolVLM借鉴了Idefics3的理念，采用SmolLM2 1.7B作为语言主干，并通过像素混洗技术提升视觉信息的压缩效率。其训练数据集包括Cauldron和

AI项目与工具 2025年06月12日 62 点赞 0 评论 768 浏览

EasyVideoTrans

EasyVideoTrans是一款开源的AI视频翻译工具，支持从视频中提取音频并翻译字幕，同时提供多样化的声音风格以实现自然的配音效果。它适用于视频创作者、教育机构、企业培训及品牌宣传等领域，能够快速生成高质量的中文版本视频，满足跨语言沟通的需求。

AI项目与工具 2025年06月12日 39 点赞 0 评论 793 浏览

VtripGPT

VtripGPT是一款专为旅游领域设计的AI大模型，采用Transformer架构，结合增量预训练和微调技术，可生成高质量的旅游相关文本回复。它具备对话生成、个性化旅游攻略提供、行程定制、商品推荐以及智能问答等功能，旨在提升旅游规划效率并优化用户体验。VtripGPT已成功应用于多个国家和地区，覆盖了从旅游攻略生成到商品推荐的多种应用场景。

AI项目与工具 2025年06月12日 50 点赞 0 评论 627 浏览

TANGO

TANGO是一个开源框架，利用分层音频运动嵌入和扩散插值网络，生成与目标语音同步的全身手势视频。其主要功能包括高保真视频制作、跨模态对齐、过渡帧生成及外观一致性保持，适用于新闻播报、虚拟YouTuber、在线教育等多个领域。该工具通过先进的技术解决了动作与语音匹配问题，并有效提升了视频内容制作效率。

AI项目与工具 2025年06月12日 78 点赞 0 评论 707 浏览

AI项目与工具 默认 浏览次数 发布时间

AI项目与工具

默认

浏览次数

发布时间