AI项目与工具

MUMU

MUMU是一种多模态图像生成模型，通过结合文本提示和参考图像来生成目标图像，提高生成的准确性和质量。该模型基于SDXL的预训练卷积UNet，并融合了视觉语言模型Idefics2的隐藏状态。MUMU能够在风格转换和角色一致性方面展现强大的泛化能力，同时在生成图像时能够很好地保留细节。主要功能包括多模态输入处理、风格转换、角色一致性、细节保留以及条件图像生成。

AI项目与工具 2025年06月12日 58 点赞 0 评论 638 浏览

LlamaV

LlamaV-o1是由阿联酋穆罕默德·本·扎耶德人工智能大学等机构开发的多模态视觉推理模型，具备结构化推理和透明性，支持文本、图像和视频等多种模态的信息处理。该模型引入了VRC-Bench基准测试，涵盖4000多个推理步骤，用于全面评估推理能力。其性能优于多个开源模型，适用于医疗影像分析、金融数据解读、教育辅助和工业检测等场景，具有高准确性和可解释性。

AI项目与工具 2025年06月12日 74 点赞 0 评论 638 浏览

万彩商图

万彩商图是一款基于AI技术的图像处理工具，为电商行业提供商品背景替换、模特图生成、批量抠图、高清修复及无损放大等功能。它能够显著提升图片生产效率，优化电商视觉体验，适用于商品展示、广告制作及社交媒体推广等多个场景。

AI项目与工具 2025年06月12日 39 点赞 0 评论 638 浏览

axiom.ai

axiom.ai 是一款面向网页任务自动化的无代码 Chrome 扩展工具，支持数据抓取、表单填写及用户界面操作的自动化，具备与第三方服务集成的能力和 AI 辅助功能，可显著提高工作效率并保障数据安全。

AI项目与工具 2025年06月12日 29 点赞 0 评论 637 浏览

Amazon Nova Premier

Amazon Nova Premier 是亚马逊推出的多模态 AI 模型，支持文本、图像和视频输入，具备超长上下文处理能力（最高达 100 万 token），适用于复杂任务处理、多步骤规划与跨数据源执行。可通过模型蒸馏生成轻量级版本，优化生产部署。支持多语言，具备安全控制机制，广泛应用于金融、法律、软件开发等领域。

AI项目与工具 2025年06月11日 39 点赞 0 评论 637 浏览

Hula

Hula 是一款 AI 视频生成工具，支持将静态照片或视频转换为动态内容，提供多种风格转换功能，如复古、动漫、童话等。用户可生成未来宝宝形象、制作聊天贴纸，并体验“时间旅行”功能，展现不同时代的自我形象。适用于社交媒体内容创作、创意视频制作和个人形象设计等多种场景。

AI项目与工具 2025年06月11日 76 点赞 0 评论 637 浏览

口语精灵

口语精灵是一款基于人工智能的英语口语学习工具，提供1V1智能对话练习，涵盖生活、工作、考试等多场景，支持多种英语口音。其具备发音评估、语法纠错、语句优化等功能，帮助用户提升口语表达的准确性和自然度。同时，该工具提供个性化学习方案和考试备考支持，适用于不同学习阶段的用户。

AI项目与工具 2025年06月12日 61 点赞 0 评论 637 浏览

MagicSlides

MagicSlides是一款以AI为核心的演示文稿制作工具，支持从多种来源生成高质量PPT，包括主题、视频、文档或文本。它具有强大的内容自动生成能力，同时兼容Google Slides和Figma等平台，提供多语言支持和丰富的协作功能，适用于商务、教育、科研等多个领域。

AI项目与工具 2025年06月12日 36 点赞 0 评论 637 浏览

Genesis

Genesis是一款基于开源架构的生成式物理引擎，具备高度准确的物理模拟能力，涵盖物体运动、流体力学、碰撞检测等领域。其显著特点包括超高速模拟、轻量级机器人仿真平台、照片级真实感渲染以及支持自然语言输入的数据生成功能。Genesis旨在推动通用机器人、具身AI及物理AI的发展，适用于机器人训练、游戏开发、影视特效制作等多个领域。

AI项目与工具 2025年06月12日 66 点赞 0 评论 637 浏览

MOFA

MOFA-Video是由腾讯AI实验室和东京大学研究人员开发的开源图像生成视频模型。该工具通过生成运动场适配器对图像进行动画处理，能够通过稀疏控制信号（如手动轨迹、面部关键点序列或音频）实现对视频生成过程中动作的精准控制。MOFA-Video支持零样本学习，能够将多种控制信号组合使用，生成复杂的动画效果，并能生成较长的视频片段。 ---

AI项目与工具 2025年06月12日 22 点赞 0 评论 637 浏览

AI项目与工具 默认 浏览次数 发布时间

AI项目与工具

默认

浏览次数

发布时间