AI项目与工具

LlamaV

LlamaV-o1是由阿联酋穆罕默德·本·扎耶德人工智能大学等机构开发的多模态视觉推理模型，具备结构化推理和透明性，支持文本、图像和视频等多种模态的信息处理。该模型引入了VRC-Bench基准测试，涵盖4000多个推理步骤，用于全面评估推理能力。其性能优于多个开源模型，适用于医疗影像分析、金融数据解读、教育辅助和工业检测等场景，具有高准确性和可解释性。

AI项目与工具 2025年06月12日 74 点赞 0 评论 638 浏览

万彩商图

万彩商图是一款基于AI技术的图像处理工具，为电商行业提供商品背景替换、模特图生成、批量抠图、高清修复及无损放大等功能。它能够显著提升图片生产效率，优化电商视觉体验，适用于商品展示、广告制作及社交媒体推广等多个场景。

AI项目与工具 2025年06月12日 39 点赞 0 评论 638 浏览

AdCreative.ai

AdCreative.ai是一款基于人工智能技术的广告创意生成工具，能够自动生产高质量的广告文案、图片、视频等内容，支持多平台投放，包括Facebook、Google、LinkedIn等。其主要功能涵盖广告创意生成、品牌资料管理、竞争对手广告分析及批量素材制作，旨在帮助企业优化广告策略并提升广告表现。

AI项目与工具 2025年06月12日 23 点赞 0 评论 639 浏览

Depth Pro

Depth Pro 是一款由苹果公司开发的先进单目深度估计模型，能够在不到一秒的时间内从单张2D图像生成高分辨率的3D深度图。它支持零样本学习，无需依赖相机内参即可提供度量级深度信息，并在细节捕捉方面表现出色。Depth Pro 在增强现实、3D重建、图像编辑、机器人导航和自动驾驶等领域展现出广泛的应用前景。

AI项目与工具 2025年06月12日 37 点赞 0 评论 639 浏览

WeGen

WeGen是一款由中国科学技术大学等机构联合开发的多模态生成模型，结合多模态大语言模型与扩散模型，支持文本到图像生成、图像编辑、风格迁移等多种视觉任务。其特点包括对模糊指令的多样化响应、高一致性输出以及交互式生成能力，适用于创意设计、内容创作等多个领域。

AI项目与工具 2025年06月12日 79 点赞 0 评论 639 浏览

MonkeyOCR

MonkeyOCR是由华中科技大学与金山办公联合开发的文档解析模型，能够高效地将非结构化文档内容转换为结构化信息。其支持多种文档类型和语言，处理复杂文档（如公式、表格）效果显著，处理速度达每秒0.84页。基于SRR三元组范式和MonkeyDoc数据集，模型在准确性和效率上表现优异，适用于自动化业务流程、数字存档、智能教育、医疗记录管理及学术研究等场景。

AI项目与工具 2025年06月11日 15 点赞 0 评论 639 浏览

Quik

Quik是一款由GoPro推出的视频编辑工具，支持自动选取视频亮点、音乐同步及多风格主题应用。用户可通过手动编辑调整视频速度、添加滤镜和文字，同时享受丰富的音乐资源库和云存储功能，适用于户外运动、家庭聚会、旅行记录等多种场景。

AI项目与工具 2025年06月12日 74 点赞 0 评论 639 浏览

EzAudio

EzAudio是一款基于文本到音频（Text-to-Audio, T2A）生成模型，通过优化的扩散变换器架构和高效的数据训练策略，实现了快速生成高质量音频的功能。它支持多种应用场景，如音乐创作、影视后期制作、语音合成等，并具备高保真度和低资源消耗的特点。

AI项目与工具 2025年06月12日 73 点赞 0 评论 639 浏览

ChefBot

ChefBot是一款基于AI技术的个性化食谱生成工具，能够根据用户提供的食材和饮食偏好，在短时间内生成定制化食谱，帮助用户高效规划餐食、减少食物浪费，同时支持健康饮食管理与烹饪技能提升。其功能包括AI驱动的食谱生成、个性化餐食规划、节约时间及减少食物浪费等，广泛适用于家庭烹饪、健康饮食管理、烹饪新手培训以及创意菜肴开发等多个场景。

AI项目与工具 2025年06月12日 22 点赞 0 评论 639 浏览

MemenomeLM

MemenomeLM是Brainrot AI推出的AI工具，专为Z世代研究人员设计，可将PDF文档、笔记等资料转化为有趣且互动性强的视频内容。具备多模态理解能力，能用简单语言解释复杂概念并提供现实例子，支持生成多种格式的短视频，如Brainrot Quiz、Yap Dollar等，还可添加搞笑音效、生成图片及选择不同语音。

AI项目与工具 2025年06月11日 35 点赞 0 评论 640 浏览

AI项目与工具 默认 浏览次数 发布时间

AI项目与工具

默认

浏览次数

发布时间