AI项目与工具

UniFluid

UniFluid是由谷歌DeepMind与麻省理工学院联合开发的统一自回归框架，支持图像生成与视觉理解任务。它通过连续视觉标记处理多模态输入，结合Gemma模型和VAE技术，实现高质量图像生成与强大视觉理解能力。该框架在图像编辑、视觉问答和图像描述等任务中表现出色，具备良好的下游任务迁移能力，适用于创意设计、内容创作等多个领域。

AI项目与工具 2025年06月12日 54 点赞 0 评论 752 浏览

ENEL

ENEL是一种无编码器架构的3D大型多模态模型，通过直接处理点云数据并结合LLM实现高效语义编码与几何结构理解。其核心技术包括LLM嵌入的语义编码和分层几何聚合策略，在3D对象分类、字幕生成和视觉问答等任务中表现出色，性能接近更大规模模型。该模型适用于工业自动化、虚拟现实及复杂3D结构分析等领域。

AI项目与工具 2025年06月12日 53 点赞 0 评论 805 浏览

Websim

Websim是一款基于AI技术的网页开发工具，用户只需输入文本提示，即可快速生成网站或应用程序。它支持智能界面设计、自动代码生成及项目托管，适用于个人创意实现、企业开发、教育及市场营销等多个场景。无需编程基础，大幅降低开发门槛，提高项目构建效率。

AI项目与工具 2025年06月12日 69 点赞 0 评论 851 浏览

Mind GPT

Mind GPT-3o是一款由理想汽车推出的大规模多模态端到端人工智能模型，集成了语音、视觉与语言理解技术，具备记忆、规划、工具集成及表达能力。它不仅能理解复杂信息，还能提供个性化服务，如智能驾驶辅助、家居设备控制、日程管理和健康咨询等。通过强化逻辑推理与上下文理解，该模型实现了从感知到表达的智能化跨越，为用户提供全面的支持。

AI项目与工具 2025年06月12日 65 点赞 0 评论 903 浏览

Sora

Sora是一款由OpenAI开发的AI视频生成工具，支持文本、图像和视频输入，生成高质量的1080p分辨率视频，最长可达20秒。该工具基于DALL·E和GPT模型，具有强大的创意表达能力，并配备剪辑和社区功能，适合内容创作者、营销人员、教育工作者以及影视制作人使用。

AI项目与工具 2025年06月12日 29 点赞 0 评论 890 浏览

WebDreamer

WebDreamer是一款基于大型语言模型的网络智能体，专注于通过模拟和预测网络交互结果来进行高效的任务规划与决策。它具备模拟函数、评分函数以及候选动作生成等功能，能够显著提升网络任务执行的效率与安全性，同时支持多种应用场景，包括网页自动化、智能搜索、客户服务等领域。

AI项目与工具 2025年06月12日 35 点赞 0 评论 602 浏览

ecrett music

Ecrett Music 是一个利用人工智能技术帮助用户高效创作免版税音乐的在线平台。它允许用户通过设定场景、情感及音乐类型等参数自动生成背景音乐，并提供多种编辑选项以满足个性化需求。同时，该平台还具备强大的音乐管理和匹配功能，适用于视频、游戏、播客等多个领域。

AI项目与工具 2025年06月12日 49 点赞 0 评论 609 浏览

JobJump

JobJump是一款基于AI技术的视频面试助手扩展程序，支持与Google Meet、Zoom及Microsoft Teams等平台兼容。它具备多语言支持、行业和职位定制化服务等功能，能够实时识别面试问题并提供个性化答案提示，帮助求职者在面试中展现最佳状态。适用于技术、非技术、多语言及远程面试场景，特别适合职业转换者。

AI项目与工具 2025年06月12日 91 点赞 0 评论 740 浏览

Dream Screen

Dream Screen 是一款基于生成式人工智能技术的视频背景生成工具，旨在帮助创作者通过简单文本输入快速生成高质量视频背景。它提供了多种风格选择，支持个性化定制，并显著简化了短视频制作流程，尤其适用于社交媒体、教育、商业广告及影视制作等领域。其核心优势在于无需专业技能即可生成专业级视觉效果，从而提升内容吸引力与观众体验。

AI项目与工具 2025年06月12日 73 点赞 0 评论 734 浏览

Still

Still-Moving是一款由DeepMind开发的AI视频生成框架，主要功能包括通过轻量级的空间适配器将用户定制的文本到图像（T2I）模型特征适配至文本到视频（T2V）模型，实现无需特定视频数据即可生成定制视频。其核心优势在于结合T2I模型的个性化和风格化特点与T2V模型的运动特性，从而生成高质量且符合用户需求的视频内容。

AI项目与工具 2025年06月12日 49 点赞 0 评论 801 浏览

AI项目与工具 默认 浏览次数 发布时间

AI项目与工具

默认

浏览次数

发布时间