AI项目与工具

PaliGemma 2

PaliGemma 2是一款由Google DeepMind研发的视觉语言模型（VLM），结合了SigLIP-So400m视觉编码器与Gemma 2语言模型，支持多种分辨率的图像处理。该模型具备强大的知识迁移能力和出色的学术任务表现，在OCR、音乐乐谱识别以及医学图像报告生成等方面实现了技术突破。它能够处理多模态任务，包括图像字幕生成、视觉推理等，并支持量化和CPU推理以提高计算效率。

AI项目与工具 2025年06月12日 10 点赞 0 评论 800 浏览

YuE

YuE 是一款由香港科技大学与 Multimodal Art Projection 联合开发的开源 AI 音乐生成模型，支持多语言和多种音乐风格，如流行、金属、爵士、嘻哈等。通过语义增强音频分词器、双分词技术和三阶段训练方案，解决长上下文处理与音乐生成难题，生成结构连贯、旋律优美的歌曲。模型完全开源，用户可自由使用和定制，适用于音乐创作、影视配乐、游戏音效及社交媒体内容制作等多个场景。

AI项目与工具 2025年06月12日 23 点赞 0 评论 800 浏览

讯飞星火PC版

讯飞星火PC版是科大讯飞推出的一款桌面级AI工具，集成了强大的跨领域知识理解和语言处理能力。它支持自然对话方式，涵盖写作、搜索、问答、翻译、PPT生成、图像生成等功能，并新增了深度搜索与多模态交互能力，可广泛应用于办公、教育、内容创作和技术开发等领域，提供高效便捷的智能服务。

AI项目与工具 2024年10月29日 65 点赞 0 评论 800 浏览

Mindsera

Mindsera是一款基于AI技术的日记应用，专注于提升用户的心理健康和认知能力。它能分析写作内容，识别情绪和思维模式，并提供智能反馈和个性化建议。支持语音输入、自动总结、习惯追踪等功能，结合多种思维模型帮助用户优化决策和目标管理。界面简洁，注重隐私保护，适合用于自我反思、情绪管理和日常记录。

AI项目与工具 2025年06月11日 13 点赞 0 评论 800 浏览

WhisperKeyboard

WhisperKeyboard 是一款基于 OpenAI Whisper 技术的 AI 语音输入工具，支持多语言实时语音转文字，适用于写作、编程、会议记录等场景。具备离线识别、文本润色、多语言翻译和隐私保护等功能，兼容多平台，提升输入效率与文本质量。

AI项目与工具 2025年06月12日 76 点赞 0 评论 800 浏览

3DIS

3DIS-FLUX是一种基于深度学习的多实例图像生成框架，采用两阶段流程：先生成场景深度图，再进行细节渲染。通过注意力机制实现文本与图像的精准对齐，无需额外训练即可保持高生成质量。适用于电商设计、创意艺术、虚拟场景构建及广告内容生成等领域，具备良好的兼容性和性能优势。

AI项目与工具 2025年06月12日 32 点赞 0 评论 800 浏览

WIRESTOCK

WIRESTOCK是一个面向AI艺术创作者的在线平台，支持作品上传与销售，提供AI绘画工具和创意挑战，与多家图库合作扩大曝光，帮助创作者实现作品价值最大化。主要功能包括作品分类管理、收入追踪以及多渠道分发。

AI项目与工具 2025年06月12日 47 点赞 0 评论 800 浏览

FastVLM

FastVLM是一款高效的视觉语言模型，采用FastViTHD混合视觉编码器，显著提升高分辨率图像处理速度并减少token数量。其在保持高性能的同时，降低了计算成本和模型复杂度。适用于视觉问答、图文匹配、文档理解、图像描述生成等多模态任务，具备良好的实用性和扩展性。

AI项目与工具 2025年06月11日 85 点赞 0 评论 800 浏览

Botify AI

Botify AI是一款基于人工智能的聊天机器人平台，提供高度可定制的数字角色和自然语言交互功能。用户可以通过直观的界面和强大的编辑工具创建和管理聊天机器人，支持多种应用场景，如客户服务、市场营销、教育培训等。平台具备自然语言处理、多媒体内容集成及跨平台兼容性等特点，旨在提升用户体验并优化工作效率。

AI项目与工具 2025年06月12日 94 点赞 0 评论 799 浏览

Open Materials 2024

Open Materials 2024 (OMat24) 是Meta发布的开源数据集，包含超过1.1亿个无机材料的密度泛函理论（DFT）计算数据，并配备了预训练的图神经网络模型EquiformerV2。该模型在材料的基态稳定性及形成能预测方面具有卓越表现，为新材料的发现和设计提供了高效工具。其核心功能包括大规模数据集支持、高效的材料属性预测以及在多个领域（如能源、环境、催化等）的实际应用潜力。

AI项目与工具 2025年06月12日 39 点赞 0 评论 799 浏览

AI项目与工具 默认 浏览次数 发布时间

AI项目与工具

默认

浏览次数

发布时间