AI项目与工具

STIV

STIV是一款由苹果公司开发的视频生成大模型，具有8.7亿参数，擅长文本到视频（T2V）及文本图像到视频（TI2V）任务。它通过联合图像-文本分类器自由引导（JIT-CFG）技术提升生成质量，并结合时空注意力机制、旋转位置编码（RoPE）及流匹配训练目标优化性能。STIV支持多种应用场景，包括视频预测、帧插值、长视频生成等，适用于娱乐、教育、广告及自动驾驶等多个领域。

AI项目与工具 2025年06月12日 57 点赞 0 评论 529 浏览

Eagle 2.5

Eagle 2.5 是一款由英伟达开发的视觉语言模型，专注于长上下文多模态学习，具备处理高分辨率图像和长视频序列的能力。其参数规模为 8B，但性能接近更大模型。采用信息优先采样和渐进式后训练策略，提升模型稳定性与适应性。支持多样任务，适用于视频分析、图像处理、内容创作及教育等多个领域。

AI项目与工具 2025年06月11日 59 点赞 0 评论 530 浏览

QRBTF

QRBTF是一款基于AI技术的二维码生成工具，结合ControlNet和Stable Diffusion模型，支持用户通过关键词和参数生成个性化二维码。提供多种参数调节选项，并支持SVG、JPG、PNG等格式输出，适用于品牌营销、内容分享和创意设计等多种场景，同时具备二维码扫描测试功能，确保二维码的可用性。

AI项目与工具 2025年06月11日 21 点赞 0 评论 530 浏览

MVPaint

MVPaint是一款基于同步多视角扩散技术的3D纹理生成框架，具备同步多视角生成、空间感知3D修补和UV细化三大核心功能。它能够生成高分辨率、无缝且多视图一致的纹理，广泛应用于游戏开发、动画制作、虚拟现实、增强现实及建筑可视化等领域。

AI项目与工具 2025年06月12日 38 点赞 0 评论 530 浏览

PictureThis

PictureThis是一款基于AI技术的植物识别应用，支持超过17000种植物的精准识别，具备疾病诊断、个性化护理建议、毒性警告等功能。用户可通过拍照快速获取植物信息，提升园艺管理效率。应用支持多语言，适合全球用户使用，同时提供社区互动和离线功能，方便日常使用。

AI项目与工具 2025年06月12日 82 点赞 0 评论 531 浏览

DeepEyes

DeepEyes是由小红书团队和西安交通大学联合开发的多模态深度思考模型，基于端到端强化学习实现“用图思考”能力，无需依赖监督微调。它在推理过程中动态调用图像工具，增强对细节的感知与理解，在视觉推理基准测试V* Bench上准确率高达90.1%。具备图像定位、幻觉缓解、多模态推理和动态工具调用等功能，适用于教育、医疗、交通、安防和工业等多个领域。

AI项目与工具 2025年06月11日 21 点赞 0 评论 531 浏览

Medio.cool

Medio.cool是一款面向企业海外市场的AI视频编辑工具，提供视频水印去除、商品翻译、商品解说视频自动生成等功能。它支持多语言翻译，涵盖超过100种国际语言，并能一键下载4K高清原视频，适用于YouTube、TikTok等多个平台，助力企业高效实现全球化推广。

AI项目与工具 2025年06月12日 37 点赞 0 评论 532 浏览

Luzia

Luzia是由西班牙初创公司Amperity开发的一款人工智能聊天机器人，主要服务于西语和葡语市场。它具备个性化设计和人性化交流的特点，能够模拟不同角色以适应各种对话场景。此外，Luzia还集成了数学问题解答、PDF阅读器和图像识别等多种实用工具，增强了其实用性和用户体验。

AI项目与工具 2025年06月12日 45 点赞 0 评论 532 浏览

Paper Digest

Paper Digest是一个专注于学术研究的人工智能平台，具备文献综述生成、研究助手、AI阅读器和AI写作者等功能。它能够帮助用户高效获取和整理学术资源，提供个性化定制的信息服务，并支持多领域的研究需求。通过实时更新的论文数据和灵活的筛选机制，Paper Digest为学术界、教育界、产业研发及政策制定等领域提供了强大的支持。 ---

AI项目与工具 2025年06月12日 37 点赞 0 评论 532 浏览

汉王语音王

汉王语音王是一款由汉王科技开发的智能语音应用程序，集成了AI语音记录、翻译和同声传译等功能。基于自主研发的多模态大模型，它支持高精度的语音转写、拍摄与录音同步、智能总结和实时翻译，适用于多语言环境。通过集成OCR技术，它能够生成图文并茂的多媒体记录，显著提高工作效率。

AI项目与工具 2025年06月12日 52 点赞 0 评论 532 浏览

AI项目与工具 默认 浏览次数 发布时间

AI项目与工具

默认

浏览次数

发布时间