Deep Art Effects Deep Art Effects 是一款利用深度学习技术的在线工具,能够将普通照片转换为具备多种艺术风格(如梵高、毕加索等)的作品。其主要功能包括艺术风格转换、高分辨率输出、丰富的艺术风格库以及 API 集成支持。该工具适用于个人娱乐、艺术创作、教育、广告及社交媒体内容创作等多个领域。 AI项目与工具 2025年06月12日 56 点赞 0 评论 213 浏览
RAGFlow RAGFlow是一个开源的RAG(Retrieval-Augmented Generation)引擎,通过深度学习模型解析和理解文档内容,并增强生成能力。它提供了多种功能,包括自动化工作流、包管理、安全漏洞检测与修复、即时开发环境、AI辅助代码编写以及代码审查。RAGFlow的技术原理涵盖了文档理解、检索增强、生成模型、注意力机制、多模态处理、上下文融合和优化算法。该工具适用于内容创作辅助、数据摘 AI项目与工具 2025年06月12日 10 点赞 0 评论 214 浏览
Pika 2.2 Pika 2.2 是一款基于深度学习的AI视频生成工具,支持文本和图片输入,可生成最高10秒、1080p分辨率的高质量视频。其核心功能包括关键帧过渡技术(Pikaframes)和电影画幅比例支持,提升视频连贯性与专业感。适用于内容创作、广告制作、影视及教育等多个领域,操作简便,适合各类用户快速生成创意视频。 AI项目与工具 2025年06月12日 34 点赞 0 评论 217 浏览
Eagle 2.5 Eagle 2.5 是一款由英伟达开发的视觉语言模型,专注于长上下文多模态学习,具备处理高分辨率图像和长视频序列的能力。其参数规模为 8B,但性能接近更大模型。采用信息优先采样和渐进式后训练策略,提升模型稳定性与适应性。支持多样任务,适用于视频分析、图像处理、内容创作及教育等多个领域。 AI项目与工具 2025年06月11日 59 点赞 0 评论 218 浏览
LongLLaVA LongLLaVA是由香港中文大学(深圳)研究团队开发的多模态大型语言模型,结合Mamba和Transformer模块,利用2D池化技术压缩图像token,大幅提升处理大规模图像数据的效率。该模型在视频理解、高分辨率图像分析及多模态代理任务中表现优异,特别擅长检索、计数和排序任务。其技术亮点包括渐进式训练策略和混合架构优化,支持多种多模态输入处理,广泛应用于视频分析、医学影像诊断、环境监测等领域。 AI项目与工具 2025年06月12日 67 点赞 0 评论 218 浏览
WiseDiag WiseDiag是杭州智诊科技开发的医疗AI模型,基于海量医学数据训练,具备深度推理能力和个性化服务功能。支持多场景健康咨询,包括医学报告解读、长期健康记录管理及专家级建议。提供多种版本以适应不同需求,适用于健康管理、医疗辅助和远程医疗等应用。 AI项目与工具 2025年06月12日 55 点赞 0 评论 218 浏览
PhotoPrism PhotoPrism是一款开源的AI照片管理工具,采用Go语言开发,支持用户在本地服务器上运行,确保数据隐私与安全性。它通过AI技术实现照片的智能分类与搜索,涵盖人物、物体和场景识别,还支持RAW、JPG等多种文件格式,提供面部识别、地理标签及WebDAV同步等功能,适用于个人、家庭、企业和教育机构等多样化需求。 AI项目与工具 2025年06月12日 59 点赞 0 评论 219 浏览
Liquid Liquid是由华中科技大学、字节跳动和香港大学联合开发的多模态生成框架,通过VQGAN将图像编码为离散视觉token并与文本共享词汇空间,使大型语言模型无需修改结构即可处理视觉任务。该框架降低训练成本,提升视觉生成与理解性能,并在多模态任务中表现出色。支持图像生成、视觉问答、多模态融合等应用,适用于创意设计、内容创作及智能交互等领域。 AI项目与工具 2025年06月12日 82 点赞 0 评论 219 浏览
scite scite是一款利用深度学习技术的文献分析工具,具备智能引文分类、上下文分析及可视化引文网络等功能。它支持用户快速评估文献质量,追踪引用动态,适用于文献综述、研究验证及学术出版等场景。通过支持、反对和提及分类,scite显著提升了文献引用的效率和准确性,同时提供了强大的自定义面板和消息提醒功能。 AI项目与工具 2025年06月12日 65 点赞 0 评论 222 浏览