深度学习

CatchMe

一款为识别图片、视频和音频内容是否由人工智能生成而设计的AI内容检测器

Deep Art Effects

Deep Art Effects 是一款利用深度学习技术的在线工具,能够将普通照片转换为具备多种艺术风格(如梵高、毕加索等)的作品。其主要功能包括艺术风格转换、高分辨率输出、丰富的艺术风格库以及 API 集成支持。该工具适用于个人娱乐、艺术创作、教育、广告及社交媒体内容创作等多个领域。

WebWalker

WebWalker是阿里巴巴研发的AI工具,用于评估和优化大型语言模型在网页浏览任务中的表现。它通过多智能体框架、垂直探索策略及WebWalkerQA数据集,提升模型处理长上下文和多源信息的能力。支持多语言、多领域和多难度任务,适用于信息检索、数据分析和内容监控等场景,具备良好的适应性和可扩展性。

Character

Character-3 是 Hedra Studio 推出的全模态 AI 视频生成工具,支持图像、文本和音频输入,生成高质量动态视频。具备全身动作捕捉、情感控制、精准对口型等功能,适用于创意视频、虚拟形象、教育、营销等多个场景。采用多模态融合与先进 AI 技术,提升视频自然度与连贯性,提高内容创作效率。

笔墨AI

笔墨AI是一款基于人工智能模拟中国传统绘画的风格和技巧,生成具有中国传统艺术特色画作的ai绘画生成器。

OpenDeepSearch

OpenDeepSearch 是一款开源深度搜索工具,结合语义重排与多源信息整合技术,提升搜索精度与覆盖范围。支持与 Hugging Face SmolAgents 无缝集成,具备语义搜索、多模式处理及可扩展性强等特点,适用于复杂问题解答、实时信息检索及学术研究等场景。

AnyCharV

AnyCharV是一款由多所高校联合研发的角色可控视频生成框架,能够将任意角色图像与目标场景结合,生成高质量视频。它采用两阶段训练策略,确保角色细节的高保真保留,并支持复杂的人-物交互和背景融合。该工具兼容多种文本生成模型,具备良好的泛化能力,适用于影视制作、艺术创作、虚拟现实等多个领域。

RAGFlow

RAGFlow是一个开源的RAG(Retrieval-Augmented Generation)引擎,通过深度学习模型解析和理解文档内容,并增强生成能力。它提供了多种功能,包括自动化工作流、包管理、安全漏洞检测与修复、即时开发环境、AI辅助代码编写以及代码审查。RAGFlow的技术原理涵盖了文档理解、检索增强、生成模型、注意力机制、多模态处理、上下文融合和优化算法。该工具适用于内容创作辅助、数据摘

Gemini 2.0

Gemini 2.0 是谷歌推出的原生多模态AI模型,具备快速处理文本、音频和图像的能力,支持多语言输出和实时音视频流输入。通过Agent技术和工具调用,Gemini 2.0 能够自主理解任务并提供解决方案,已在编程、数据分析、游戏等领域展示应用潜力。目前提供免费试用,计划逐步开放更多功能。