深度学习

DocMind

DocMind是一款基于Transformer架构的文档智能大模型,融合了深度学习、NLP和CV技术,用于处理富文本文档的复杂结构和视觉信息。它能够精准识别文档实体、捕捉文本依赖关系并深入理解文档内容,支持知识库结合,提升专业文档理解能力。DocMind还具备自动执行文档相关任务的功能,如问题解答、文档分类整理等,广泛应用于法律、教育、金融等领域。

MatAnyone

MatAnyone是一款由南洋理工大学S-Lab实验室与商汤科技联合开发的视频抠图框架,专注于复杂背景下人像视频的精准分割。采用一致内存传播和区域自适应内存融合技术,确保视频中目标的语义稳定性和边界细节精度。结合大规模分割数据和优化的训练策略,提升了模型在真实场景下的性能。适用于影视制作、直播、广告、游戏开发等多个领域,具备高精度、强适应性和良好的交互性。

陌言AI

陌言AI是一款免费的智能AI问答系统,可以快速、准确地解答您的问题,辅助您更高效的学习和工作,陌言Ai–让创作变得更加简单。

TripoSF

TripoSF是由VAST推出的新型3D基础模型,采用SparseFlex表示方法和稀疏体素结构,显著降低内存占用并提升高分辨率建模能力。其“视锥体感知的分区体素训练”策略优化了训练效率,使模型在细节捕捉、拓扑结构支持和实时渲染方面表现突出。实验数据显示,TripoSF在Chamfer Distance和F-score等关键指标上分别降低82%和提升88%。适用于视觉特效、游戏开发、具身智能及产品

Etna模型

一个文字转视频的AIGC模型,Etna能够根据简短的文本描述生成相应的视频内容,支持生成时长为8-15秒的视频,且视频流畅度极高,每秒可达60帧。

MemFree

MemFree是一款开源的混合AI搜索引擎,集成了多种AI技术和搜索引擎功能,支持文本、图像、文件和网页等多种输入形式,可提供文本、思维导图、图片和视频等多格式搜索结果。其核心功能涵盖图像处理、文档总结与提问、学术问题解答、代码解释与生成等,特别适用于学术研究、工作办公和日常生活场景,旨在优化知识管理、提升生产力并降低使用成本。

Neural.Love

neural.love是一个提供免费AI图像生成和AI增强工具的网站。用户可以访问数百万的公共领域图像,用于他们的创意项目,并可以使用AI技术轻松增强图像。

FaceSwap

FaceSwap是一款开源AI换脸软件,利用深度学习技术实现人脸检测、提取及替换。它支持跨平台操作,包括Windows、macOS和Linux,并可借助GPU加速提升处理效率。FaceSwap还允许用户自定义模型训练以优化换脸效果,广泛应用于影视制作、教育、游戏开发以及虚拟现实等领域。

LipRead Pro

LipRead Pro 是一款基于AI技术的视频唇读工具,可将视频中的唇部动作转换为文字,支持多语言和口音识别。其高精度算法确保了文字输出的准确性,适用于内容创作、无障碍辅助、安全监控、历史档案修复等多种场景。操作简便,处理高效,注重用户数据隐私保护,适合专业用户和普通用户使用。

Cube 3D

Cube 3D 是 Roblox 推出的 AI 驱动 3D 生成工具,可通过文本描述快速创建高质量 3D 模型和场景。其核心功能包括文本到 3D 模型生成、网格优化、场景布局预测以及开源扩展能力。基于深度学习与原生 3D 数据训练,Cube 3D 提升了 3D 内容创作效率,适用于游戏开发、虚拟环境设计、教育及个性化创作等多种场景。