学习

中国知网

促进教育、科技、文化、出版等事业和文化创意产业发展提供了大有作为的信息网络空间。

PaddleOCR 2.9

PaddleOCR 2.9 是一个基于深度学习的开源 OCR 工具库,提供了强大的文本识别、版面分析和信息抽取功能。支持多语言识别和多种硬件平台,通过低代码开发模式简化了模型的部署和定制,广泛应用于文档数字化、智能办公、身份验证、物流管理和金融服务等领域。

Uplimit

Uplimit 是一个AI驱动的企业学习平台,专注于提升组织内部培训和技能开发。它通过AI技术实现快速课程创建、自动化群体管理和AI模拟演练,提供个性化的学习体验,助力企业高效培养员工,提升整体竞争力。主要应用场景包括员工培训与发展、新员工入职培训、客户教育和领导力发展。

MangaNinja

MangaNinja是一款基于参考图像的线稿上色工具,采用Reference U-Net和Denoising U-Net架构,结合补丁重排模块与点驱动控制方案,实现高精度、细粒度的上色效果。其可处理复杂场景、多参考图像协调及极端姿势等问题,广泛应用于漫画创作、插画设计、平面设计和数字艺术等领域。

机器之心

机器之心是中国领先的人工智能科技媒体,提供最新的AI新闻、研究论文和产业动态,专业的人工智能信息服务平台。

PocketPod

PocketPod是一款基于人工智能技术的个性化播客生成工具。它可以根据用户的兴趣和需求,自动创建包括每日新闻更新和特定主题深入探讨在内的播客内容。用户还可以将PDF文件等文档转换成播客形式,便于在多种场合下收听。该工具主要服务于忙碌人士、学生及播客爱好者,提供了个性化新闻播客、广泛话题覆盖、按需内容创建、文档转播客等功能,并支持与用户的日历和提醒系统集成。

微软VASA

微软亚洲研究院开发的一种前沿人工智能技术,VASA-1能够将单一静态图像和一段语音音频转换成逼真的对话面部动画。

Mistral Small 3

Mistral Small 3 是一款由 Mistral AI 推出的开源大语言模型,具备 240 亿参数,支持多语言处理,适用于低延迟场景。模型基于 Transformer 架构,支持长文本输入,具备高性能和本地部署能力。其可定制性强,适用于虚拟助手、客服系统、自动化任务及专业领域应用,如医疗和法律咨询。

AVD2

AVD2是由多所高校联合开发的自动驾驶事故视频理解框架,通过生成高质量事故视频并结合自然语言描述与推理,提升对复杂事故场景的理解能力。其功能涵盖事故视频生成、原因分析、预防建议及数据集增强,支持自动驾驶系统的安全优化与研究。基于先进模型如Open-Sora 1.2和ADAPT,AVD2在多项评估中表现优异,为自动驾驶安全提供了重要技术支撑。

CustomCrafter

CustomCrafter是一个由腾讯和浙江大学合作开发的自定义视频生成框架,能够根据文本提示和参考图像生成高质量的个性化视频。该框架支持自定义主体身份和运动模式,具备文本提示生成视频、保留运动生成能力和概念组合能力等功能。其核心技术包括视频扩散模型、空间主题学习模块和动态加权视频采样策略等,广泛应用于影视制作、虚拟现实、游戏开发、广告营销和社交媒体内容创作等领域。