WebPilot GPT 一个在 ChatGPT 平台上开发的特定应用程序。它设计具有能从不同网站提取和收集数据的功能。WebPilot GPT 旨在使用网络抓取机制来实现这一目标,从而可以从任何可访问的网站自动执行数据检索过程。 GPTs应用 2025年06月05日 72 点赞 0 评论 309 浏览
Deepfake Defenders Deepfake Defenders 是一个由中国科学院自动化研究所的 VisionRush 团队开发的开源 AI 模型,主要用于检测和防御 Deepfake 技术生成的伪造图像和视频。它通过分析媒体内容中的细微像素变化来识别伪造内容,并提供像素级分析、实时检测等功能。该模型采用卷积神经网络(CNN)、生成对抗网络(GAN)等技术,支持多模态分析,具备开源协作特性,广泛应用于社交媒体监控、新闻验证 AI项目与工具 2025年06月12日 20 点赞 0 评论 306 浏览
CityDreamer4D CityDreamer4D是由南洋理工大学S-Lab开发的4D城市生成模型,通过分离动态与静态元素,结合模块化架构生成逼真城市环境。支持无边界扩展、风格化处理、局部编辑及多视角一致性,适用于城市规划、自动驾驶和虚拟现实等领域。采用高效鸟瞰图表示法与神经场技术,提升生成效率与质量。 AI项目与工具 2025年06月12日 55 点赞 0 评论 302 浏览
OpenCity OpenCity是一个由香港大学联合华南理工大学和百度共同研发的交通预测模型。该模型采用了Transformer架构和图神经网络,通过大规模预训练学习交通数据中的时空依赖关系,具有卓越的零样本预测能力和快速情境适应能力。OpenCity能够有效处理不同空间区域和时间的城市交通模式,并具备良好的可扩展性。其应用场景包括交通流量预测、交通拥堵分析、公共交通优化以及智能交通信号控制等。 AI项目与工具 2025年06月12日 32 点赞 0 评论 294 浏览
OCTAVE OCTAVE是一款由Hume AI研发的语音语言处理工具,融合了多种领先AI技术,具备强大的个性化语音生成能力,支持从文字到语音的即时转化,并能精准模仿不同说话者的声线与情感表达。其主要功能包括多角色对话生成、复杂指令理解与响应,以及实时语音处理等。此外,OCTAVE可应用于客户服务、虚拟助手、教育培训、娱乐游戏等多个领域,为用户带来更加自然、生动的交互体验。 AI项目与工具 2025年06月12日 14 点赞 0 评论 293 浏览
Lalalai Lalalai啦啦爱,人声去除器和AI智能伴奏分离器,使用人工智能去除人声并进行音源分离,快速、简单、精确地提取词干(人声/伴奏) Ai语音工具 2025年06月05日 82 点赞 0 评论 289 浏览
CodeFormer CodeFormer是一款由南洋理工大学和商汤科技合作开发的AI照片和视频修复工具。它利用变分自动编码器(VQGAN)和Transformer技术,能够对模糊和马赛克处理过的照片或视频进行高质量修复。CodeFormer支持图片和视频的高清修复,操作简便且为开源免费软件,适用于家庭相册修复、社交媒体照片优化及专业图像处理等多种场景。 AI项目与工具 2025年06月12日 24 点赞 0 评论 288 浏览
WebRL WebRL是一种由清华大学与智谱AI共同研发的自我进化的强化学习框架,专注于通过开放大型语言模型优化网络代理性能。该框架采用动态任务生成与结果监督奖励机制,并结合自适应强化学习策略,解决了任务稀缺和反馈稀疏等问题。其显著提升了开源模型在WebArena-Lite基准测试中的表现,具备自我进化、持续改进的特点。 AI项目与工具 2025年06月12日 75 点赞 0 评论 286 浏览