AI项目与工具

VideoWorld

VideoWorld是由北京交通大学、中国科学技术大学与字节跳动合作开发的深度生成模型,能够通过未标注视频数据学习复杂知识,包括规则、推理和规划能力。其核心技术包括自回归视频生成、潜在动态模型(LDM)和逆动态模型(IDM),支持长期推理和跨环境泛化。该模型在围棋和机器人控制任务中表现优异,且具备向自动驾驶、智能监控等场景扩展的潜力。

Artinails

Artinails 是一款基于 AI 技术的美甲设计工具,支持用户通过简单输入生成个性化美甲方案。平台涵盖多种美甲风格,如法式、水晶、凝胶等,并提供颜色、形状和图案的自定义功能。界面简洁易用,适合个人及美甲从业者使用,同时支持季节性设计灵感,提升创作效率与个性化体验。

天目

天目是一款由人民网开发的AI内容检测工具,能够准确识别文本中由人工智能生成的内容,准确率达到93%。该工具支持DOC和TXT格式文件,能够处理高达10万字的文本。它通过高亮显示AI生成的句段,并生成PDF格式的检测报告,方便用户查阅和分享。同时,天目承诺不保存任何用户数据,确保用户数据的安全与隐私。

3DTown

3DTown是由哥伦比亚大学联合Cybever AI等机构开发的AI工具,能够从单张俯视图生成高精度的3D城镇场景。它采用区域化生成和空间感知3D修复技术,将输入图像分解为重叠区域,分别生成3D内容并修复缺失结构,确保几何和纹理一致性。支持多种风格的场景生成,适用于虚拟世界构建、游戏开发、机器人模拟等领域,优于现有方法。

ERA

ERA-42是一款由北京星动纪元开发的端到端原生机器人大模型,结合五指灵巧手星动XHAND1,可执行超过100种复杂灵巧操作任务。ERA-42无需预编程,具有快速学习能力,能在短时间内掌握新技能。该模型融合多模态信息,具备强大的跨模态能力和泛化能力,适用于工业自动化、医疗辅助、家庭服务、灾难救援和物流配送等多种场景。

MMBench

MMBench-Video是一个由多家高校和机构联合开发的长视频多题问答基准测试平台,旨在全面评估大型视觉语言模型(LVLMs)在视频理解方面的能力。平台包含约600个YouTube视频片段,覆盖16个类别,并配备高质量的人工标注问答对。通过自动化评估机制,MMBench-Video能够有效提升评估的精度和效率,为模型优化和学术研究提供重要支持。

在线AI转换

在线AI转换是一个集语音处理与图像优化于一体的AI平台,支持文本转语音、语音转文字、图像去雾、无损放大、黑白上色等功能,操作便捷,适用于多种应用场景,如有声书制作、会议记录、照片修复等,有效提升内容创作与图像处理效率。

AI编程工具L1

AI编程L1-L5分级体系定义了AI编程工具在自动化能力上的不同层次,从代码补全到全流程开发,覆盖从基础到高级的应用场景。L1至L5依次提升自动化程度,降低开发门槛,提高效率。各类工具支持代码生成、任务执行、项目构建及全流程部署,适合不同层级的开发者使用。L5则代表AI开发团队,模拟多代理协作完成复杂任务。

node

Node-DeepResearch 是一款基于 Gemini 语言模型和 Jina Reader 的开源 AI 智能体,支持持续搜索、多步推理和复杂问题处理。用户可通过 Web Server API 实时获取查询进度,适用于文献综述、市场调研、新闻报道等多种场景。项目具备灵活性和可扩展性,适合研究人员和开发者使用。

Eleven v3

Eleven v3是ElevenLabs推出的先进文本转语音模型,支持情感和语调的精确控制,通过内联音频标签实现多样化的表达。它支持多说话人对话,能模拟真实交谈中的语气变化,覆盖超70种语言,适用于媒体影视配音、有声读物制作、游戏开发和教育等领域,提供生动、真实的声音体验。