数据

Gen2Act

Gen2Act是一种基于预测网络生成人类视频的机器人操作策略,由谷歌、卡内基梅隆大学和斯坦福大学联合开发。它通过零样本视频生成、闭环策略执行和视觉特征提取等技术,实现了对未见过物体和动作的高效操作,支持复杂任务的长时执行,同时减少了对机器人数据采集的需求,广泛应用于家庭、工业、医疗和灾难救援等领域。

Videotoword.ai

Videotoword.ai 是一款以AI驱动的在线服务,支持将音频和视频文件转化为文本,具有高精度(99.9%)和多语言支持(98种以上)。它能处理长达10小时的文件,具备自动转录、文本编辑导出及AI摘要生成功能,广泛应用于教育、媒体、法律和企业等领域。

Moonshine

Moonshine是一款专为资源受限设备设计的高效语音识别模型,支持实时语音转文本,具有低延迟、高准确率的特点。它基于编码器-解码器架构和旋转位置嵌入技术,适应不同长度的音频输入,计算需求随音频长度变化而调整,适合边缘设备部署。主要应用于会议转录、语音助手、听力辅助及多语言翻译等领域。

AlgForce.ai

AlgForce.ai 是一个基于 AI 的数据分析平台,通过自然语言处理技术实现无代码查询与分析。其核心功能包括自然语言查询、AI 数据可视化、深度解读、仪表板定制、自动化报告生成及代码自动生成。该工具旨在降低数据使用门槛,为企业提供数据驱动的决策支持,广泛适用于销售、市场、客户服务等多个领域。

Umi

Umi-OCR 是一款离线 OCR 工具,支持图片、截图和 PDF 文档的文字识别,具备数学公式与二维码识别功能,可生成可搜索 PDF。支持多语言识别与界面切换,提供命令行和 HTTP 接口调用,适用于文档数字化、数据录入、教育等多个场景。

FoxBrain

FoxBrain是由鸿海研究院推出的大型语言模型,基于Meta Llama 3.1架构,拥有70B参数,专注于数学与逻辑推理领域。其采用高效训练策略,结合高质量中文数据与Adaptive Reasoning Reflection技术,提升推理能力。FoxBrain适用于智能制造、智慧教育、智能办公等多个场景,支持数据分析、代码生成、文书协作等功能,具备较强的上下文处理能力和稳定性。