工具

Whisper Input

Whisper Input 是一款开源语音输入工具,基于 Python 和 OpenAI Whisper 模型开发,支持多语言语音识别与实时转录。用户可通过快捷键操作录音并生成文本,具备翻译、自动标点、高效处理及本地运行等功能。适用于会议记录、教育、智能交互及媒体制作等多种场景。

SONIFY.io

Sonify 在音频、数据和新兴技术的交叉领域进行创新。我们设计和开发音频优先的产品和数据驱动的解决方案。

Signs

Signs是由英伟达推出的AI手语学习平台,通过实时手势识别与3D虚拟教学,帮助用户精准掌握美式手语。平台支持用户上传视频,丰富学习资源,具备互动性与个性化反馈,适用于初学者及进阶学习者,同时为无障碍技术开发提供数据支持。

Airparser

Airparser是一款利用GPT技术开发的数据提取工具,能够自动从电子邮件、PDF、文档等多种文件中提取结构化数据,支持60多种语言的文本识别。它具备强大的文档兼容性、自动化处理能力和与第三方应用的集成能力,广泛应用于客户关系管理、人力资源管理、财务管理等领域,帮助用户高效处理和管理数据。

LINER AI

Liner AI可以更智能、更快速地询问和学习任何事情。通过实时信息和参考资料即时获得答案。轻松消化任何网络文章和 YouTube 视频中的有用信息。

秒哒

秒哒是一款由百度开发的零代码AI开发平台,基于大模型和智能体技术,支持多智能体协作和工具调用扩展。用户无需编程即可通过自然语言或图形化界面快速创建应用程序,实现创意落地。秒哒适用于企业自动化、教育、个人项目等多种场景,具有零代码编程、模块化构建、流程自动化等特点,大幅降低开发门槛并提升效率。

律呗

律呗是一款面向法律专业人士的智能办案平台,集法律检索、案例分析、文书撰写、案件管理、协同办公等功能于一体。平台运用大数据与人工智能技术,提升律师办案效率与服务质量,优化客户体验,适用于律所日常管理与案件处理,助力法律工作智能化发展。

One Shot, One Talk

One Shot, One Talk是一项由中国科学技术大学和香港理工大学研究者开发的图像生成技术,它可以从单张图片生成具有个性化细节的全身动态说话头像。该工具支持逼真的动画效果,包括自然的表情变化和生动的身体动作,同时具备对新姿势和表情的泛化能力。One Shot, One Talk结合了姿势引导的图像到视频扩散模型和3DGS-mesh混合头像表示技术,提供了精确的控制能力和高质量的重建效果。

司马阅AI

司马阅(SmartRead),是一款ai文档阅读分析工具,AI阅读神器,基于AI人工智能技术、智能文档技术,从复杂的文档中快速提取有效信息,且智能分析判断文档内容价值。

DeepCoder

DeepCoder-14B-Preview 是一款基于 Deepseek-R1-Distilled-Qwen-14B 微调的开源代码生成模型,采用分布式强化学习技术,在 LiveCodeBench 基准上达到 60.6% 准确率。支持多语言代码生成、问题解决、补全优化、测试生成等功能,适用于开发、教育、竞赛等多个场景。项目提供完整训练数据与优化方案,推动 RL 在 LLM 中的应用。