语言模型

REEF

REEF是一种用于大型语言模型的指纹识别技术,通过在训练中嵌入编码信息生成唯一“指纹”,实现高精度、低开销的模型识别。具备鲁棒性、兼容性强等特点,适用于版权保护、模型溯源、非法行为打击等场景,广泛应用于学术、商业和监管领域。

Oryx

Oryx是一款由清华大学、腾讯和南洋理工大学联合开发的多模态大型语言模型,专为处理视觉数据设计。其核心技术包括预训练的OryxViT模型和动态压缩模块,支持任意分辨率的图像处理及高效的视觉数据压缩。Oryx在空间和时间理解上表现优异,广泛应用于智能监控、自动驾驶、人机交互、内容审核、视频编辑及教育等领域。

TigerBot

TigerBot是一个功能丰富、持续进化的大型语言模型,它通过不断的技术创新和社区贡献,为用户提供了一个强大的多语言多任务处理能力。

autoMate

autoMate是一款基于AI与RPA技术的本地化自动化工具,用户可通过自然语言描述任务,无需编程即可完成复杂操作。支持本地部署,确保数据安全,兼容主流大模型,具备智能学习能力。适用于数据处理、报告生成、邮件自动化、跨平台流程管理及日常任务调度等场景,提升工作效率并释放创造力。

SpeechGPT 2.0

SpeechGPT 2.0-preview 是复旦大学 OpenMOSS 团队开发的拟人化实时交互系统,基于大量中文语音数据训练,支持低延迟、高自然度的语音与文本交互。具备情感控制、实时打断、多风格语音生成等功能,适用于智能助手、内容创作及无障碍通信等场景,技术上融合了语音-文本联合建模与多阶段训练策略,提升语音表现力与智能化水平。

OmniParser

OmniParser是一款由微软研究院开发的屏幕解析工具,能够将UI截图转换为结构化数据,通过识别可交互图标和提取功能语义,提升基于大型语言模型的UI代理系统的性能。它支持跨平台应用,无需依赖额外信息,适用于自动化软件测试、虚拟助手、辅助技术等多个领域。

Lepton AI

Lepton AI是由贾扬清创办的云原生AI平台,提供了一系列工具和服务,降低AI应用开发的门槛,帮助开发者更容易地完成创建、部署和扩展任务。它提供了 Python SDK 和云计算平台。Pyth...

AI Interview Copilot

AI Interview Copilot是一款专为求职者设计的AI辅助工具,通过实时语音转录和先进的语言模型(如GPT-4)来提升远程面试的表现。主要功能包括实时转录、问题解答、算法问题解决和图像识别等。该工具支持多语言,帮助求职者在技术或编程面试中快速生成答案和代码,从而更加自信地展示专业技能,提高面试成功率。

Takin AudioLLM

Takin AudioLLM是一套由喜马拉雅Everest团队研发的语音生成模型,包含文本转语音(Takin TTS)、音色转换(Takin VC)及声音风格变换(Takin Morphing)。它采用最新大型语言模型技术,可生成接近真人的高质量语音,并支持个性化定制与零样本学习。该工具广泛应用于有声书制作、虚拟助手、电影配音等领域,具有音色精准、风格多样等特点。

SPAR

SPAR是一种自我博弈框架,专为增强大型语言模型的指令遵循能力设计。它通过生成者和完善者的角色互动,利用树搜索技术和迭代优化,提升模型的自我完善能力。实验显示,SPAR在多个基准测试中表现出色,适用于智能助手、客户服务、教育技术及医疗咨询等多个应用场景。