语言处理

AVD2

AVD2是由多所高校联合开发的自动驾驶事故视频理解框架,通过生成高质量事故视频并结合自然语言描述与推理,提升对复杂事故场景的理解能力。其功能涵盖事故视频生成、原因分析、预防建议及数据集增强,支持自动驾驶系统的安全优化与研究。基于先进模型如Open-Sora 1.2和ADAPT,AVD2在多项评估中表现优异,为自动驾驶安全提供了重要技术支撑。

BotSharp

一个基于.NET开发的开源AI多智能体应用开发框架,它可以快速将大型语言模型(LLMs)快速集成到现有业务系统中。

IngestAI

IngestAI是一款无需编码即可将企业文档转化为智能问答机器人的AI平台,支持Slack、Discord、WhatsApp和Telegram等多种通信工具。通过自然语言处理技术,用户可以便捷地实现知识检索与交互,并享受实时更新和个性化推荐的服务。主要适用于客户服务、内部知识管理、员工培训、销售支持及项目协作等领域。

AirOps

AirOps 是一款用于辅助AI SQL语句生成和修改的软件,它基于机器学习技术,能够自动分析和优化SQL查询语句。

OpenMusic

OpenMusic是一款基于QA-MDT技术的文生音乐工具,支持从文本生成高质量音乐作品,具备质量感知训练、多样化风格生成及复杂推理能力。它广泛应用于音乐制作、多媒体内容创作、音乐教育等领域,同时提供音频编辑与处理功能,旨在提升音乐创作效率和质量。

Hunyuan

Hunyuan-Large是一款由腾讯开发的大规模混合专家(MoE)模型,以其庞大的参数量成为当前参数规模最大的开源MoE模型之一。该模型基于Transformer架构,擅长处理长文本任务,同时在多语言自然语言处理、代码生成以及数学运算等领域展现出色性能。通过合成数据增强训练与创新的注意力机制,Hunyuan-Large实现了高效的推理吞吐量,并广泛应用于内容创作、教育辅助、知识问答及数据分析等多

Voice Changer

Voice Changer是一款基于状态空间模型的音频处理工具,可将音频中的语音转换为不同音色,同时保留情感和表达细节。用户可通过选择预设声音库或克隆个人声音实现个性化转换,并对语音细节进行精细调整。该工具广泛应用于内容创作、游戏配音、有声书制作及品牌音频开发等领域,提供高质量的音频输出和灵活的控制选项。

ChatGPT Tasks

ChatGPT Tasks是OpenAI推出的任务管理功能,允许用户通过自然语言设定任务并进行管理。支持创建最多10个任务,可自定义执行时间和提醒方式,并通过多平台推送通知。系统可根据用户输入智能推荐相关任务,需用户批准后执行,适用于个人生活、工作、学习及旅行等多个场景。

Rasa

一个开源的AI机器学习框架,专注于构建自然语言对话系统,如聊天机器人和语音助手,Rasa广泛应用于客户服务、智能助手、企业自动化等多个领域。

Gliglish

Gliglish 是一款基于 AI 技术的口语学习平台,通过语音识别和自然语言处理技术,模拟真实对话场景,帮助用户提升口语和听力能力。支持多语言学习,包括英语、中文、日语、韩语、德语、法语等,并提供即时语法和发音反馈。用户可调节对话速度,实现个性化学习。此外,Gliglish 支持多语言语音输入和输出,适合语言初学者及需要强化特定语言技能的学习者。