人工智能

Long

Long-VITA是一款由腾讯优图实验室、南京大学和厦门大学联合开发的多模态AI模型,支持处理超长文本(超过100万tokens)及多模态输入(图像、视频、文本)。通过分阶段训练提升上下文理解能力,结合动态分块编码器与并行推理技术,实现高效处理长文本和高分辨率图像。模型基于开源数据训练,适用于视频分析、图像识别、长文本生成等场景,性能在多个基准测试中表现突出。

OptoChat AI

OptoChat AI是国内首款面向光子领域的AI大模型,整合超30万条光子芯片相关数据资源,具备强大的数据分析与智能算法能力。可实现光子芯片设计优化、工艺验证、文献检索等功能,显著提升研发效率,缩短设计周期。适用于科研、制造、教育及市场分析等多个场景,推动光子产业智能化发展。

Agent Neo

Agent Neo是Flowith推出的创新AI Agent,具备无限步骤、无限上下文和无限工具的核心能力,可执行复杂任务、处理海量信息并调用多种大模型与工具。结合知识库功能,用户可快速构建数字分身或生成高质量内容。支持24/7云端执行、多步骤优化和智能重新规划,适用于自动化任务、内容创作、知识管理等场景。目前为邀请制,需激活码使用。

AgentCPM

AgentCPM-GUI是由清华大学与面壁智能团队联合开发的开源端侧GUI代理系统,专为中文应用场景优化。基于MiniCPM-V模型,支持通过截图输入并自主执行用户指令,具备高精度GUI元素识别与OCR能力。采用强化微调和紧凑动作空间设计,提升任务执行效率与移动端适配性。适用于智能助手、自动化测试、老年人辅助及企业应用等领域。

Rask Ai

Rask AI是新一代的视频翻译和配音工具,是一个利用先进的人工智能技术来自动化视频内容本地化和翻译过程的平台。

MinMo

MinMo是阿里巴巴通义实验室推出的多模态语音交互大模型,具备高精度语音识别与生成能力。支持情感表达、方言转换、音色模仿及全双工交互,适用于智能客服、教育、医疗等多个领域,提升人机对话的自然度与效率。

Dubbing AI

DubbingAI 语音生成器作为实时变声器,可以将任何语音转换为优质语音和克隆语音。从游戏玩家到直播主播和内容创作者。每个人都可以使用 Dubbing AI 生成跨年龄、语言和口音的逼真配音。

KYP.ai

KYP.ai的功能只要是通过工具识别可以通过自动化工具解决的障碍和低效,并向客户管理员提供建议。

YAYI2

中科闻歌研发的一款新一代开源大语言模型,中文名为“雅意”。该模型包含 Base 和 Chat 版本,参数规模达到 30B,基于 Transformer 架构构建。

星火语音同传大模型

星火语音同传大模型是科大讯飞推出的国内首个端到端语音同传AI系统,支持37种语言,具备高精度翻译、流式处理、语境理解和语音合成优化等功能。模型可在5秒内完成同传,准确度高,适用于国际会议、商务交流、教育等场景,支持译文长度调节和设备兼容,提升跨语言沟通效率。