自然语言处理

Ola

Ola是一款由多机构联合开发的全模态语言模型,支持文本、图像、视频和音频等多种输入形式。通过渐进式模态对齐策略,逐步扩展模型的多模态理解能力,同时采用流式解码技术提升交互体验。其架构融合多种编码器与解码器,结合局部-全局注意力机制,实现高效多模态处理,在多项任务中表现优异。

DynaSaur

DynaSaur是一个由Adobe Research开发的大型语言模型代理框架,通过动态生成Python代码实现与环境的交互,支持灵活的问题解决。它能够积累生成的动作形成可重用函数库,提高任务效率和适应性。在处理复杂和长期任务时尤为出色,同时适用于多种应用场景,如客户服务、个人助理、软件开发、教育和数据分析等。

VirSci

VirSci是一款基于大型语言模型(LLMs)的多智能体AI科学研究工具,通过模拟科学家团队合作加速科研创新。其主要功能包括合作者选择、主题讨论、创意生成、新颖性评估、摘要生成及自我审查等,支持从团队组建到科学发现的全流程。VirSci具备强大的自然语言处理能力、数字孪生技术和知识库支持,广泛应用于科学研究、团队协作、教育和项目管理等领域。

FinGPT

FinGPT是一款面向金融领域的开源大语言模型,基于自然语言处理技术,支持情感分析、关系提取、标题分类和命名实体识别等多种金融任务。它采用端到端框架,结合低秩适配(LoRA)和基于股价的强化学习(RLSP),实现高效的数据处理与模型优化。适用于投资分析、市场研究、量化交易等多个场景,具备多语言支持和实时数据分析能力,为金融决策提供智能化解决方案。

LLaDA

LLaDA是一款基于扩散模型框架的新型大型语言模型,由中国人民大学高瓴AI学院与蚂蚁集团联合开发。它通过正向掩蔽和反向恢复机制建模文本分布,采用Transformer作为掩蔽预测器,优化似然下界提升生成效果。LLaDA在上下文学习、指令遵循和双向推理方面表现突出,尤其在反转推理任务中克服了传统自回归模型的局限。其8B参数版本在多项基准测试中表现优异,适用于多轮对话、文本生成、代码生成、数学推理和语

Emu3

Emu3是一款由北京智源人工智能研究院开发的原生多模态世界模型,结合了多模态自回归技术和单一Transformer架构,能够在图像、视频和文本之间实现无缝转换。它不仅能够根据文本生成高质量图像,还能预测视频发展并理解图文内容,广泛应用于内容创作、广告营销、教育、娱乐等多个领域。

Westlake

Westlake-Omni是西湖心辰推出的一款开源中文情感端到端语音交互大模型,融合了语音识别、自然语言处理、情感理解和对话管理等功能,具备实时性和端到端交互特性。它通过深度学习技术和离散表示法,实现从语音输入到语音输出的全流程自动化,生成自然流畅的语音回应,并广泛应用于智能助手、客户服务、教育辅助、健康医疗等领域。

JoyCoder

JoyCoder是一款由京东开发的AI编程助手,旨在提升研发效率。它提供了代码预测生成、注释生成代码、一键生成单元测试和接口文档等功能,并与主流IDE无缝集成。JoyCoder集成了本地行云DevOps能力,支持多种编程语言。其核心技术包括AI算法、代码上下文理解、模型训练和智能问答系统等,能够显著提升代码质量和开发效率。

百度心响

一款由百度推出的手机端超级智能体应用,它以“AI任务完成引擎”为核心,通过自然语言交互帮助用户实现复杂任务的拆解、动态执行和可视化结果交付。

子曰翻译2.0

子曰翻译2.0是网易有道推出的最新翻译大模型,通过数据优化、算法升级和严格评估体系,实现翻译质量与效率的显著提升。支持中英互译、专业领域翻译及多场景应用,涵盖学术、医疗、文学等领域,具备高准确性、流畅性和适应性,适用于多种翻译需求。