学习

VideoAgent

VideoAgent是一款基于自改进机制的视频生成系统,结合图像观察与语言指令生成机器人控制视频计划。它采用自我条件一致性方法优化视频质量,通过预训练视觉-语言模型反馈和实际执行数据的收集,持续提升生成效果,减少幻觉内容并提高任务成功率。VideoAgent在模拟环境中有优异表现,并已应用于机器人控制、模拟训练、教育研究、游戏开发以及电影制作等领域,展现出广泛的应用潜力。

GPDiT

GPDiT是一种由多所高校和企业联合开发的视频生成模型,结合了扩散模型与自回归模型的优势,具备高质量视频生成、视频表示学习、少样本学习和多任务处理能力。其核心技术包括轻量级因果注意力机制和无参数的旋转基时间条件策略,提升了生成效率与质量。该模型适用于视频创作、编辑、内容理解及创意生成等多种应用场景。

Voicemaker

Voicemaker,强大的文本到语音转换器,它也能通过先进的人工智能技术来制作高质量的画外音,听起来像人性化且富有表现力。

Chibi.Ai

Chibi 是帮助您为您的网站或应用程序创建引人入胜的个性化聊天机器人的工具。Chibi 使用自然语言处理和机器学习来了解用户的意图和偏好,并生成自然且相关的回复。

流畅阅读

FluentRead 是一款开源的浏览器翻译插件,基于AI技术提供精准、自然的翻译服务。支持多种翻译引擎和双语对照显示,具备隐私保护和高度定制化功能。适用于学术研究、工作场景、语言学习及日常阅读,兼容主流浏览器,保障用户数据安全。其开源特性增强了透明度与灵活性,满足多样化翻译需求。

Self

Self-Taught Evaluators是一种无需人工标注数据的模型评估框架,通过自我训练方式增强大型语言模型(LLM)的评估能力。其核心在于利用LLM生成对比输出并进行迭代优化,显著提升了模型评估的准确性,达到了与顶级奖励模型相媲美的效果,广泛适用于语言模型开发、内容评估、教育科研以及技术支持等领域。

北京大学人工智能研究院

北京大学人工智能研究院(Institute for Artificial Intelligence, Peking University)于2019年4月27日宣布成立,作为学校直属的独立实体机构,是统筹全校相关资源、建设世界一流...

jagoda.AI

[jagoda.AI是一款利用人工智能技术的在线学习平台,主要面向学生提供个性化辅导服务。它支持超过30个学科的解答,可翻译20多种语言,帮助学生解决家庭作业难题。平台通过分析学生的年级和学校水平,提供定制化辅导,并附带详细解题步骤,促进自主学习。此外,jagoda.AI支持拍照上传和语音输入,提供基础免费计划及付费订阅选项,适用于家庭作业帮助、自主学习、语言学习支持等多种场景。]

URM

URM是由阿里妈妈开发的通用推荐模型,结合大语言模型与电商领域知识,提升推荐效果。其采用多模态融合与Sequence-In-Set-Out生成方式,支持多场景、多目标、长尾及发现性推荐。具备高效率、零样本学习能力,适用于工业级推荐系统,已应用于阿里妈妈展示广告场景,优化用户体验与商家投放效果。

InvSR

InvSR是一款基于扩散模型逆过程开发的图像超分辨率工具,通过深度噪声预测器和灵活采样机制,从低分辨率图像恢复高质量高分辨率图像。它支持多种应用场景,包括文化遗产保护、视频监控、医疗成像及卫星影像分析,同时兼顾计算效率与性能表现。