AI项目与工具

LLaDA

LLaDA是一款基于扩散模型框架的新型大型语言模型,由中国人民大学高瓴AI学院与蚂蚁集团联合开发。它通过正向掩蔽和反向恢复机制建模文本分布,采用Transformer作为掩蔽预测器,优化似然下界提升生成效果。LLaDA在上下文学习、指令遵循和双向推理方面表现突出,尤其在反转推理任务中克服了传统自回归模型的局限。其8B参数版本在多项基准测试中表现优异,适用于多轮对话、文本生成、代码生成、数学推理和语

EF Hello

EF Hello是一款由EF Education First开发的英语学习应用,提供个性化学习路径、AI模拟互动、每日打卡等功能。其课程内容涵盖商务、旅行、学术等领域,帮助用户提升日常对话、商务沟通、旅行英语和学术英语能力。通过AI技术模拟真实语言环境,用户可有效提高英语实际应用能力。

度豆

度豆是一款由百度开发的AI社交应用程序,用户可以通过文字、语音或图片与AI数字人进行交流,享受个性化的聊天体验。每个AI数字人都具备独特的人格和背景故事,能够提供百科全书式的知识解答、生活建议以及情感支持。该应用适用于日常聊天、信息查询、学习辅导、语言练习、休闲娱乐和生活助手等多种场景。

Praison AI

Praison AI 是一款基于低代码的多智能体框架,支持AI代理的创建与管理,提供顺序、分层和工作流等多种任务执行流程。其特点包括动态路由、并行化执行、记忆功能以及高效的人机协作。适用于企业流程自动化、智能客服、数据分析等多个领域,强调灵活性和可扩展性。

RelightVid

RelightVid是一款基于时序一致性扩散模型的视频重照明工具,由多所高校和研究机构联合开发。它支持通过文本提示、背景视频或HDR环境贴图对视频进行细粒度和一致的场景编辑,具备全场景和前景保留重照明功能。该模型在预训练图像照明编辑框架基础上扩展,引入时序层提升视频重照明效果,并结合真实视频与3D渲染数据生成高质量数据对。RelightVid在保持时序一致性和照明细节方面表现突出,适用于影视制作、

HelloMeme

HelloMeme是一款基于扩散生成技术的框架,专注于表情与姿态迁移。它利用空间编织注意力机制与Stable Diffusion 1.5模型的结合,生成自然且物理合理的表情包视频,同时具备强大的泛化能力和扩展潜力。HelloMeme通过模块化设计实现了高效的表情和姿态迁移,适用于多种应用场景,如社交媒体内容创作、视频娱乐、电影制作、广告营销及教育培训等。

FluxMusic

FluxMusic 是一个开源的音乐生成工具,能够将文本描述转化为音乐。它采用先进的扩散模型和Transformer架构,通过修正流技术提高音乐的自然度和质量。该工具支持多种规模的模型,具备文本到音乐生成、语义理解、多模态融合等功能,适用于音乐创作、影视配乐、游戏音乐生成等多种场景。

Nanobrowser

Nanobrowser 是一款开源的 Chrome 扩展工具,采用多智能体系统实现网页自动化任务,如信息提取和操作执行。用户可通过 LLM API 配置不同智能体,提升任务灵活性。支持本地运行,保障隐私安全,适用于信息收集、电商、内容创作、企业自动化和个人效率提升等多种场景。其动态调整机制增强了任务的稳定性和适应能力。

ASAP

ASAP是一种由卡内基梅隆大学与英伟达联合开发的两阶段框架,用于解决仿人机器人在模拟与现实之间动力学不匹配的问题。它通过预训练阶段在模拟环境中学习运动策略,并在后训练阶段利用真实数据训练Delta动作模型,补偿动力学差异。该框架提高了机器人在复杂任务中的敏捷性、协调性和运动精度,支持多种应用场景,如体育、救援、工业、家庭服务及虚拟现实等,为仿人机器人的实际应用提供了高效的技术方案。

Alpha Engine

Alpha Engine 是一款面向资本市场的 AI 投研工具,提供全面的数据库、智能搜索、会议记录、文件转录、摘要提取及翻译等功能。通过 AI 技术提升投研效率,支持实时数据更新与个性化知识管理,适用于分析师、投资者及研究人员,助力精准决策与信息获取。