自适应

DGM

DGM(Darwin Gödel Machine)是一种自改进人工智能系统,通过迭代修改自身代码提升性能。它从编码代理档案中选择代理,基于基础模型生成新版本,并在基准测试中验证性能。DGM受达尔文进化论启发,采用开放性探索策略,避免局部最优解。其自改进过程在隔离沙盒中进行,确保安全性。DGM在多个基准测试中表现显著提升,如SWE-bench和Polyglot。主要功能包括自我改进、实证验证、开放性

LEOPARD

LEOPARD是一款由腾讯AI Lab开发的视觉语言模型,专为处理包含大量文本的多图像任务而设计。它通过自适应高分辨率多图像编码模块和大规模多模态指令调优数据集,实现对复杂视觉语言任务的高效处理,包括跨图像推理、高分辨率图像处理及动态视觉序列长度优化。LEOPARD在自动化文档理解、教育、商业智能等领域具有广泛应用潜力。

腾讯混元3D

全称为Hunyuan3D-1.0,是腾讯推出的一款同时支持文生和图生的3D开源模型,解决现有3D生成模型在生成速度和泛化能力的不足。

ERA

ERA-42是一款由北京星动纪元开发的端到端原生机器人大模型,结合五指灵巧手星动XHAND1,可执行超过100种复杂灵巧操作任务。ERA-42无需预编程,具有快速学习能力,能在短时间内掌握新技能。该模型融合多模态信息,具备强大的跨模态能力和泛化能力,适用于工业自动化、医疗辅助、家庭服务、灾难救援和物流配送等多种场景。

CAR

CAR(Certainty-based Adaptive Reasoning)是字节跳动联合复旦大学推出的自适应推理框架,旨在提升大型语言模型(LLM)和多模态大型语言模型(MLLM)的推理效率与准确性。该框架通过动态切换短答案和长形式推理,根据模型对答案的置信度(PPL)决定是否进行详细推理,从而在保证准确性的同时节省计算资源。CAR适用于视觉问答(VQA)、关键信息提取(KIE)等任务,在数学

TurboLearn

TurboLearn是一款基于AI技术的学习工具,能将录音和PDF文件转换为结构化笔记、闪卡、测验和播客。支持多种格式编辑,提供智能聊天功能,便于提取关键信息和生成总结。笔记可在多平台同步,适用于学生、教师及专业人士,提升学习效率和知识管理能力。

Thetawise

Thetawise 是一款面向学生的 AI 数学辅导工具,支持多种输入方式,可生成详细解题步骤,帮助学生理解数学问题。它提供个性化学习计划、高级求解器、实时聊天支持及学习进度分析等功能,适用于课后辅导、考试准备、自学及远程教育等场景,有效提升数学学习效率。

AI Song Generator

AI Song Generator是一款基于人工智能技术的在线工具,能够生成高质量且原创的歌曲。用户可通过简单的描述或自定义歌词、标题和风格来创作音乐。该工具支持多种语言,适用于视频背景音乐、广告歌曲、游戏配乐等多种场景。其主要功能包括一键生成歌曲、自定义模式、多风格支持、多语言歌词以及高品质输出。

Matryoshka Diffusion Models

Matryoshka Diffusion Models (MDM) 是一种由苹果公司开发的创新扩散模型,专为生成高分辨率图像和视频而设计。通过多尺度扩散机制与NestedUNet架构,MDM实现了高效的信息共享与渐进式训练,显著提升了模型的训练效率与生成质量。该模型适用于资源受限的环境,可减少训练步骤并保持生成图像的细节与清晰度。其主要功能包括高分辨率图像生成、多分辨率处理、特征共享以及渐进式训练

Lingolette

Lingolette是一款利用AI技术打造的语言学习平台,专注于通过实时对话和个性化学习路径提升用户的外语口语与书面表达能力。平台支持多种语言(如英语、法语、德语等),并结合沉浸式场景、逐步指导和每日更新的内容激发学习动力。此外,它适合个人、教育机构、职场人士及企业团队使用,满足多样化的学习需求。