深度学习
AuraFusion360
AuraFusion360是一款面向360°无边界场景修复的AI工具,采用高斯散射表示和深度感知技术,实现高质量的物体移除与孔洞填充。其核心包括自适应引导深度扩散(AGDD)和基于SDEdit的细节增强,确保多视角一致性。适用于虚拟现实、建筑可视化、影视特效及文物修复等多个领域,提供高效、精确的场景修复解决方案。
CineMaster
CineMaster是快手推出的3D感知视频生成框架,支持通过文本提示及深度图、相机轨迹等控制信号生成高质量视频内容。其核心功能包括3D物体与摄像机控制、交互式设计、自动化数据标注和高质量视频输出。采用两阶段工作流程与扩散模型技术,结合语义布局控制网络与摄像机适配器,提升视频生成的精确度与灵活性。适用于影视制作、广告营销、游戏开发等多个领域。
Finedefics
Finedefics是由北京大学彭宇新教授团队开发的细粒度多模态大模型,专注于提升多模态大语言模型在细粒度视觉识别任务中的表现。该模型通过引入对象的细粒度属性描述,结合对比学习方法,实现视觉对象与类别名称的精准对齐。在多个权威数据集上表现出色,准确率达76.84%。其应用场景涵盖生物多样性监测、智能交通、零售管理及工业检测等领域。
Shallow Research
Shallow Research 是一种基于“小模型+大模型”架构的快速信息处理工具,能够在短时间内完成大量网页内容的搜索、整理和初步分析,适合需要高效获取信息和生成初步结论的场景,提升研究与决策效率。
Agentic Reasoning
Agentic Reasoning是由牛津大学开发的增强大型语言模型推理能力的框架,通过整合外部工具(如网络搜索、代码执行和结构化记忆)解决复杂的多步骤推理问题。其核心在于动态调用代理,如Mind Map代理、网络搜索代理和代码代理,以提升推理效率与准确性。该框架在博士级科学推理和深度研究任务中表现优异,具备实时信息检索、逻辑关系组织和计算分析支持等功能,适用于学术、医学、金融等多个领域。