模型

Open NotebookLM

Open NotebookLM是一个开源工具,能够将PDF文档转换为播客形式的音频内容。它基于Llama 3.1 405B、MeloTTS和Bark等先进AI模型,生成自然流畅的对话式音频,并支持多语言及个性化音调设置。用户可通过简单易用的Gradio界面上传PDF文件并下载MP3格式的音频文件,适用于教育、科研、商业分析等多个领域。

MindSearch

MindSearch是一款开源的AI搜索框架,由上海人工智能实验室联合研发团队推出。它结合了大规模信息搜集和整理能力,利用InternLM2.5 7B对话模型,可在短时间内从众多网页中搜集有效信息。该框架采用多智能体框架模拟人类思维模式,先规划后搜索,从而提高信息的准确性和完整性。主要功能包括复杂查询处理、动态图构建、并行信息检索、分层检索策略、上下文管理和响应生成等。其应用场景广泛,包括学术研究

交小智

交小智是西安交通大学推出的AI应用平台,支持用户零代码创建智能体,适用于教学、科研和校园生活等多种场景。平台集成多种大模型,具备知识库管理、插件扩展、API接口等功能,可定制问答机器人、科研助手、校园服务工具等。用户可发布智能体并与其他系统集成,提升工作效率与服务体验。

DreamFit

DreamFit是由字节跳动与高校联合研发的虚拟试衣框架,专注于轻量级服装图像生成。通过优化文本提示与特征融合技术,提升图像质量与一致性,降低模型复杂度和训练成本。支持姿势控制、多主题服装迁移等功能,适用于虚拟试穿、服装设计、广告制作等多个场景,具备良好的泛化能力和易用性。

Vision Search Assistant

Vision Search Assistant (VSA) 是一种结合视觉语言模型与网络代理的框架,旨在提升模型对未知视觉内容的理解能力。它通过网络检索,使 VLMs 能够处理和回答有关未见图像的问题。VSA 在开放集和封闭集问答测试中表现出色,支持图像描述生成、网络知识搜索、协作生成等功能,可应用于图像识别、新闻分析、教育、电商和旅游等多个领域。

天工大模型

有时候,写作就像是一场冒险,不知道路在何方?天工大模型天工AI创作在这里,温柔地伸出手,为你点亮前行的路灯。咱们一起看看,这小助手都能帮你做什么吧!

哩布哩布AI

liblibai哩布哩布AI,原创AI模型分享社区,这里有最新、热门的模型素材,10万+模型免费下载。欢迎每一位创作者加入,分享你的作品。与中国原创模型作者交流,共同探索AI绘画。

LLM2LLM

LLM2LLM是一种基于教师-学生架构的迭代数据增强方法,通过生成针对性的合成数据提升语言模型在低数据量场景下的性能。该技术通过识别并强化模型预测错误的数据点,实现精准优化,同时控制数据质量和规模。适用于医学、法律、教育等数据稀缺领域,具有良好的可扩展性和实用性。

Aether

Aether是由上海AI Lab开发的生成式世界模型,基于合成数据训练,具备4D动态重建、动作条件视频预测和目标导向视觉规划等核心功能。它通过三维时空建模和多任务协同优化,实现对环境的精准感知与智能决策,具有出色的零样本泛化能力,适用于机器人导航、自动驾驶、虚拟现实等多个领域。

Edify 3D

Edify 3D 是 NVIDIA 推出的一款高效3D资产生成工具,能够从文本或图像输入快速生成高质量的3D模型。其主要功能包括支持文本到3D、图像到3D的转换,生成高分辨率纹理与 PBR 材质,并具备快速生成、UV贴图和材质图生成等特性。该工具通过多视图扩散模型、Transformer 模型及跨视图注意力机制实现精准建模,适用于游戏开发、虚拟现实、影视制作及建筑可视化等多个领域。