模型

BLIP3

BLIP3-o是Salesforce Research等机构推出的多模态AI模型,结合自回归与扩散模型优势,实现高效图像理解和生成。基于CLIP语义特征,支持文本与图像间的双向转换及图像编辑。采用顺序预训练策略,提升模型性能。完全开源,适用于创意设计、视觉问答、艺术生成等多种场景。

Dreamlike.Art

Dreamlike.Art是一个免费的人工智能艺术生成器和创作工具,利用人工智能的力量,用户可以在几秒钟内创建令人惊叹的原创艺术。它提供图像升级、创建变化、修复面部等功能。

Ai2 PaperFinder

Ai2 PaperFinder 是由艾伦人工智能研究所开发的基于大型语言模型的学术文献检索工具,支持多领域精准搜索,具备语义驱动、多Agent协同、引用网络分析等功能,能自动规划关键词、挖掘小众文献,助力研究人员快速获取高质量学术成果。

PromptBench

一个基于 Pytorch 的 Python 包,用于评估和理解大型语言模型的统一库。它为研究人员提供了用户友好的 API,以便对 LLM 进行评估。

SnackPrompt

Snackprompt.com是一个聚焦于AI prompts(即AI提示)的平台,能够提供给用户各种高质量的AI提示,让他们的ChatGPT体验更加卓越。

GEN3C

GEN3C是由NVIDIA、多伦多大学和向量研究所联合开发的生成式视频模型,基于点云构建3D缓存,结合精确的相机控制和时空一致性技术,实现高质量视频生成。支持从单视角到多视角的视频创作,具备3D编辑能力,适用于动态场景和长视频生成。在新型视图合成、驾驶模拟、影视制作等领域有广泛应用前景。

Molmo 72B

Molmo 72B是一款由艾伦人工智能研究所推出的开源多模态AI模型,集成了图像和文本处理能力,适用于图像描述生成、视觉问答、文档解析及多模态交互等多种任务。凭借其强大的视觉编码能力和先进的模型架构,Molmo 72B在学术基准测试中表现优异,为开源AI技术的发展做出了重要贡献。

neural frames

Neural Frames 是一款基于人工智能的文本转视频工具,能够将文本描述转换为动态视频内容,支持多种神经网络模型的选择与自定义训练。它具备音频反应动画、帧级编辑控制和高分辨率输出等功能,适用于音乐视频制作、数字艺术创作、广告设计、教育视频开发等多个领域,为创意工作者提供高效且灵活的解决方案。

LIGER

LIGER是一种由Meta AI等机构研发的混合检索模型,结合生成式检索与密集检索技术,提升推荐系统的效率与准确性。其核心功能包括高效生成候选项目、优化排序、处理冷启动问题及融合语义信息。LIGER通过多目标优化和语义融合机制,显著提高了推荐的精准度与适应性,广泛应用于电商、内容、社交及教育等领域。

DreamTalk

一个由清华大学、阿里巴巴和华中科大共同开发的一个基于扩散模型可以让人物照片说话,支持包括歌曲、多种语言的语音、嘈杂的音频在内的各种声音匹配让人物头像说话的框架。