R

OpenELM

OpenELM是苹果公司推出的一系列高效开源语言模型,涵盖从2.7亿到30亿参数规模的不同版本。该模型基于Transformer架构,采用层间缩放策略优化参数分配,使用分组查询注意力(GQA)和SwiGLU激活函数等技术。OpenELM在公共数据集上预训练,并在多项自然语言处理任务中展现出色性能。模型代码和预训练权重已公开,旨在促进开放研究和社区发展。

Oliva

Oliva 是一款基于语音驱动的 RAG 助手,结合 Langchain 和 Qdrant 向量数据库,实现语音指令到结构化数据的实时响应。支持多智能体协作、语义搜索与灵活知识库集成,适用于企业知识库、智能客服、智能家居等多种场景。具备语音识别、实时通信和自然语言处理能力,提升信息获取与交互效率。

Animate Anyone

Animate Anyone是一款由阿里巴巴智能计算研究院开发的开源框架,旨在将静态图像中的角色或人物动态化。它采用扩散模型,结合ReferenceNet、Pose Guider姿态引导器和时序生成模块等技术,确保输出的动态视频具有高度一致性和稳定性。该框架支持多种应用,包括角色动态化、时尚视频合成及人类舞蹈生成,用户可通过GitHub或Hugging Face社区轻松体验。

Video Grabber

海量视频资源,一键免费下载优酷、爱奇艺、哔哩哔哩、搜狐等其他网站的视频

HyperBooth.Ai

人工智能个性化照片写真生成器。只需上传一张输入照片,HyperBooth.Ai即可在 30 秒或更短的时间内生成您喜欢的风格的 AI照片。

OThink

OThink-MR1是由OPPO研究院与香港科技大学(广州)联合研发的多模态语言模型优化框架,基于动态KL散度策略(GRPO-D)和奖励模型,提升模型在视觉计数、几何推理等任务中的泛化与推理能力。其具备跨任务迁移能力和动态平衡探索与利用机制,适用于智能视觉问答、图像描述生成、内容审核等多个领域,具有广阔的应用前景。

PixVerse

PixVerse是一款短视频制作工具,其基础功能包括文生视频和图生视频。这款工具由国人团队开发,主要面向用户免费开放,支持多模态输入,如图像、文本和音频,能够将这些输入快速转...

Markdown

Markdown-to-Image 是一个基于 React 的开源工具,可将 Markdown 文本转换为图像,支持多种输出格式和自定义样式。其应用场景包括社交媒体内容创作、技术文档可视化、博客标题设计以及教育和营销材料制作,具备强大的灵活性和易用性。

Buysmart.AI

Buysmart.AI,基于大模型的智能电商购物ai助手,百度“文心杯”创业大赛一等奖。

DrawKit

一个提供高质量手绘插画资源的图库,DrawKit提供免费和付费的插画素材,涵盖2D和3D插画、图标和动画。DrawKit的素材可以用于商业项目,不需要担心版权问题。