语言模型

智星AI

智星AI作为一个多功能的人工智能对话软件,以其丰富的插件功能和不断扩展的插件库,为用户提供了一个灵活、有用的工具,以增强工作和日常生活的效率和乐趣。

原子回声AtomGPT大模型

原子回声AtomGPT大模型是一个不断学习和进步的中文大模型项目,它通过向用户展示模型的学习过程,提供了一个参与和观察模型成长的平台。

Lyra

Lyra是一款由香港中文大学、SmartMore和香港科技大学联合研发的高效多模态大型语言模型(MLLM)。它通过整合视觉、语音和文本三种模态的信息,实现了强大的跨模态理解和推理能力。Lyra不仅擅长处理长语音数据,还支持流式文本-语音生成及跨模态信息交互,适用于智能助手、客户服务、教育培训、医疗健康等多个领域。

Docmatix

Docmatix 是一个专为文档视觉问答任务设计的大规模数据集,包含240万张图像和950万个问题-答案对,源自130万个PDF文档。数据集覆盖广泛,包括扫描图片、PDF文件和数字文档,且具有高质量的问答对。Docmatix 支持模型训练和微调,可用于训练视觉语言模型,提高其在理解和回答与文档内容相关问题方面的性能。应用场景包括自动化客户服务、智能文档分析、教育和学术研究以及业务流程自动化等。

Vision Parse

Vision Parse 是一款开源工具,旨在通过视觉语言模型将 PDF 文件转换为 Markdown 格式。它具备智能识别和提取 PDF 内容的能力,包括文本和表格,并能保持原有格式与结构。此外,Vision Parse 支持多种视觉语言模型,确保解析的高精度与高速度。其应用场景广泛,涵盖学术研究、法律文件处理、技术支持文档以及电子书制作等领域。

AutoConsis

AutoConsis是一款基于深度学习和大型语言模型的UI内容一致性智能检测工具,能够自动识别和提取界面中的关键数据,并对数据一致性进行高效校验。它支持多业务场景适配,具备高泛化性和高置信度,广泛应用于电商、金融、旅游等多个领域,助力提升用户体验和系统可靠性。

PaliGemma 2 mix

PaliGemma 2 Mix 是谷歌 DeepMind 推出的多任务视觉语言模型,支持图像描述、目标检测、OCR、文档理解等功能。模型提供多种参数规模和分辨率选项,适用于不同场景。其基于开源框架开发,易于扩展,可通过简单提示切换任务。适用于科学问题解答、文档分析、电商内容生成等多个领域。

14个AI智能体和应用开发平台,零代码构建AI应用

本文介绍了14款AI工具和开发平台,涵盖聊天机器人、内容生成、数据分析、智能客服等多个领域。这些平台通过无代码或低代码方式,帮助非技术用户快速构建和部署AI应用,显著降低了技术门槛。工具特性包括多模态处理、插件扩展、可视化工作流设计等,广泛适用于个人和企业用户。

Askchat.ai

一个基于chatGPT,提供永久角色扮演和prompt工具的人工智能网站,Askchat.ai使用GPT-3.5和GPT-4.0算法进行训练。能够理解和解释人类自然语言,并用合适的方式进行回答。

STORM AI

STORM AI 是一款由斯坦福大学开发的开源AI写作工具,能够快速将一个主题转化为长篇文章或研究论文。它利用大语言模型(LLM)进行多角度提问和模拟专家对话,生成深入且准确的内容。STORM AI 可以自动收集资料、生成大纲,并最终形成完整的文章。其主要功能包括基于互联网搜索撰写文章、多角度提问、模拟专家对话、生成研究大纲以及引用和参考资料管理。此外,STORM AI 还能够自动化研究过程,为写