模型

VARGPT

VARGPT是一款多模态大语言模型,整合了视觉理解和生成任务于统一的自回归框架中。它通过next-token和next-scale预测机制,支持文本与图像的混合输入和输出,具备高效的视觉生成能力。模型采用三阶段训练策略,提升了在视觉问答、推理及图像生成任务中的表现。适用于多模态内容创作、指令到图像合成等场景。

书生·筑梦2.0

它不仅提供了更大的创作灵活性,还通过高质量的视频输出满足了用户对画质和帧率的高需求。Vchitect 2.0及其配套的VEnhancer框架,为视频内容创作者提供了强大的工具,以创造更加生...

Samsung Gauss2

Samsung Gauss2是一款由三星推出的第二代多模态生成式AI模型,具备处理文本、代码和图像等多类型数据的能力。它通过引入知识图谱技术和专家混合技术,实现了个性化服务和高效的任务执行。此外,该模型还支持多种语言及编程语言,并能在无网络环境下独立运行,广泛适用于智能手机、平板电脑、笔记本电脑以及企业级应用场景。

SocraticLM

SocraticLM 是一款基于苏格拉底教学法的人工智能模型,由中科大与科大讯飞联合开发。它通过提问引导学生主动思考,具备多轮对话能力和个性化教学功能。模型在 SocraTeach 数据集上训练,教学性能优于 GPT-4,整体质量提升 12%。其综合评估系统涵盖五项教学维度,适用于数学教学、个性化辅导及在线教育平台,为教育技术发展提供了新思路。

FramePainter

FramePainter 是一款基于AI的交互式图像编辑工具,结合视频扩散模型与草图控制技术,支持用户通过简单操作实现精准图像修改。其核心优势包括高效训练机制、强泛化能力及高质量输出。适用于概念艺术、产品展示、社交媒体内容创作等场景,具备低训练成本和自然的图像变换能力。

Auto Think

Auto Think是快手Kwaipilot团队开源的KwaiCoder-AutoThink-preview自动思考大模型,针对深度思考大模型的“过度思考”问题,提出了一种全新的训练范式。模型融合“思考”和“非思考”能力,能根据问题难度自动切换模式,提升复杂任务表现。在代码和数学类任务中,性能提升可达20分。其技术原理包括最小提示干预和多阶段强化学习,适用于视频生成、文案创作、智能客服等多个场景。

Tennr

Tennr是一款利用AI技术优化医疗文档处理的平台,核心为RaeLM™视觉语言模型,支持文档分类、信息提取、资格审核等功能,广泛应用于患者入院、转诊管理、保险索赔等场景,显著提高医疗服务效率并降低人力依赖。

OpenR

OpenR是一个由多家知名高校联合开发的开源框架,专注于通过强化学习和搜索技术提升大型语言模型的推理能力。它集成了数据获取、强化学习训练及非自回归解码功能,支持多种搜索算法和在线强化学习训练,能够有效提高模型的推理效率和精度。同时,其自动化数据处理能力减少了人工标注的需求,适用于数学问题求解、代码生成、自然语言处理等多种应用场景。

Dezgo

Dezgo是一款集文本到图像生成、图像编辑与多模型支持于一体的AI艺术工具,支持用户通过输入文本描述快速生成高质量图像。其主要功能包括文本到图像生成、图像到图像调整、自定义纵横比及图像编辑,广泛应用于艺术创作、营销材料、内容创作、教育研究、游戏开发及影视制作等领域。

ScrapeGraphAI

ScrapeGraphAI 是一款基于大型语言模型(LLM)的智能网络爬虫工具包,能够高效提取结构化数据。其核心功能包括 SmartScraper、SearchScraper 和 Markdownify,支持自然语言驱动的爬取、多页面搜索、自适应爬取、多模型和多平台兼容,可生成代码并存储为 CSV 或 JSON 格式。适用于市场分析、学术研究、产品信息收集等场景。