大规模预训练

八斗智能

八斗智能的语义理解模型是一个强大的工具，它通过大规模预训练和行业特定的迁移学习，能够提供高度准确的语义理解服务。

Ai平台模型 1970年01月01日 0 点赞 0 评论 209 浏览

孟子大模型

孟子大模型作为澜舟科技的核心产品之一，展现了公司在认知智能领域的技术实力和创新能力。通过其强大的语言处理和多模态数据处理能力，孟子大模型为不同行业提供了灵活、高效的解...

创作工具 1970年01月01日 0 点赞 0 评论 563 浏览

乾元BigBangTransformer

BBT-2-12B-Text基于中文700亿tokens进行预训练，经过指令微调的BBT-2基础模型可以回答百科类和日常生活的问题。BBT-2.5-13B-Text基于中文+英文 2000亿tokens进行预训练。

Ai平台模型 1970年01月01日 0 点赞 0 评论 427 浏览

龙猫LongCat

龙猫LongCat是美团自主研发的生成式AI大模型，具备多模态处理能力，可支持文本、图像等内容生成任务。其核心功能涵盖智能编程、会议记录、文档编辑、图形设计与视频脚本生成等，适用于多种办公场景。通过大规模预训练与混合训练策略，龙猫在实际应用中展现出高效、精准的特点，有效提升工作效率与创新能力。

AI项目与工具 2025年06月12日 70 点赞 0 评论 519 浏览

Tarsier2

Tarsier2是字节跳动研发的大规模视觉语言模型，擅长生成高精度视频描述并在多项视频理解任务中表现优异。其核心技术包括大规模数据预训练、细粒度时间对齐微调以及直接偏好优化（DPO）。该模型在视频问答、定位、幻觉检测及具身问答等任务中均取得领先成绩，支持多语言处理，具有广泛的应用潜力。

AI项目与工具 2025年06月12日 59 点赞 0 评论 357 浏览

TimesFM 2.0

TimesFM 2.0是谷歌推出的开源时间序列预测模型，采用仅解码器架构，支持处理长达2048个时间点的单变量序列，具备灵活的预测频率选择与分位头预测功能。模型通过大规模自监督预训练，覆盖多个领域，具有优秀的泛化能力。适用于零售、金融、交通、环境监测等多个场景，为数据分析与决策提供支持。

AI项目与工具 2025年06月12日 69 点赞 0 评论 385 浏览

Skywork o1

Skywork o1是一款具备中文逻辑推理能力的大规模预训练模型，其核心优势在于内嵌思考、规划和反思能力，显著提升了复杂任务的推理性能。该模型基于开源Llama架构，同时提供增强版以满足更高要求的应用场景。它适用于技术开发者、企业决策者、教育工作者、内容创作者及客户服务等多个领域，助力创新应用开发和高效决策支持。 ---

AI项目与工具 2025年06月12日 73 点赞 0 评论 375 浏览

大规模预训练

首页

大规模预训练

列表

默认

浏览次数

发布日期

八斗智能

孟子大模型

乾元BigBangTransformer

龙猫LongCat

Tarsier2

TimesFM 2.0

Skywork o1

大规模预训练 首页 大规模预训练

列表 默认 浏览次数 发布日期

八斗智能

孟子大模型

乾元BigBangTransformer

龙猫LongCat

Tarsier2

TimesFM 2.0

Skywork o1

大规模预训练

首页

大规模预训练

列表

默认

浏览次数

发布日期