优化

Tarsier2

Tarsier2是字节跳动研发的大规模视觉语言模型,擅长生成高精度视频描述并在多项视频理解任务中表现优异。其核心技术包括大规模数据预训练、细粒度时间对齐微调以及直接偏好优化(DPO)。该模型在视频问答、定位、幻觉检测及具身问答等任务中均取得领先成绩,支持多语言处理,具有广泛的应用潜力。

MinT

MinT是一款基于时间基位置编码技术的多事件视频生成框架,允许用户通过文本提示生成包含多个事件的连贯视频,并支持对事件顺序及持续时间的精确控制。其核心技术ReRoPE使得模型能够有效关联文本提示与视频帧,同时结合预训练的视频扩散变换器(DiT)和大型语言模型(LLM)的提示增强功能,进一步提升了视频生成的质量与丰富度。MinT适用于娱乐、广告、教育等多个领域,为视频创作带来了创新性的解决方案。

Pictory.ai

Pictory.ai,通过使用 AI 的强大功能将文本内容转换为高度可分享的视频,从而产生更多潜在客户并促进销售:快速、可扩展、经济实惠。

LaDeCo

LaDeCo是一款基于多模态模型的自动化图形设计工具,通过分层规划与逐步生成的方式,实现从多模态输入到高质量设计输出的转换。其核心功能涵盖层规划、层级设计生成、分辨率调整、元素填充及多样化设计输出,广泛适用于设计师、研究人员、评估人员及开发者等群体,助力提升设计效率与质量。

EICopilot

EICopilot是百度研究院开发的企业信息搜索工具,基于AI智能体和大型语言模型,实现自然语言到图数据库查询的精准转换。具备自动脚本生成、意图识别、查询掩码等技术,提升信息检索效率与准确性。适用于金融分析、企业调查、市场研究等多个领域,支持复杂关系查询与结果提炼。

易笔AI

易笔AI是一款基于人工智能技术的学术写作辅助工具,能够快速生成论文框架和初稿,涵盖引言、研究方法、结果分析等核心内容。支持多种论文类型和学科领域,具备结构自定义、内容扩展、写作优化等功能,适用于学生、研究人员及教育工作者,提升写作效率与质量。

嘀嗒狗

一个专注于TikTok短视频电商的数据分析平台,为你提供实时的TikTok业务咨询、全面的TikTok电商数据、专业的TikTok电商课程。

Aligner

Aligner是由北京大学团队开发的大语言模型对齐工具,通过学习对齐答案与未对齐答案之间的差异来提升模型性能。采用自回归seq2seq结构,在Q-A-C数据集上训练,无需RLHF流程。具备高效、灵活、即插即用等特点,支持多模型兼容,提升模型帮助性和安全性。适用于多轮对话、价值观对齐及MoE架构优化等场景。

Careerflow

Careerflow 是一款基于AI的求职辅助平台,提供简历优化、求职信撰写、模拟面试及求职跟踪等核心功能,帮助用户提升求职效率和成功率。平台支持多平台集成,适用于各类求职人群,助力职业发展。