计算 - 智狐AI导航

PaliGemma 2 mix

PaliGemma 2 Mix 是谷歌 DeepMind 推出的多任务视觉语言模型，支持图像描述、目标检测、OCR、文档理解等功能。模型提供多种参数规模和分辨率选项，适用于不同场景。其基于开源框架开发，易于扩展，可通过简单提示切换任务。适用于科学问题解答、文档分析、电商内容生成等多个领域。

AI项目与工具 2025年06月12日 23 点赞 0 评论 384 浏览

北京理工大学计算机学院

计算机学院始建于1958年，是全国最早设立计算机专业的高校之一。2018年4月，计算机学院、软件学院、网络科学与技术研究院合并成立新的计算机学院。学院累计为国家培养各类人才1500...

教育学习 1970年01月01日 0 点赞 0 评论 384 浏览

DICE

DICE-Talk是由复旦大学与腾讯优图实验室联合开发的动态肖像生成框架，能够根据音频和参考图像生成具有情感表达的高质量视频。其核心在于情感与身份的解耦建模，结合情感关联增强和判别机制，确保生成内容的情感一致性与视觉质量。该工具支持多模态输入，具备良好的泛化能力和用户自定义功能，适用于数字人、影视制作、VR/AR、教育及心理健康等多个领域。

AI项目与工具 2025年06月11日 87 点赞 0 评论 381 浏览

SmartEraser

SmartEraser是中科大与微软亚洲研究院联合开发的图像编辑工具，采用“掩码区域引导”技术实现精准对象移除，同时保留周围上下文。基于Syn4Removal数据集训练，支持多种掩码输入，适用于复杂场景，广泛应用于照片编辑、设计、文物修复及科研等领域。

AI项目与工具 2025年06月12日 36 点赞 0 评论 381 浏览

OpenVision

OpenVision是加州大学圣克鲁兹分校推出的多模态视觉编码器系列，具备从5.9M到632.1M参数的多种模型，适用于不同硬件环境。其采用渐进式多阶段分辨率训练策略，训练效率比同类模型高2至3倍，在多模态任务中表现优异。支持可变大小patch输入，兼具灵活性与高效性，广泛应用于工业检测、机器人视觉、自动驾驶及科研教育等领域。

AI项目与工具 2025年06月11日 58 点赞 0 评论 380 浏览

赤兔Chitu

Chitu（赤兔）是清华大学与清程极智联合开发的高性能大模型推理引擎，支持多种GPU及国产芯片，打破对特定硬件的依赖。其具备全场景部署能力，支持低延迟、高吞吐、小显存优化，并在性能上优于部分国外框架。适用于金融风控、智能客服、医疗诊断、交通优化和科研等领域，提供高效、稳定的推理解决方案。

AI项目与工具 2025年06月12日 25 点赞 0 评论 378 浏览

ProX

ProX是一种用于提升大型语言模型预训练数据质量的框架，通过自动化编程手段实现数据清洗和精炼。其主要特点包括自动化细粒度数据处理、无需人工干预、显著提升模型性能以及广泛的领域适应性。ProX在多种任务中展示了超过2%的性能提升，并有效降低了训练成本。

AI项目与工具 2025年06月12日 53 点赞 0 评论 376 浏览

LayerSkip

LayerSkip 是一种针对大型语言模型推理优化的技术，通过层 dropout 和早期退出损失机制，实现从早期层的精准退出，降低计算成本并提高解码效率。该方法结合自我推测解码技术，支持模型在早期层生成预测并通过后续层验证修正，广泛适用于文档摘要、编程任务、语义解析等自然语言处理任务，同时确保高精度与低延迟。

AI项目与工具 2025年06月12日 72 点赞 0 评论 372 浏览

百聆

百聆是一款开源语音对话系统，融合语音识别、语音活动检测、大语言模型和语音合成技术，实现自然流畅的语音交互。支持低延迟运行，无需GPU，适用于边缘设备。具备记忆、工具调用和任务管理等功能，适用于智能家居、个人助理、车载系统等多种场景，提供高效的语音交互解决方案。

AI项目与工具 2025年06月12日 90 点赞 0 评论 371 浏览

Mathtutor on Groq 是一款基于 Groq 架构的 AI 辅导工具，通过语音识别功能接收数学问题，结合强大的数学引擎提供实时解题过程与答案。其主要功能包括语音输入、LaTeX 公式渲染、高精度计算及自然语言处理支持，适用于代数、微积分等领域的学习与教学辅助。此外，它还集成了 xRx 框架、Whisper 和 Llama 模型，确保高效且精准的问题解决能力。Mathtutor on G

AI项目与工具 2025年06月12日 18 点赞 0 评论 368 浏览

计算

首页

计算

列表

默认

浏览次数

发布日期