InternVideo2.5
InternVideo2.5是一款由上海人工智能实验室联合多机构开发的视频多模态大模型,具备超长视频处理能力和细粒度时空感知。它支持目标跟踪、分割、视频问答等专业视觉任务,适用于视频检索、编辑、监控及自动驾驶等多个领域。模型通过多阶段训练和高效分布式系统实现高性能与低成本。
Micro LLAMA
Micro LLAMA 是一款基于简化版 Llama 3 模型的教学工具,通过约 180 行代码实现 8B 参数的最小化模型,支持自注意力机制和前馈神经网络。它提供 Jupyter 笔记本和 Conda 环境配置指南,帮助用户轻松学习和实验,特别适用于学术教学、研究开发和个人学习。
LitLit(立理)
LitLit(立理)是一款基于AI技术的学术工具,主要功能包括文献检索、文献阅读、综述生成、学术问答等。它能够通过自研算法精准筛选文献,快速生成文献综述,并支持文献内容的深度解析和个性化学习资源推荐。此外,LitLit(立理)还提供了实时学术问答服务,帮助用户高效完成学术研究和论文写作。
Speechnotes
Speechnotes是一款基于AI的语音转文字工具,提供高精度语音识别、实时语音输入、语音命令支持、自动大写处理等功能,支持多平台操作(Chrome扩展、Android、iOS、API等)。它强调隐私保护,录音不经过人工处理且自动删除,适合快速转录、会议记录、写作、医疗记录等多种应用场景,是提升工作效率的理想选择。
Evolving Agents
Evolving Agents 是一个用于构建、管理及优化 AI 代理的生产级框架,支持代理间通信与协作,并能根据语义理解和历史经验动态进化。具备智能代理进化、标准化通信协议、语义搜索、YAML 工作流定义等功能,适用于文档处理、医疗、金融、客服等场景,提升任务处理效率与效果。