学习

OThink

OThink-MR1是由OPPO研究院与香港科技大学(广州)联合研发的多模态语言模型优化框架,基于动态KL散度策略(GRPO-D)和奖励模型,提升模型在视觉计数、几何推理等任务中的泛化与推理能力。其具备跨任务迁移能力和动态平衡探索与利用机制,适用于智能视觉问答、图像描述生成、内容审核等多个领域,具有广阔的应用前景。

COVE

COVE是一款以AI驱动的协作工具,提供共享工作空间和实时编辑功能,支持用户与AI共同思考和工作。它能从用户的文本、表格、图像等内容中学习,提供个性化建议和多样化思路,同时无缝集成于常用工具,适用于项目管理、研究分析、内容创作、教育学习及会议记录等多个场景。

通往AGI之路

《通往 AGI 之路》! 这里旨在提供一个全面系统、易于理解的 AI 学习路径,帮助您了解 AI 从概念到应用等各方面知识。

Podwise

Podwise 是一款基于人工智能的播客知识管理工具,能够将播客内容转化为结构化的文字、总结和思维导图,帮助用户快速掌握核心信息。它支持全球范围内的播客搜索、多语言处理,并可与多种知识管理工具无缝衔接,适用于学习、研究、商业分析等多个场景。 ---

Motion Dreamer

Motion Dreamer是由香港科技大学(广州)研发的视频生成框架,采用两阶段架构生成物理合理的视频内容。通过引入“实例流”实现从稀疏到密集的运动控制,支持用户以少量提示生成时间连贯的视频。其随机掩码训练策略增强了模型的推理能力与泛化性能,已在多个数据集上验证其优越性。适用于视频创作、动画制作、VR/AR及自动驾驶等多个领域。

AndroidGen

AndroidGen 是一个基于大语言模型(LLM)的智能代理框架,专注于提升 Agent 在数据稀缺环境下的任务执行能力。它通过无监督方式收集用户操作轨迹并进行训练,结合 ExpSearch、ReflectPlan、AutoCheck 和 StepCritic 四个核心模块,增强任务规划、执行和评估能力。该框架在 AndroidWorld 和 AitW 基准测试中表现出色,适用于自动化任务处理、

RDT

RDT是清华大学AI研究院推出的一款双臂机器人操作任务扩散基础模型,拥有十亿参数量,可自主完成复杂任务,如调酒和遛狗。该模型基于模仿学习,具备强大的泛化能力和操作精度,支持多种模态输入和少样本学习。RDT已在餐饮、家庭、医疗、工业及救援等领域展现广泛应用前景,推动机器人技术发展。

TokenSwift

TokenSwift是由北京通用人工智能研究院开发的超长文本生成加速框架,可在90分钟内生成10万Token文本,效率较传统模型提升3倍,且保持输出质量。其核心优势包括多Token并行生成、动态KV缓存管理、上下文惩罚机制等技术,支持多种模型架构。适用于内容创作、智能客服、学术研究及编程辅助等场景。

LetMeEnglish

专注于帮助用户提升英文水平,LetMeEnglish提供免费的英文学习内容与练习资源,网站提供英文语法、英文词汇、英文句型、日常英文四大板块。

Awesome Screenshot

一款集屏幕录制、截图和编辑于一体的强大工具,特别适用于远程工作、在线学习和内容分享。