AI项目与工具

Thetawave AI

Thetawave AI 是一款面向大学生的智能笔记工具,支持实时课堂转录、视频内容提炼、PPT 内容整理等功能。它能自动生成结构化笔记,并提供聊天机器人、思维导图、Flashcard 和 Quiz 等辅助学习工具,提升学习效率与知识整理能力。

混元图生视频

混元图生视频是腾讯混元推出的开源图生视频模型,支持用户上传图片并输入描述生成5秒短视频,具备对口型、动作驱动和背景音效自动生成等功能。模型适用于多种风格与场景,参数量达130亿,已在腾讯云上线并开源,支持本地部署与定制开发,适用于创意视频、特效制作及动画开发等多个领域。

Helix

Helix 是 Figure 公司推出的视觉-语言-动作(VLA)模型,专为人形机器人设计,支持对上半身的高精度、高频次控制,频率达 200Hz。它能基于自然语言指令执行未见过的物品操作,具备强大的泛化能力。系统采用端到端训练方式,可在低功耗设备上运行,适用于多机器人协作、家庭服务、工业自动化等多种场景,具有较高的商业化潜力。

Onlook

Onlook 是一款开源的视觉编辑工具,专为 React 应用设计,支持设计师和开发人员在浏览器中实时修改 UI 并自动生成代码,提升协作效率。所有操作在本地完成,确保数据安全,兼容 React 和 TailwindCSS,未来将扩展至更多框架。适用于快速原型设计、设计与开发协作、设计系统维护等场景。

Casevo

Casevo是一款由中国传媒大学研发的开源社会传播模拟系统,结合大语言模型与多智能体技术,用于模拟人类认知、决策和社会交互,分析并预测社会传播现象。其模块化设计支持从场景设定到复杂社会网络建模的全流程仿真,适用于新闻传播、社会计算、公共政策等多个领域,助力研究者进行理论构建与策略优化,推动AI在社会科学中的应用发展。

星语科研助手

星语科研助手是一款面向科研、教育及科普领域的智能写作辅助工具,具备自动生成高质量论文、语言润色与翻译以及专业评审等功能。它支持多种语言,能够帮助用户高效完成科研写作任务,确保内容的专业性与国际化,适用于学术论文、科研报告、科普文章及教学材料等多种应用场景。

MagicQuill

MagicQuill是一款基于AI的开源图像编辑工具,提供智能化的局部编辑功能。其核心功能包括AI驱动的智能建议、精确的像素级编辑(如添加、删除和颜色调整),以及多种定制化工具(如添加笔刷、减去笔刷和颜色笔刷)。此外,它还具备实时意图预测和参数调整能力,支持多模态大语言模型和扩散模型的协作,适用于个人娱乐、教育、专业设计及商业应用等多个领域。

CDial

CDial-GPT是一项由清华大学研发的基于大型中文对话数据集LCCC的预训练对话生成模型。该模型提供LCCC-base和LCCC-large两个版本的数据集,并具备预训练、微调、多模态学习等功能,能够生成高质量的对话回应。其应用场景涵盖客户服务、智能助手、在线教育等多个领域。

MyEssayWriter.ai

MyEssayWriter.ai 是一个创新的AI论文写作平台,提供高效、个性化的写作解决方案。平台采用先进的神经网络模型,生成符合学术标准的原创内容。用户可以节省时间,通过AI自动生成论文大纲和内容,并提高写作技能。该平台界面友好,支持多种论文类型,包括论证性、叙述性等,适用于学校、大学或任何学术需求。

谷歌DeepMind推出V2A技术,可为无声视频添加逼真音效

DeepMind推出的V2A(Video-to-Audio)模型能够将视频内容与文本提示相结合,生成包含对话、音效和音乐的详细音频轨道。它不仅能够与DeepMind自身的视频生成模型Veo协同工作,还能与其他视频生成模型,如Sora、可灵或Gen 3等,进行集成,从而为视频添加戏剧性的音乐、逼真的音效或与视频中角色和情绪相匹配的对话。V2A的强大之处在于其能够为每个视频输入生成无限数量的音轨。该模