AI

Titans

Titans是谷歌推出的新型神经网络架构,突破了传统Transformer在处理长序列数据时的限制。其核心是神经长期记忆模块,可模拟人脑记忆机制,提升对关键信息的存储与提取能力。Titans支持多种任务,包括语言建模、常识推理和时间序列预测,尤其在处理超长上下文时表现优异。该架构具备并行计算能力,提高了训练效率,适用于文本生成、生物信息学、视频音乐处理等多个领域。

HumanDiT

HumanDiT是一种由浙江大学与字节跳动联合开发的高保真人体视频生成框架,基于扩散变换器(DiT)实现姿态引导的视频生成。它支持长序列、多分辨率视频生成,并通过关键点扩散变换器(Keypoint-DiT)确保动作的连贯性与自然性。引入前缀潜在参考策略以保持个性化特征,结合姿态适配器和细化模块提升细节质量。适用于虚拟人、动画制作、沉浸式体验及视频续写等多种场景。

MyEdit

一款在线图片编辑和音频剪辑工具,用户可以使用AI照片编辑器来增强照片、去除人物和文字,甚至生成图像和场景。还提供强大的音频编辑工具,包括文本转语音、语音转文本和背景噪音去除功能。

NLWeb

NLWeb是微软推出的开源项目,旨在通过自然语言界面简化网站交互,使网站成为AI驱动的应用程序。它利用半结构化数据(如Schema.org、RSS)和LLM工具,提供自然语言交互、内容发现、智能体交互等功能。支持MCP协议,实现与AI助手的无缝对接,具备跨平台和高度可扩展性,适用于零售、餐饮、旅游、新闻及客服等多种场景。

Mochi 1

Mochi 1 是一款基于开源架构的 AI 视频生成工具,具有高保真度和强大的提示遵循能力。它采用 Genmo 自研的非对称扩散变压器(AsymmDiT)架构,结合实时视频生成技术和流式架构,能够高效生成高质量的视频内容。Mochi 1 支持多种应用场景,包括视频内容创作、教育、娱乐、广告和社交媒体等,适用于个人和企业用户。

xpression camera

Expression Camera是一款结合人工智能技术的虚拟相机应用,能够通过单张照片生成逼真的虚拟形象,涵盖面容、表情和身体动作。支持实时生成、个性化定制、隐私保护及多样化内容创作。用户可在视频会议、直播、在线教育等场景中使用虚拟形象,兼具实用性和娱乐性。