人工智能

Claude2

Claude是Anthropic公司开发的一系列人工智能模型。这些模型使用了Transformer架构,并通过无监督学习、人类反馈强化学习(RLHF)进行训练。Claude模型可以理解和生成人类语言,用于各种任务,如回答问题、写作、编辑和编程。

MoMask

MoMask是一款基于生成式掩码建模的3D人体动作生成工具,支持文本驱动的动作创建与编辑。采用分层量化与Transformer架构,实现高精度、连贯的3D动作序列生成,在HumanML3D数据集上的FID值仅为0.045。支持动作时序控制、多平台部署及动作评估功能,适用于游戏开发、动画制作、VR及体育分析等多个领域。

SurveyX

SurveyX 是一款基于大型语言模型的学术综述生成工具,由多所高校联合开发。它通过用户输入的标题和关键词,自动生成高质量、结构化的学术综述,适用于多个研究领域。系统具备高效的文献检索与整合能力,结合智能大纲生成和内容优化技术,提升综述的准确性和逻辑性。同时支持动态更新和多模态展示,广泛应用于科研、教学及行业分析场景。

ShowNotes

一个提供与音频转录和创建节目笔记相关的服务的网站,它借助chatGPT 将YouTube自动字幕转换为播客节目笔记。

Wan

Wan是阿里推出的AI创意平台,支持AI绘画与视频生成,能根据文字或图片生成高质量艺术图像和动态视频。提供多种风格选择与创意探索功能,用户可保存作品并分享。适用于艺术设计、内容创作、教育学习及商业营销等多个领域,助力提升创作效率与创意表达。

AI Baby Generator

AI Baby Generator 是一个基于人工智能技术预测未来孩子外貌的工具。通过分析父母的照片,利用先进的算法预测并生成孩子可能的外貌。该工具结合了面部识别技术和遗传学原理,为用户提供一种有趣且直观的方式探索遗传特征的传递。尽管生成的图像主要用于娱乐,但它能够激发对遗传学的兴趣,并为社交媒体上的分享提供乐趣。

ContentV

ContentV是字节跳动开源的80亿参数文生视频模型框架,通过替换Stable Diffusion 3.5 Large的2D-VAE为3D-VAE并引入3D位置编码,提升视频生成能力。采用多阶段训练策略和流匹配算法,实现高效训练。支持文本到视频生成、自定义视频参数、风格迁移与融合、视频续写与修改等功能,适用于视频内容创作、游戏开发、VR/AR和特效制作等场景。

Yoodli AI

Yoodli 是一款可让您录制您的演讲或演示文稿,并获得有关在沟通方面的分析,例如节奏、眼神交流、肢体语言、包容性语言、手势等。

ImageToVideo AI

ImageToVideo AI 是一款基于人工智能的图像转视频工具,能够将静态图片转化为动态视频。通过智能分析图像内容并结合用户输入的文本指令,可添加动画、转场、音乐、字幕等元素,生成高质量、富有表现力的视频。支持多种格式输出,提供丰富的模板和自定义选项,适用于个人创作、内容制作、教育及广告等多种场景,提升视频制作效率与视觉效果。

Google Beam

Google Beam是谷歌推出的AI驱动的3D视频通信平台,能够将2D视频流转换为逼真的3D效果,提升远程通话的自然度和直观性。用户可实现眼神交流和细微表情识别,增强沟通效果。支持实时语音翻译,打破语言障碍,并基于Google Cloud提供企业级可靠性,适用于远程协作、教育、医疗、国际合作和个人社交等多种场景。