学习

Slide Dish

Slide Dish是一款旨在提升家庭烹饪与摆盘技能的移动应用,其核心功能包括AI驱动的食谱生成、详细的烹饪指导、摆盘创意以及购物清单管理。用户可依据现有食材或个人偏好获取定制化食谱,并通过社交平台与其他烹饪爱好者交流心得。此应用适用于家庭厨师、食材管理者、特殊饮食需求者以及烹饪初学者,帮助他们在日常烹饪、节庆宴请及技能提升中实现更佳表现。

DCEdit

DCEdit是一款基于双层控制机制的图像编辑工具,结合精确语义定位策略与视觉、文本自注意力优化,提升图像编辑的准确性和可控性。无需额外训练即可应用于现有扩散模型,支持复杂场景下的精细编辑任务,如对象替换、颜色调整等,适用于广告、影视、社交媒体等多个领域。

波波熊学伴

波波熊学伴作为一款AI学习辅助工具,通过智能化的方式帮助孩子更有效地学习和理解新知识。它不仅激发孩子的好奇心和自驱力,还为家长提供了一个安心的解决方案,以支持孩子在AI时...

XMusic

XMusic是腾讯多媒体实验室开发的AI作曲框架,支持多模态输入(如图片、文字、视频等)生成情绪、风格、节奏可控的高质量音乐。其核心技术包括多模态解析、符号音乐表示与生成优化,具备商用级音乐生成能力。适用于视频配乐、互动娱乐、音乐教育、辅助创作及音乐治疗等多个场景,有效降低音乐创作门槛,提升创作效率与个性化体验。

Getsound

Getsound基于当前天气条件的个性化音景。可用于水疗中心、酒店、度假村和工作场所。使用24/7天气监测和物理环境参数,该应用程序创建不断变化且独特的音景。 还提供了20多个音景,...

数画APP

数画APP是一款国产AI绘画应用,用户通过语音对话或输入画面描述词,数画软件就会根据用户的描述为你创作一幅专属绘画作品。

UniTok

UniTok是由字节跳动联合高校研发的统一视觉分词器,支持视觉生成与理解任务。其采用多码本量化技术,将视觉特征分割并独立量化,显著提升离散token的表示能力。在ImageNet上实现78.6%的零样本分类准确率,图像重建质量达0.38。可作为多模态大语言模型的视觉输入模块,广泛应用于图像生成、视觉问答、内容创作及跨模态检索等场景。

Florence

Florence-2是微软Azure AI团队研发的多功能视觉模型,支持图像描述、目标检测、视觉定位和图像分割等功能。该模型基于Transformer架构,采用序列到序列学习方法,利用自注意力机制实现多模态信息融合。通过训练大规模数据集,Florence-2在多个应用场景中表现出色,包括图像和视频分析、内容审核、辅助驾驶、医疗影像分析以及零售和库存管理。