AI项目与工具

Spirit LM

Spirit LM 是一种由 Meta AI 开发的多模态语言模型,能够处理文本和语音数据,支持跨模态学习。其基础版(BASE)和表达版(EXPRESSIVE)分别侧重于语义理解和情感表达。Spirit LM 可用于自动语音识别(ASR)、文本到语音(TTS)、语音分类及情感分析等任务,在语音助手、语音转写、有声读物等领域具有广泛应用前景。

SuperEdit

SuperEdit是由字节跳动与佛罗里达中央大学联合开发的图像编辑工具,基于扩散模型和优化监督信号,实现高精度的自然语言指令图像编辑。其特点包括高效训练、保留图像质量以及支持多种编辑类型。该工具适用于内容创作、影视、游戏、教育和医疗等多个领域,提供灵活且高效的图像处理方案。

Onit

Onit是一款为Mac设计的AI聊天助手,支持停靠在任何应用程序中。它能通过高亮文本或自动提取当前窗口内容作为上下文,无需复制粘贴。用户可自由切换多种AI模型,如OpenAI、Anthropic等,并支持本地模式以确保数据安全。Onit还提供可定制快捷键、文件上传和代码块支持等功能,适用于代码辅助、内容创作、技术支持等多种场景,提升工作效率和交互体验。

日日新融合大模型

日日新融合大模型(SenseNova)是商汤科技推出的多模态AI系统,支持文本、图像、视频等多种数据的融合处理,具备强大的深度推理与多模态分析能力。该模型在多个权威评测中表现优异,广泛应用于自动驾驶、视频交互、办公教育、金融、园区管理及工业制造等领域,提升了多场景下的智能化水平。

扣子罗盘

扣子罗盘是一款面向开发者和创业团队的AI工具平台,支持从Prompt开发到AI Agent部署的全生命周期管理。具备Prompt智能中枢、实时观测预警和全链路评测体系等核心功能,提升开发效率与系统稳定性。适用于智能客服、内容创作、教育辅导等多个场景,助力AI应用快速落地。

Learn About

Learn About是一款由谷歌开发的对话式AI学习助手,基于Gemini模型,通过问答形式为用户提供简明答案并引导深入学习。它具备知识点梳理、参考资料推荐、内容大纲生成等功能,覆盖多学科领域,支持多模态学习资源,旨在提升用户的理解深度和学习效率。适合学术研究、备考复习、技能学习、家庭教育及终身学习等多种应用场景。

Flair.ai

Flair.ai是一款基于AI技术的在线设计工具,旨在帮助用户高效创建高质量的产品摄影图。它提供拖放式界面、实时协作功能及强大的场景构建能力,尤其擅长处理时尚领域的服装和珠宝摄影需求。用户还能通过自有数据训练私有AI模型,实现个性化创作。主要面向电商、广告营销、时尚设计等领域,助力提升视觉内容质量。

ArchiVinci

ArchiVinci是一款基于人工智能的建筑设计工具,能够将手绘草图或3D模型转化为逼真的建筑渲染图。其功能涵盖概念设计、深化设计、室内设计及景观规划,支持多种风格匹配与实时渲染,广泛应用于建筑、室内设计及教育领域,大幅提升设计效率与创新性。

QLIP

QLIP是一种基于二进制球形量化(BSQ)的视觉标记化方法,具备高质量图像重建和零样本图像理解能力。通过对比学习目标和两阶段训练策略,QLIP可作为视觉编码器或图像标记器,广泛应用于多模态任务,如文本到图像生成、图像到文本生成及多模态理解。其技术设计提升了模型的语义表达与训练效率,为统一多模态模型的开发提供了新思路。

剪小映

剪小映是抖音推出的AI视频剪辑应用,专为零基础用户设计,操作简单便捷。具备AI智能解析功能,可精准识别素材中的场景、人物等元素,提供智能剪辑指引。通过自动化成片功能,用户能快速生成高质量视频,支持智能优化,自动调整素材比例、亮度及音频节奏。用户可在智能生成基础上进行个性化调整,如更换素材、修改字幕等,满足不同需求。同时,剪小映注重隐私保护,支持桌面小组件和一键生成相册回忆等功能,适用于旅行记录、宠