AI项目与工具

Qwen2vl

Qwen2VL-Flux 是一款基于多模态图像生成的模型,结合了 Qwen2VL 和 FLUX 技术。它支持多种生成模式,包括变体生成、图像到图像转换、智能修复和 ControlNet 引导生成,并具备深度估计和线条检测功能。该模型提供灵活的注意力机制和高分辨率输出,适用于艺术创作、内容营销、游戏开发等多个领域。

金舟AI助手

金舟AI助手是一款依托人工智能和大数据技术开发的营销内容创作平台,提供短视频脚本、小红书推广文案、直播带货口播稿等多种内容形式的生成服务。其主要特点包括高效创作、多样化的应用场景支持、智能化的对话式创作模式以及可定制化的AI训练服务,旨在帮助企业提升营销效果和创新力。

ShowUI

ShowUI是一款由新加坡国立大学Show Lab与微软合作开发的视觉-语言-行动模型,旨在提升图形用户界面(GUI)助手的工作效率。该模型通过UI引导的视觉令牌选择、交错视觉-语言-行动流以及高质量数据集的运用,实现了高效的零样本截图定位和GUI自动化功能,广泛应用于网页自动化、移动应用测试、桌面软件自动化及游戏自动化等领域。

造作AI助手

造作AI助手是一款集成多种AI功能的创作工具,涵盖智能对话、文案生成、视频脚本创作等领域,适用于内容创作、营销策划及企业服务等多个场景。其核心功能包括文章生成、短视频文案编写、社交媒体内容创作等,为企业提供高效、智能化的解决方案。

bossjob

BossJob 是一款基于人工智能技术的全球化招聘平台,提供 AI 翻译和简历分析功能,助力跨国招聘和简历筛选。其核心功能包括多语言翻译、精准简历评估以及文化与技能匹配分析,帮助企业高效选拔优秀人才,同时为求职者提供职业发展建议。平台还计划扩展至 AI 模拟面试等功能,进一步优化招聘流程。

CodeSquire.ai

CodeSquire.ai是一款针对数据科学领域的AI编程助手,基于大型语言模型开发,支持代码自动补全、注释转代码、基于库构建函数及自然语言转SQL查询等功能,旨在提升开发者效率与代码质量。它适用于数据预处理、特征工程、模型训练与评估以及数据可视化等多个场景,可无缝嵌入Google Colab、BigQuery和JupyterLab等常用平台。

NVLM

NVLM是NVIDIA研发的多模态大型语言模型,涵盖图像理解、语言理解、跨模态融合、图像描述生成、视觉推理及多模态翻译等功能。它具备多种架构(NVLM-D、NVLM-X、NVLM-H),并采用动态高分辨率输入、1-D平铺标签设计及多模态预训练与微调技术,广泛应用于图像描述、视觉问答、文档理解、多模态搜索及辅助驾驶等领域。

Promptriever

Promptriever是一款基于自然语言处理的新型检索模型,融合了大型语言模型提示技术与信息检索优势。它通过双编码器架构及指令训练集优化,实现了对复杂查询的高度适应性与鲁棒性,适用于搜索引擎优化、智能助手、企业内部搜索及学术研究等多个领域。

翰林妙笔

翰林妙笔是一款利用先进AI技术打造的公文写作辅助工具,具备文本生成、润色、校对、风格调整等多种功能,支持用户快速生成高质量公文。该工具拥有丰富的模板和素材库,适合大学生、公务员、教师及社区工作者等群体使用,显著提高写作效率和文本质量。

LongLLaVA

LongLLaVA是由香港中文大学(深圳)研究团队开发的多模态大型语言模型,结合Mamba和Transformer模块,利用2D池化技术压缩图像token,大幅提升处理大规模图像数据的效率。该模型在视频理解、高分辨率图像分析及多模态代理任务中表现优异,特别擅长检索、计数和排序任务。其技术亮点包括渐进式训练策略和混合架构优化,支持多种多模态输入处理,广泛应用于视频分析、医学影像诊断、环境监测等领域。