AI项目与工具

Video Ocean

Video Ocean是一款基于AI技术的视频生成平台,主要功能包括文生视频、图生视频及角色生视频。它允许用户通过文本、图片或自定义角色生成高质量的视频内容,适用于多种应用场景如社交媒体营销、教育培训、影视制作等。此外,Video Ocean还注重提升视频的质量与细节,确保最终效果既美观又实用。

BoldVoice

BoldVoice 是一款专注于英语发音训练的工具,结合专业口音课程与AI语音分析技术,帮助非英语母语者提升发音准确性和口语自信。用户可通过录音获得实时反馈与改进建议,并根据个人母语背景定制学习计划。应用还提供发音测试、口音对比和多场景练习功能,适用于职场、考试、日常交流及表演等领域,有效提升英语口语能力。

OmniThink

OmniThink是由浙江大学与阿里巴巴通义实验室联合开发的机器写作框架,通过模拟人类学习和反思机制,提升文章的知识密度与深度。支持多种语言模型,具备信息树与概念池结构化管理功能,适用于学术写作、新闻报道、教育内容创作等多个领域,有效提高生成内容的质量与多样性。

SmolVLA

SmolVLA是Hugging Face开源的轻量级视觉-语言-行动(VLA)模型,专为经济高效的机器人设计。拥有4.5亿参数,可在CPU上运行,单个消费级GPU即可训练,适合在MacBook上部署。它能够处理多模态输入,生成动作序列,并通过异步推理提高控制效率。适用于物体抓取、家务劳动、货物搬运和机器人教育等场景。

10个降AI率、降AIGC率的网站和工具,论文写作必备

本文介绍了10款用于降低AIGC痕迹的AI写作工具,涵盖论文优化、降重、查重等功能。这些工具通过智能算法识别并优化AI生成内容,使其更接近人类写作风格,有效降低在知网、维普等平台的检测风险,提升论文原创性与通过率。

WhisperChain

WhisperChain 是一款开源语音识别工具,支持实时语音转文本并提供文本优化功能,可去除填充词、优化语法。用户可通过全局热键快速启动语音输入,处理结果自动复制到剪贴板。支持 Streamlit 界面与 FastAPI 架构,适用于会议记录、写作辅助等场景。

Titans

Titans是谷歌推出的新型神经网络架构,突破了传统Transformer在处理长序列数据时的限制。其核心是神经长期记忆模块,可模拟人脑记忆机制,提升对关键信息的存储与提取能力。Titans支持多种任务,包括语言建模、常识推理和时间序列预测,尤其在处理超长上下文时表现优异。该架构具备并行计算能力,提高了训练效率,适用于文本生成、生物信息学、视频音乐处理等多个领域。

ARCHITEChTURES

ARCHITEChTURES是一个基于AI的建筑设计平台,专注于自动化处理建筑设计中的重复性任务,如建模、测量和计算,以提高设计效率和质量。它支持多户型住宅建筑设计,提供CAD和BIM绘图功能,并具备测量、预算以及快速设计与共享能力。此外,平台还支持多种应用场景,包括可行性研究、场地规划、商业评估和概念迭代等。

乐拍

乐拍是一款基于AI技术的写真相机应用,提供多样化的风格模板,包括证件照、古风、现代风等,并支持视频换装和图片动态化功能。用户可通过一键操作生成高质量写真,同时体验AI健身、染发、动漫化等创意玩法,适用于个人写真、证件照制作、社交媒体内容创作及时尚搭配试衣等场景。

VITRON

VITRON是一款由多家顶尖机构联合研发的像素级视觉大型语言模型,具备强大的图像与视频处理能力,涵盖理解、生成、分割及编辑等功能。它融合了编码器-LLM-解码器架构、视觉-语言编码和视觉专家系统,支持多种视觉任务,广泛应用于图像编辑、视频创作、教育辅助、电商营销和新闻报道等领域。