AI项目

ReelFarm – 专注于TikTok的AI视频生成与自动化发布工具

ReelFarm 是专注于 TikTok 平台的 AI 视频生成与自动化发布工具。通过将文本提示转化为视频内容,支持多种视频格式,如幻灯片和“钩子+演示”格式,帮助用户快速生成吸引人的短视频。

MiMo-Embodied – 小米推出的跨领域具身大模型

MiMo-Embodied 是小米发布的全球首个开源的跨领域具身大模型,整合了自动驾驶和具身智能两大领域的任务,实现了在环境感知、任务规划、空间理解等多方面的卓越性能。模型基于视觉语言模型(VLM)架构,通过四阶段训练策略,包括具身智能监督微调、自动驾驶监督微调、链式推理微调和强化学习微调,显著提升了跨领域的泛化能力。

百度伐谋 – 百度推出的商用自进化超级智能体

百度伐谋是百度智能云推出的全球领先的可商用自我演化超级智能体,专为大型企业研发环节的智能原生和持续价值创造而设计。通过“生成-评估-迭代”的智能演化闭环,在组合优化、机器学习、性能优化等核心场景中,自动挖掘高性能算法方案

PinMe – 开源的静态网站部署工具,永久托管前端项目

PinMe 是开源的一键部署工具,能让静态网站或前端项目快速上线。工具用 IPFS 分布式存储和 ENS 域名,生成永久链接,无需服务器和 DNS。

Elser.AI – AI动漫创作平台,一键完成全流程创作

Elser.AI 是AI动漫创作的平台,通过先进的技术将用户的简单创意转化为高质量的动漫内容,涵盖漫画、视频和短剧等多种形式。用户只需提供故事梗概或创意,Elser.AI Agent能快速生成包含角色、场景、音乐和配音的完整作品。

HunyuanVideo 1.5 – 腾讯混元开源的轻量级视频生成模型

HunyuanVideo 1.5 是腾讯混元团队开源的轻量级视频生成模型,参数规模为8.3B。模型基于Diffusion Transformer架构,支持通过文字描述或图片生成5-10秒的高清视频,具备强大的指令理解能力,能精准实现多样化场景生成,包括写实、动画等多种风格。

Nano Banana Pro – 谷歌推出的最新图像生成与编辑模型

Nano Banana Pro (又名Gemini 3 Pro Image)是谷歌推出的新一代图像生成与编辑模型,结合了 Gemini 3 Pro 技术。模型能生成高质量、高分辨率(2K 和 4K)的图像,支持多种宽高比,适用从社交媒体到印刷的各种场景。

Creati Studio – AI视频广告生成平台,一键生成高转化广告

Creati Studio是AI驱动的视频广告生成平台,专注于帮助电商和内容创作者快速制作高质量短视频。提供多种模板和模型(如Veo 3.1),用户只需上传产品图片或URL,即可自动生成符合投放标准的广告素材。

Seekdb – OceanBase开源的首款AI原生混合搜索数据库

Seekdb是OceanBase开源的AI原生数据库,解决AI应用开发中多模态数据融合与实时处理的痛点。支持向量检索、全文搜索与结构化数据过滤的融合查询,一条SQL即可完成跨模态数据处理,如“近7天交易超5万元、位置异常且行为类似历史欺诈样本”的复杂查询,无需跨系统调用。

SAM 3 – Meta开源的视觉分割模型

SAM 3(Segment Anything Model 3)是 Meta AI 最新推出的先进计算机视觉模型,能通过文本、示例和视觉提示检测、分割和跟踪图像及视频中的对象。

Hyperknow – AI学习助手,自动整理生成复习材料

Hyperknow 是 AI 学习助手,专为学生打造。工具通过深度学习技术,将复杂知识拆解为简单易懂的内容,帮助学生高效吸收知识。Hyperknow 能精准解析各类学术问题,根据每个学生的学习习惯和进度,提供个性化的学习方案。

LoopTool – 上交大和小红书推出的自动化数据进化框架

LoopTool 是上海交通大学和小红书团队推出的自动化、模型感知、迭代式的数据进化框架,能提升大语言模型(LLM)在工具调用任务上的性能。框架通过闭环优化,将数据生成、标签修正与模型训练紧密结合,形成动态反馈机制。

SAM 3D – Meta开源的3D生成模型

SAM 3D 是 Meta 推出的先进 3D 重建模型,包含 SAM 3D Objects 和 SAM 3D Body 两个子模型。SAM 3D Objects 能从单张图像重建物体和场景的 3D 模型,支持多视角一致性和复杂遮挡处理;SAM 3D Body 专注于人体姿态、骨骼和网格的高精度恢复,适用虚拟人和动作捕捉等场景。

CubeOne – AI PPT生成工具,可代替用户进行演示

CubeOne 是创新的AI演示文稿生成工具,基于先进的人工智能技术,帮助用户快速创建高质量的演示文稿。用户只需上传文字、文件、视觉素材或截图,CubeOne AI 能根据这些内容生成精美且富有逻辑的幻灯片。

Argus 1.0 – 如视推出的全球首个空间大模型

Argus 1.0 是如视发布的全球首个支持全景图输入的空间大模型。基于如视积累的近百万套真实高清空间数据训练而成,采用 Transformer 架构,具备毫秒级实时重建能力,可从全景图或普通照片中快速推理出相机位姿、深度图和点图,生成高精度的三维空间模型。

Verdent AI – AI编程Agent工具,自动任务规划与分解

Verdent AI 是前 TikTok 算法负责人陈志杰和前百度技术与产品负责人刘小春创立的先进 AI 编程工具。通过多代理协作,将开发者的需求转化为可执行的计划,自动分解任务并并行执行,显著提升开发效率。

MemOS – 开源的AI记忆管理平台,支持多种记忆类型

MemOS 是开源的 AI 记忆管理操作系统,能为智能体和 AI 应用提供长期记忆能力。MemOS通过统一的记忆抽象层,支持多种记忆类型(如文本记忆、激活记忆、参数记忆),具备动态知识图谱、记忆调度和生命周期管理等功能。

Generative UI – 谷歌推出的生成式交互界面AI技术

Generative UI 是谷歌推出的创新 AI 技术,能让 AI 根据用户的自然语言提示即时生成完整的、可交互的用户界面。界面可以是网页、工具、游戏或教育应用,完全根据用户需求定制。

Gemini 3 – 谷歌推出的新一代多模态理解与推理AI模型

Gemini 3 是谷歌最新推出的AI模型,被誉为全球最先进的多模态理解与推理模型。模型具备强大的推理能力,刷新多项基准测试记录,如在 LMArena Leaderboard 上以 1501 Elo 高分登顶。

Skywork R1V4-Lite – 昆仑万维推出的轻量级多模态智能体

Skywork R1V4-Lite 是昆仑万维推出的轻量级多模态智能体。Skywork R1V4-Lite 集成视觉操作、深度推理与任务规划三大能力,能通过主动图像操作(如裁切、放大、旋转)和联网搜索增强,完成复杂任务。