第2页_最新AI项目

TalkCody – 开源AI编程助手，即时体验最新模型

TalkCody 是开源的 AI 编程助手，帮助开发者更高效地构建软件。采用 Rust 和 Tauri 构建，具备原生性能和低资源占用的特点。TalkCody 支持多模型自由切换，涵盖 50 多种主流 AI 模型，如 OpenAI、Claude 和 Gemini 等，用户可即时体验最新模型。

AI项目

2025-12-03

Amazon Nova 2 – 亚马逊推出的第二代自研AI模型系列

Amazon Nova 2 是亚马逊云科技（AWS）推出的一系列先进AI模型，专为企业多样化需求设计。Amazon Nova 2 系列包含四款模型：Nova 2 Lite（成本优化的文本生成模型，支持文本、图像和视频处理）；Nova 2 Pro（高级推理模型，适用于复杂任务，如编程）；Nova 2 Sonic（语音到语音模型，用于对话式AI）。

AI项目

2025-12-03

MemMachine – 开源AI记忆系统，支持多种记忆类型

MemMachine是开源的AI记忆系统，专为AI Agent设计，提供短期、长期和个性化记忆功能。MemMachine通过情景记忆、语义记忆和用户画像记忆，帮助AI应用学习、存储和回忆过往会话数据，提升交互体验。

AI项目

2025-12-03

AnuNeko – AI聊天工具，体验人性化和情绪化对话体验

AnuNeko是米哈游创始人蔡浩宇的新公司Anuttacon推出的AI聊天工具。工具用独特的“猫娘”形象为特色，通过高度个性化和情绪化的对话体验，为用户带来与众不同的交流感受。

AI项目

2025-12-03

NEO – 商汤联合南洋理工开源的全新多模态模型架构

NEO是商汤科技与南洋理工大学合作研发的全新多模态模型架构，作为首个原生多模态架构（Native VLM），NEO通过底层架构的深度创新，打破了传统多模态模型的局限。核心创新包括原生图块嵌入（Native Patch Embedding），能更精细地捕捉图像细节；原生三维旋转位置编码（Native-RoPE），完美适配图像和文本的自然结构

AI项目

2025-12-03

Mistral 3 – Mistral AI推出的最新多模态大模型系列

Mistral 3 是 Mistral AI 推出的新一代开源 AI 模型系列，包括小型的 Ministral 3（3B、8B、14B 参数）和大型的 Mistral Large 3（675B 总参数，41B 激活参数）。

AI项目

2025-12-03

Alpamayo-R1 – 英伟达推出带推理的视觉-语言-动作模型

Alpamayo-R1（AR1）是英伟达推出的视觉-语言-动作（VLA）模型，通过因果推理提升自动驾驶的决策能力和泛化性。模型的核心创新包括：构建因果链（CoC）数据集，通过“人机协同+自动标注”生成高质量的推理轨迹

AI框架

2025-12-02

PixVerse V5.5 – 爱诗科技推出的视频生成大模型

PixVerse V5.5 是爱诗科技推出的视频生成大模型。模型通过自研的多模态理解和生成技术，支持音画同步生成，简化从构思到成片的复杂工作流程，提高创作效率。

AI项目

2025-12-02

可灵O1 – 可灵AI推出的首个统一多模态视频生成模型

可灵O1（可灵视频 O1 模型）是可灵AI推出的全球首个统一多模态视频生成模型。模型通过创新的多模态视觉语言（MVL）架构，实现视频生成、编辑与理解的无缝融合。

AI项目

2025-12-02

Gen-4.5 – RunWay推出的视频生成模型

Gen-4.5 是RunWay推出的视频生成模型，模型在视频生成的运动质量、视觉逼真度和提示词遵循度等方面树立新的行业标准。Gen-4.5 能生成电影级、极为逼真的画面，同时提供无限的创作自由和精确的控制能力。

AI项目

2025-12-02

Vidi2 – 字节跳动推出的多模态视频理解与生成模型

Vidi2是字节跳动推出的专注于视频理解和创作的多模态大语言模型。在多模态时间检索（TR）方面达到了行业领先水平，在时空定位（STG）和视频问答（Video QA）方面取得了显著进展。Vidi2能根据文本查询，不仅识别出视频中对应的时间戳，能标记出目标对象的边界框。

AI项目

2025-12-01

传声港 – 龙投文化推出的AI综合媒体服务平台

传声港是杭州龙投文化传媒有限公司旗下的AI驱动综合媒体服务平台，为企业提供一站式品牌传播与推广服务。平台整合了网络媒体、自媒体博主、网红达人等资源，涵盖媒体发稿、自媒体宣发、网红推广、文案创意和素人推广五大核心业务，满足企业从内容创作到效果监测的全方位需求。

AI项目

2025-12-01

谷歌发布的Nano Banana Pro专业生成10个技巧指南（中英版）

Google 推出的Nano Banana Pro指南，介绍了专业图像生成模型Nano Banana Pro的核心功能和应用技巧。文章重点强调模型在生成专业资产方面的突破，涵盖文本渲染、角色一致性、视觉合成、Google搜索联动、高级编辑、2D/3D转换、高分辨率输出等十大核心能力。

AI教程

2025-12-01

Temvideo.ai – AI视频制作Agent，专为跨境电商营销设计

Temvideo.ai 是面向商业用户的 AI 视频制作工具，通过智能算法帮助用户快速生成高质量的营销视频。用户只需提供想法和素材，AI 代理即可自动完成视频制作，包括脚本撰写、素材剪辑、配音添加等。支持多语言翻译，可将视频快速本地化，拓展全球市场。

AI项目

2025-12-01

GELab-Zero – 阶跃星辰开源的 GUI Agent 模型

GELab-Zero 是 StepFun 开发的开源 GUI Agent 模型，专注于移动设备的自动化交互和任务执行。具备本地可部署能力，支持在消费级硬件上运行 4B 模型，确保低延迟和隐私保护。GELab-Zero 提供一键多终端部署，自动处理环境依赖和设备管理，支持分布式任务编排和多模态 Agent 模式，能灵活处理复杂任务。

AI框架

2025-11-30

Ito – 开源的AI语音听写工具，口语意图可转为文本

Ito是开源的智能语音听写工具，通过其独特的“VibeTyping”技术，将用户的口语意图转换为精美文本。支持在邮件客户端、文档、聊天平台、浏览器和代码编辑器等各类应用程序中使用，提供可自定义的全局键盘快捷键和即时文本插入功能。

AI项目

2025-11-30

Talo – AI实时语音翻译工具，无缝集成多主流会议平台

Talo 是先进的AI实时语音翻译工具，专为打破语言障碍设计，广泛应用于视频会议场景。支持超过60种语言的即时翻译，能无缝集成到Google Meet、Microsoft Teams和Zoom等主流视频会议平台中。用户只需将会议链接粘贴到Talo界面并选择所需语言，即可开启翻译服务。

AI项目

2025-11-30

Spokenly – 本地AI语音听写工具，自动优化语法

Spokenly 是为 Mac 和 iPhone 设计的智能语音听写应用，支持超过100种语言，具备自动语言检测功能，适合多语言用户和国际团队。提供“本地优先”模式，所有语音数据仅在本地处理，确保隐私安全。Spokenly 支持实时转录，文字随说话实时显示，用户可根据需求选择从超快速到最高准确性的多种引擎。

AI项目

2025-11-29

讯飞输入法 – 科大讯飞推出的AI输入工具

讯飞输入法是科大讯飞推出的智能输入工具，具备高精度语音识别和多样化输入方式。支持语音、拼音、手写等多种输入模式，语音输入准确率高，支持多种方言和中英混合输入，方便不同用户群体使用。

AI项目

2025-11-28

闪电说 – AI语音输入工具，自动优化口语表达

闪电说是端侧优先的AI语音输入法，主打极速响应和高效输入。工具通过本地语音模型实现毫秒级识别，无需联网，响应时间仅约0.2秒，比传统键盘打字快4倍。

AI项目

2025-11-28

AI导航