StepAudio R1 – 阶跃星辰开源的原生音频推理模型
StepAudio R1 是阶跃星辰团队推出的全球首个开源原生音频推理模型。模型通过创新的模态锚定推理蒸馏(MGRD)框架,解决了传统音频模型在复杂推理中性能下降的问题,真正实现基于声学特征的深度推理。
FLUX.2 Prompting – Black Forest Labs推出的FLUX.2使用指南(中英版)
FLUX.2提示词指南是Black Forest Labs官方推出的FLUX.2使用指南,主要介绍如何通过结构化的JSON提示、精确的十六进制颜色控制及多参考图像编辑技术生成高质量的图像和设计。
如何免费领1个月Gemini Enterprise商业版会员,附教程
今天又可以薅羊毛啦,白嫖一个月 Google Gemini 会员,可以免费使用 Gemini 3 Pro、Nano Banana Pro、Veo 3、Deep Research...重点是,无需绑卡,登录就能领!下面是详细领取步骤。Gemini Enterprise 是 Gemini 的商务版,非常适合小型企业或团队。
DeepSeek-Math-V2 – DeepSeek开源的数学推理模型
DeepSeek-Math-V2 是 DeepSeek 团队推出的开源数学推理模型,能实现自我验证的数学推理。模型关注答案正确性,注重推理过程的严谨性。
Uigenius – Uigenius.top推出的AI辅助UI/UX设计工具
Uigenius是Uigenius.top推出的AI辅助UI/UX设计工具,专为设计师、产品经理及需要界面设计的人群打造。通过AI技术,将用户输入的文字描述快速转化为高保真原型,能一键导出HTML、Vue、React等前端代码,实现设计与开发的无缝衔接。
Depth Anything 3 – 字节跳动推出的视觉空间重建模型
Depth Anything 3(DA3)是字节跳动Seed团队推出的视觉空间重建模型,通过单一Transformer架构实现从任意视角的视觉输入中恢复三维空间几何结构。
Z-Image – 阿里通义推出的图像生成模型
Z-Image 是阿里通义推出的图像生成模型,具有6B参数。模型包含三个变体:Z-Image-Turbo、Z-Image-Base 和 Z-Image-Edit,分别擅长快速推理、基础开发和图像编辑。
GHOST – AI原生PPT生成工具,自动生成内容和结构
GHOST 是创新AI 原生幻灯片编辑工具,专为追求高效和简洁的用户设计。工具借助先进的 AI 技术,能迅速将用户的创意转化为完整的演示文稿,极大地缩短制作时间。
小凹语音输入法 – 智谱推出的AI语音输入工具
小凹语音输入法(AutoTyper)是智谱推出的智能AI语音输入工具,通过语音输入即可高效创作,告别繁琐打字。支持多种风格表达,可任意DIY添加风格,适用于多种场景。
Dealism – AI对话式销售Agent,自动学习优化销售技巧
Dealism 是创新的 AI 销售代理工具,专注于通过“氛围销售(Vibe Selling)”帮助企业提升销售效率和客户体验。通过分析企业的知识库、聊天记录和产品信息,学习并模仿企业独特的沟通风格,提供高度个性化的客户互动。
Supermemory – AI长期记忆提供平台,具备图结构记忆
Supermemory 是为 AI 应用提供长期记忆能力的平台。平台通过 API 为开发者提供从数据抽取、切块、嵌入、索引到检索的全管线服务,具备图结构记忆和用户画像演化能力。
Factory – AI原生软件开发平台,无缝集成多种开发环境
Factory是AI原生软件开发平台,通过智能代理(Droids)与开发者的现有工作流程深度融合,在IDE、终端和CI/CD环境中,都能无缝协助完成复杂的开发任务。平台打破了传统开发的限制,让开发者无需改变习惯借助AI的力量提升效率和质量。
FLUX.2 – Black Forest Labs开源的AI图像生成与编辑模型
FLUX.2 是 Black Forest Labs 推出的视觉智能模型,专为实际创意工作流程设计。模型支持最多 10 张图片的多图参考,生成高达 4MP 分辨率的高质量图像,具备极强的细节表现力和文本渲染能力。
ViMax – 港大开源的多智能体视频生成框架
ViMax 是香港大学数据科学实验室推出的端到端多智能体视频生成框架,支持将创意、剧本或小说自动转化为完整视频。框架整合导演、编剧、制片人和视频生成器的功能,支持 Idea2Video、Novel2Video、Script2Video 和 AutoCameo 等模式,能生成分钟级长视频并保持人物与场景一致性。
Brix – AI招聘与管理平台,人才搜索到管理一站式全流程
Brix 是AI原生全球招聘与组织管理平台,专注于通过 AI 技术革新传统招聘流程。平台拥有超过 9.6 亿的全球人才库,覆盖 200 多个国家,能实现从人才搜索、自动化触达、面试管理到入职和绩效评估的全流程自动化。
HunyuanOCR – 腾讯混元推出的端到端OCR视觉语言模型
HunyuanOCR 是腾讯混元团队推出的开源的端到端OCR视觉语言模型。依托混元原生多模态架构,仅用1B参数就实现了多项OCR任务的SOTA性能。具备高效轻量的架构,单指令单推理即可输出最优结果,相比传统级联方案更便捷高效。
Tbox AI 浏览器 – 为内容创作和知识管理设计的AI浏览器
Tbox AI 浏览器是为创作者和知识工作者设计的智能浏览器。Tbox AI 浏览器以 AI 技术为核心,将内容创作与知识管理深度融合,通过智能辅助功能,帮助用户高效生成和发布小红书等平台的优质内容,同时将日常积累转化为创作灵感。
VisualGPT – 免费AI图像生成与编辑平台,自动选择模型
VisualGPT 是强大的免费AI图像生成与编辑平台。通过融合多种先进图像模型,如Stable Diffusion等,让用户能通过文本提示或上传图像,快速生成和编辑高质量图片。功能丰富,包括背景移除、图像增强、室内设计等专业功能,可满足从初学者到专业人士的多种需求。
Toolhouse – AI Agent开发与管理平台,一键部署生产环境
Toolhouse是专注于智能体(Agent)开发和管理的低代码AI工具平台,帮助用户轻松创建和部署 AI 应用程序,降低智能体开发门槛,简化复杂的技术流程。提供了一套集成化的工具链,帮助用户快速创建、部署和管理智能体,适用于需要自动化任务处理、智能决策等场景的企业和个人开发者。
Fara-7B – 微软开源的小型计算机Agentic模型
Fara-7B 是微软开源的专注于计算机使用的代理型小语言模型(SLM)。模型通过视觉感知网页,操作鼠标、键盘等界面元素来帮助用户完成任务,如填写表单、搜索信息或预订行程。
粤公网安备 123456789号