FAQs关于使用机器学习来预测新产品需求 - AWS 规范性指导

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

FAQs关于使用机器学习来预测新产品需求

以下是与实施机器学习模型相关的常见问题,该模型可以预测新产品推出需求。

我应该动员谁来启动这一进程?

一个组织的准备程度直接取决于你从高层管理层获得的支持程度。我们建议您获得数据科学或分析部门、供应链、营销和 IT 部门经理的批准。根据您的组织要求其他利益相关者和领导者提供支持。

我应该组建什么样的队伍?

要成功实施该计划并取得可衡量的成果,请组建一个包括以下内容的团队:

  • 用于模型开发的数据科学家

  • 负责数据收集和摄取的数据工程师

  • 机器学习工程师负责模型部署和自助服务仪表板

  • 提供领域专业知识的主题专家

我需要什么历史数据,需要多少历史数据?

考虑获取以下数据:

  • 所有类似产品的销售数据,从产品发布到停产。

  • 描述产品功能和属性的元数据。CE 产品的这些属性的示例包括蓝牙功能、无线功能、USB类型和颜色。

  • 与销售数据相关的时间序列数据,例如营销数据、假日数据、评论数据和评级数据。

    注意

    如果您可以将相关的时间序列数据扩展到预测范围以进行模型推断,那将是有益的。例如,如果相关的时间序列数据是假日,则可以将假日的时间序列数据扩展到将来,因为您事先知道假期。

我应该什么时候开始生成新产品的需求预测?

这是每个组织都需要做出的业务决策。理想情况下,组织应使用预测来满足对新产品的需求。建议您在开始生产新产品之前生成每周或每月的NPI需求预测。预测可帮助您正确估算零件和人工。

我应该收集哪些第三方数据?

您可以考虑添加以下第三方数据以获得更准确的预测:消费者指数、生活成本代理和竞争对手的销售历史记录。这些第三方数据将被视为相关的时间序列数据。可以考虑在与销售数据相同的时间段和相同的周期(例如每天或每周)获取这些数据。

我需要的最低基础架构是多少?

基础架构至少应支持以下内容:

  • 数据摄取管道,其中数据以批量或流式传输模式收集

  • 一种预处理ETL管道,用于提取原始数据并将其转换为用于机器学习建模的标准化输入格式

  • 用于模型开发、实验和验证的开发环境

  • 持续集成和持续部署 (CI/CD) 管道,可将 ML 模型推向生产环境

  • 模型注册、监控和再培训机制

  • 安全层,可对传输中的数据和静态数据进行加密,并提供精细的访问控制

如何验证我的数据驱动方法是否有效? 什么是 KPIs?

每项数据科学计划或数据驱动的解决方案都需要根据一组关键绩效指标进行验证(KPIs)。这些KPIs可以衡量模型的预测与实际需求的接近程度。您可以为不同的时间段生成此指标,例如未来 1 周或 1 个月的预测。您还可以根据模型生成的预测,直接测量有多少零件订购过多或订购不足。利益相关者和高层管理人员应精心制作一套跟踪模型绩效的工具。KPIs使用它们KPIs来确定ROI是否符合预期。

我应该多久生成一次预测?

预测频率取决于两个因素。您希望预测与可用时间序列数据集的联系有多紧密? 来自相关时间序列数据集的数据有多可变? 通常,经常生成预测可以帮助您的组织做好充分准备,以满足对新产品的需求。

如何启用自助服务?

随着容量的增长,组织应开发一个自助式基础架构,自动执行数据摄取、预处理和预测生成的模型训练管道。应衡量机器学习模型的结果和影响,并将其发布到仪表板以供按需访问。

AWS 定价是如何运作的?

有关更多信息,请参阅 AWS 定价