本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
为医疗保健和生命科学选择自然语言处理方法
本医疗保健和生命科学的生成式人工智能和自然语言处理方法节介绍解决医疗保健和生命科学应用的自然语言处理 (NLP) 任务的以下方法:
-
使用亚马逊 Comprehend Medical
-
在检索增强生成 (RAG) 工作流程中将 Amazon Comprehend Medical 与法学硕士学位相结合
-
使用经过微调的 LLM
-
使用 RAG 工作流程
通过评估医疗领域任务 LLMs 的已知局限性和您的用例,您可以选择哪种方法最适合您的任务。以下决策树可以帮助您为医疗自然语言处理任务选择法学硕士方法:

图表显示了以下工作流:
-
对于医疗保健和生命科学用例,请确定自然语言处理任务是否需要特定的领域知识。根据需要,与主题专家协调 (SMEs)。
-
如果您可以使用通用法学硕士学位或已在医学数据集上训练过的模型,请使用 Amazon Bedrock 中可用的基础模型或经过预训练的 LLM。有关更多信息,请参阅本指南中的选择法学硕士。
-
如果 Amazon Comprehend Medical 的实体检测和本体关联功能可以解决您的用例,请使用 Amazon Comprehend Medical。 APIs有关更多信息,请参阅本指南中的使用亚马逊 Comprehend Medical。
-
有时,Amazon Comprehend Medical 有所需的上下文,但不支持你的用例。例如,您可能需要不同的实体定义、接收大量结果、需要自定义实体或需要自定义 NLP 任务。如果是这样的话,请使用 RAG 方法向 Amazon Comprehend Medical 查询背景信息。有关更多信息,请参阅本指南中的将 Amazon Comprehend Medical 与大型语言模型相结合。
-
如果您有足够数量的地面实况数据,请对现有的 LLM 进行微调。有关更多信息,请参阅本指南中的定制方法。
-
如果其他方法不能满足你的 NLP 医疗任务目标,请实施 RAG 解决方案。有关更多信息,请参阅本指南中的定制方法。
-
实施 RAG 解决方案后,评估生成的响应是否准确。有关更多信息,请参阅本指南中的评估 LLMs 医疗保健和生命科学应用。通常从 Amazon Titan 文本嵌入模型或通用句子转换器模型(例如 All-minilm-L6-v2)开始。
但是,由于缺乏领域背景,这些模型可能无法捕捉文本中的医学术语。如有必要,请考虑进行以下调整: -
评估其他嵌入模型
-
使用特定领域的数据集微调嵌入模型
-
业务成熟度注意事项
在为医疗保健和生命科学应用调整法学硕士解决方案时,业务成熟度至关重要。这些组织在实施时面临不同程度的复杂性 LLMs,具体取决于其接受标准。通常,缺乏 AI/ML 资源的组织会投资承包商支持来构建 LLM 解决方案。在这些情况下,了解以下权衡非常重要:
-
高性能,成本高,维护成本高 — 您可能需要复杂的解决方案,包括微调或定制, LLMs 以满足严格的性能标准。但是,这会带来更高的成本和维护要求。您可能需要雇用专业资源或与承包商合作来维护这些复杂的解决方案。这可能会减慢开发速度。
-
性能良好,成本低,维护成本低 — 或者,您可能会发现诸如Amazon Bedrock或Amazon Comprehend Medical之类的服务提供了可接受的性能。尽管这些 LLMs 或方法可能提供完美的结果,但这些解决方案通常可以提供一致、高质量的结果。这些解决方案降低了成本,减少了维护负担。这可以加速开发。
如果更简单、成本更低的方法可以持续提供符合验收标准的高质量结果,请考虑提高性能是否值得在成本、维护和时间上进行权衡。但是,如果更简单的解决方案远未达到目标性能,并且您的组织缺乏复杂解决方案及其维护要求的投资能力,则可以考虑将人工智能/机器学习的开发推迟到有更多资源或替代解决方案可用之前。
此外,对于任何依赖法学硕士学位的医疗自然语言处理解决方案,我们建议您进行持续的监测和评估。评估用户在一段时间内的反馈,并定期进行评估,以确保解决方案继续满足您的业务目标。