選擇醫療保健和生命科學的 NLP 方法 - AWS 方案指引

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

選擇醫療保健和生命科學的 NLP 方法

醫療保健和生命科學的生成式 AI 和 NLP 方法 本節說明下列解決醫療保健和生命科學應用程式自然語言處理 (NLP) 任務的方法:

  • 使用 Amazon Comprehend Medical

  • 在擷取增強產生 (RAG) 工作流程中結合 Amazon Comprehend Medical 與 LLM

  • 使用微調的 LLM

  • 使用 RAG 工作流程

透過評估醫療網域任務的 LLMs 已知限制和您的使用案例,您可以選擇最適合您任務的方法。下列決策樹可協助您為醫療 NLP 任務選擇 LLM 方法:

選擇解決醫療網域 NLP 任務方法的決策樹。

該圖顯示以下工作流程:

  1. 對於醫療保健和生命科學使用案例,識別 NLP 任務是否需要特定領域知識。視需要與主題專家 (SMEs協調。

  2. 如果您可以使用一般 LLM 或已在醫療資料集上訓練的模型,則請在 Amazon Bedrock 或預先訓練的 LLM 中使用可用的基礎模型。如需詳細資訊,請參閱本指南中的 選擇 LLM

  3. 如果 Amazon Comprehend Medical 的實體偵測和本體連結功能處理您的使用案例,請使用 Amazon Comprehend Medical APIs。如需詳細資訊,請參閱本指南中的 使用 Amazon Comprehend Medical

  4. 有時候,Amazon Comprehend Medical 具有所需的內容,但不支援您的使用案例。例如,您可能需要不同的實體定義、接收大量結果、需要自訂實體或需要自訂 NLP 任務。如果是這種情況,請使用 RAG 方法來查詢 Amazon Comprehend Medical 的內容。如需詳細資訊,請參閱本指南中的 結合 Amazon Comprehend Medical 與大型語言模型

  5. 如果您有足夠數量的 Ground Truth 資料,請微調現有的 LLM。如需詳細資訊,請參閱本指南中的 自訂方法

  6. 如果其他方法不符合您的 NLP 任務目標,請實作 RAG 解決方案。如需詳細資訊,請參閱本指南中的 自訂方法

  7. 實作 RAG 解決方案後,請評估產生的回應是否正確。如需詳細資訊,請參閱本指南中的 評估醫療和生命科學應用程式的 LLMs 。通常從 Amazon Titan Text Embeddings 模型或一般句子轉換器模型開始,例如 all-MiniLM-L6-v2。不過,由於缺乏網域內容,這些模型可能無法擷取文字的醫療術語。如有必要,請考慮下列調整:

    1. 評估其他內嵌模型

    2. 使用特定網域的資料集微調內嵌模型

業務成熟度考量

在為醫療保健和生命科學應用程式調整 LLM 解決方案時,業務成熟度至關重要。這些組織在實作 LLMs 時,會面臨不同的複雜程度,取決於其接受條件。通常,缺乏 AI/ML 資源的組織投資於承包商支援,以建置 LLM 解決方案。在這些情況下,請務必了解下列權衡:

  • 高效能以實現高成本和維護 – 您可能需要複雜的解決方案,其中包含微調或自訂 LLMs以符合嚴格的效能標準。不過,這會產生更高的成本和維護需求。您可能需要僱用專業資源或與承包商合作,以維護這些複雜的解決方案。這可能會減慢開發速度。

  • 低成本和維護的良好效能 – 或者,您可能會發現 Amazon Bedrock 或 Amazon Comprehend Medical 等服務提供可接受的效能。雖然這些 LLMs或方法可能會提供完美的結果,但這些解決方案通常可以提供一致、高品質的結果。這些解決方案的成本較低,並降低維護負擔。這可以加速開發。

如果更簡單、成本較低的方法一致地交付符合您接受條件的高品質結果,請考慮提高的效能是否值得成本、維護和時間權衡。不過,如果較簡單的解決方案明顯缺乏目標效能,而且您的組織缺乏複雜解決方案及其維護需求的投資容量,請考慮延遲 AI/ML 開發,直到有更多資源或替代解決方案可用為止。

此外,對於依賴 LLM 的任何醫療 NLP 解決方案,我們建議您執行持續監控和評估。評估使用者隨時間的意見回饋,並實作定期評估,以確保解決方案持續滿足您的業務目標。