本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
選擇醫療保健和生命科學的 NLP 方法
醫療保健和生命科學的生成式 AI 和 NLP 方法 本節說明下列解決醫療保健和生命科學應用程式自然語言處理 (NLP) 任務的方法:
-
使用 Amazon Comprehend Medical
-
在擷取增強產生 (RAG) 工作流程中結合 Amazon Comprehend Medical 與 LLM
-
使用微調的 LLM
-
使用 RAG 工作流程
透過評估醫療網域任務的 LLMs 已知限制和您的使用案例,您可以選擇最適合您任務的方法。下列決策樹可協助您為醫療 NLP 任務選擇 LLM 方法:

該圖顯示以下工作流程:
-
對於醫療保健和生命科學使用案例,識別 NLP 任務是否需要特定領域知識。視需要與主題專家 (SMEs協調。
-
如果您可以使用一般 LLM 或已在醫療資料集上訓練的模型,則請在 Amazon Bedrock 或預先訓練的 LLM 中使用可用的基礎模型。如需詳細資訊,請參閱本指南中的 選擇 LLM。
-
如果 Amazon Comprehend Medical 的實體偵測和本體連結功能處理您的使用案例,請使用 Amazon Comprehend Medical APIs。如需詳細資訊,請參閱本指南中的 使用 Amazon Comprehend Medical。
-
有時候,Amazon Comprehend Medical 具有所需的內容,但不支援您的使用案例。例如,您可能需要不同的實體定義、接收大量結果、需要自訂實體或需要自訂 NLP 任務。如果是這種情況,請使用 RAG 方法來查詢 Amazon Comprehend Medical 的內容。如需詳細資訊,請參閱本指南中的 結合 Amazon Comprehend Medical 與大型語言模型。
-
如果您有足夠數量的 Ground Truth 資料,請微調現有的 LLM。如需詳細資訊,請參閱本指南中的 自訂方法。
-
如果其他方法不符合您的 NLP 任務目標,請實作 RAG 解決方案。如需詳細資訊,請參閱本指南中的 自訂方法。
-
實作 RAG 解決方案後,請評估產生的回應是否正確。如需詳細資訊,請參閱本指南中的 評估醫療和生命科學應用程式的 LLMs 。通常從 Amazon Titan Text Embeddings 模型或一般句子轉換器模型開始,例如 all-MiniLM-L6-v2
。不過,由於缺乏網域內容,這些模型可能無法擷取文字的醫療術語。如有必要,請考慮下列調整: -
評估其他內嵌模型
-
使用特定網域的資料集微調內嵌模型
-
業務成熟度考量
在為醫療保健和生命科學應用程式調整 LLM 解決方案時,業務成熟度至關重要。這些組織在實作 LLMs 時,會面臨不同的複雜程度,取決於其接受條件。通常,缺乏 AI/ML 資源的組織投資於承包商支援,以建置 LLM 解決方案。在這些情況下,請務必了解下列權衡:
-
高效能以實現高成本和維護 – 您可能需要複雜的解決方案,其中包含微調或自訂 LLMs以符合嚴格的效能標準。不過,這會產生更高的成本和維護需求。您可能需要僱用專業資源或與承包商合作,以維護這些複雜的解決方案。這可能會減慢開發速度。
-
低成本和維護的良好效能 – 或者,您可能會發現 Amazon Bedrock 或 Amazon Comprehend Medical 等服務提供可接受的效能。雖然這些 LLMs或方法可能會提供完美的結果,但這些解決方案通常可以提供一致、高品質的結果。這些解決方案的成本較低,並降低維護負擔。這可以加速開發。
如果更簡單、成本較低的方法一致地交付符合您接受條件的高品質結果,請考慮提高的效能是否值得成本、維護和時間權衡。不過,如果較簡單的解決方案明顯缺乏目標效能,而且您的組織缺乏複雜解決方案及其維護需求的投資容量,請考慮延遲 AI/ML 開發,直到有更多資源或替代解決方案可用為止。
此外,對於依賴 LLM 的任何醫療 NLP 解決方案,我們建議您執行持續監控和評估。評估使用者隨時間的意見回饋,並實作定期評估,以確保解決方案持續滿足您的業務目標。