AWS Analytics category icon 分析 - Amazon Web Services 概述

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

AWS Analytics category icon 分析

AWS 提供一套全面的分析服務,以滿足您的所有資料分析需求,並使各種規模和產業的組織能夠利用資料重塑業務。從儲存和管理、資料控管、動作和體驗, AWS 提供專門打造的服務,提供最佳的性價比、可擴充性和最低成本。

每個服務在圖表之後進行描述。若要協助您決定哪種服務最符合您的需求,請參閱「選擇服務」 AWS 分析服務。有關一般信息,請參閱上的分析 AWS.

圖表, 顯示 AWS 分析服務

返回AWS 服務

Amazon Athena

Amazon Athena 是一種互動式查詢服務,可讓您輕鬆地使用標準分析 Amazon S3 中的資料SQL。Athena 無伺服器,所以不需管理基礎設施,而且您只需支付所執行查詢的費用。

Athena 很容易使用。只要指向 Amazon S3 中的資料、取消設定結構描述,然後使用標準開始查詢即可。SQL大多數結果都會在幾秒鐘內交付。有了 Athena,就不需要進行複雜的擷取、轉換和載入 (ETL) 工作來準備資料以進行分析。如此一來,任何具備SQL技能的人都能輕鬆快速分析大規模資料集。

Athena out-of-the-box 集成 AWS Glue Data Catalog,可讓您跨各種服務建立統一的中繼資料儲存庫、編目資料來源以探索結構描述,並使用新的和修改的資料表和分割區定義填入您的 Catalog,以及維護結構描述版本控制。

Amazon CloudSearch

Amazon CloudSearch 是一個託管服務 AWS 雲端 這使得為您的網站或應用程序設置,管理和擴展搜索解決方案變得簡單且具有成本效益。Amazon CloudSearch 支援 34 種語言和熱門搜尋功能,例如反白顯示、自動完成和地理空間搜尋。

Amazon DataZone

Amazon DataZone 是一種資料管理服務,可用於發佈資料,並透過個人化 Web 應用程式將其提供給業務資料目錄。無論資料儲存在何處,您都可以更安全地存取資料 AWS,在內部部署或 SaaS 應用程式 (例如 Salesforce) 中。Amazon DataZone 簡化了您的體驗 AWS 服務,如 Amazon Redshift,Amazon Athena, AWS Glue, AWS Lake Formation和 Amazon QuickSight。

Amazon EMR

Amazon EMR 是業界領先的雲大數據平台,用於使用開源工具,如阿帕奇星火,阿帕奇蜂巢,阿帕奇Flink,阿帕FlinkHBase,帕奇胡迪和普雷斯托處理大量數據。Amazon EMR 透過自動化耗時的任務 (例如佈建容量和調整叢集),讓您輕鬆設定、操作和擴展大數據環境。使用 AmazonEMR,您可以以不到傳統現場部署解決方案的一半成本執行 PB 規模分析,而且比標準 Apache Spark 快 3 倍以上。您可以在 Amazon 執行EC2個體、亞馬 Amazon Elastic Kubernetes Service (AmazonEKS) 叢集上執行工作負載,或使用 Amazon 的現場部署執行工作 EMR AWS Outposts.

Amazon FinSpace

Amazon FinSpace是專為金融服務業打造的資料管理和分析服務 () FSI。 FinSpace 將您尋找和準備數 PB 的財務資料準備好進行分析所花費的時間,從數月縮短為數分鐘。

金融服務組織會分析來自內部資料存放區 (例如投資組合、精算和風險管理系統) 的資料,以及來自第三方資料饋送的 PB 級資料,例如證券交易所的歷史證券價格。可能需要數月的時間才能找到正確的資料、取得以合規方式存取資料的權限,以及準備進行分析。

FinSpace 消除了建立和維護用於財務分析的數據管理系統的繁重工作。使用時 FinSpace,您可以收集資料並依相關業務概念 (例如資產類別、風險分類或地理區域) 對其進行分類。 FinSpace 根據您的合規要求,可讓您輕鬆探索和共用整個組織中的資料。您可以在一個位置定義資料存取政策,並 FinSpace 強制執行這些原則,同時保留稽核記錄,以便進行合規性和活動報告。 FinSpace 還包括 100 多種功能庫,例如時間條和布林帶,供您準備數據以進行分析。

Amazon Kinesis

Amazon Kinesis 可讓您輕鬆收集、處理和分析即時串流資料,因此您可以及時取得見解並快速回應新資訊。Amazon Kinesis 提供關鍵功能,能以符合成本效益的方式處理任何規模的串流資料,並可彈性選擇最符合您應用程式需求的工具。使用 Amazon Kinesis,您可以擷取視訊、音訊、應用程式日誌、網站點擊流和 IoT 遙測資料等即時資料,以用於機器學習 (ML)、分析和其他應用程式。Amazon Kinesis 可讓您在資料到達時處理和分析資料並立即回應,而不必等到所有資料都收集完畢後才能開始處理。

Amazon Kinesis 目前提供四種服務:Firehose、Apache Flink 的受管服務、Kinesis Data Streams 和 Kinesis Video Streams。

Amazon 數據 Firehose

Amazon Data Firehose 是可靠地將串流資料載入資料存放區和分析工具的最簡單方法。它可以擷取、轉換串流資料並將其載入 Amazon S3、Amazon Redshift、Amazon OpenSearch 服務和 Splunk,並使用您目前已經使用的現有商業智慧工具和儀表板啟用近乎即時的分析。這是一項完全受控的服務,可自動擴展以符合資料的輸送量,而且不需要持續的管理。它還可以在加載數據之前對其進行批處理,壓縮,轉換和加密數據,從而最大程度地減少在目的地使用的存儲量並提高安全性。

您可以 Firehose 鬆地從 AWS Management Console,只需按幾下滑鼠即可進行設定,然後開始將資料從數十萬個要連續載入的資料來源傳送至串流 AWS— 所有這些都在短短幾分鐘內完成。您也可以設定交付串流,在資料傳送至 Amazon S3 之前ORC,自動將傳入資料轉換為單欄格式 (例如 Apache Parquet 和 Apache),以便進行符合成本效益的儲存和分析。

Amazon Managed Service for Apache Flink

適用於 Apache Flink 的 Amazon 受管服務是分析串流資料、取得可行的深入解析,以及即時回應業務和客戶需求的最簡單方法。適用於 Apache Flink 的 Amazon 受管服務可降低建置、管理串流應用程式並與其他應用程式整合的複雜性 AWS 服務。SQL使用者可以使用範本和互動式SQL編輯器,輕鬆查詢串流資料或建置整個串流應用程式。Java 開發人員可以使用開源 Java 庫和快速構建複雜的流應用程序 AWS 可即時轉換和分析資料的整合。

適用於 Apache Flink 的 Amazon 受管服務會處理持續執行查詢所需的一切,並自動擴展以符合傳入資料的數量和輸送率。

Amazon Kinesis Data Streams

Amazon Kinesis Data Streams 是可大規模擴展且耐用的即時資料串流服務。Kinesis Data Streams 可以從數十萬個來源持續擷取每秒 GB 的資料,例如網站點擊流、資料庫事件串流、金融交易、社交媒體摘要、IT 記錄和位置追蹤事件。收集到的資料可在幾毫秒內取得,以啟用即時儀表板、即時異常偵測、動態定價等即時分析使用案例。

Amazon Kinesis Video Streams

Amazon Kinesis Video Streams 可讓您輕鬆安全地將視訊從連線裝置串流到 AWS 用於分析、ML、播放和其他處理。Kinesis Video Streams 會自動佈建和彈性調整所有需要的基礎架構,以便從數百萬個裝置擷取串流影片資料。它還可以持久地存儲,加密和索引流中的視頻數據,並允許您通過訪問數據。 easy-to-use APIsKinesis Video Streams 可讓您播放視訊以進行即時和隨選檢視,並透過與 Amazon Rekognition 視訊整合,以及適用於機器學習架構 (例如 Apache MxNet 和 OpenCV) 的程式庫,快速建置充分利用電腦視覺和視訊分析的應用程式。 TensorFlow

Amazon OpenSearch 服務

Amazon OpenSearch 服務 (OpenSearch 服務) 可讓您輕鬆部署、保護、操作和擴展, OpenSearch 以便即時搜尋、分析和視覺化資料。透過 Amazon Ser OpenSearch vice,您可以取得 easy-to-use APIs即時分析功能,以提供企業級可用性、可擴展性和安全性等使用案例,例如日誌分析、全文檢索搜尋、應用程式監控和點擊流分析。此服務提供與開放原始碼工具 (例如 OpenSearch 儀表板和 Logstash) 的整合,以進行資料擷取和視覺化。它還與其他無縫集成 AWS Amazon Virtual Private Cloud(AmazonVPC)等服務,AWS Key Management Service (AWS KMS),Amazon 數據 FirehoseAWS Lambda, AWS Identity and Access Management (IAM)Amazon CognitoAmazon CloudWatch,這樣您就可以快速地從原始數據轉變為可操作的見解。

Amazon OpenSearch 無服務器

Amazon OpenSearch 無服務器是 Amazon OpenSearch 服務中的無服務器選項。身為開發人員,您可以使用 OpenSearch 無伺服器執行 PB 級工作負載,而無需設定、管理和調整叢集。 OpenSearch 您可以獲得與 Service 相同的互動式毫秒回應時間,而且無伺 OpenSearch 服器環境的簡易性。

Amazon OpenSearch Serverless 的向量引擎新增了簡單、可擴展且高效能的向量儲存和搜尋功能,可協助開發人員建立 ML 增強型搜尋體驗和生成 AI 應用程式,而無需管理向量資料庫基礎設施。向量搜尋集合的使用案例包括影像搜尋、文件搜尋、音樂擷取、產品推薦、影片搜尋、位置型搜尋、詐騙偵測和異常偵測。

Amazon Redshift

Amazon Redshift 是使用最廣泛的雲數據倉庫。它使用標準和現有的商業智能(BI)工具來快速,簡單SQL且經濟高效地分析所有數據。它可讓您使用複雜的查詢最佳化、高效能儲存體上的單欄式儲存,以及大規模 parallel 查詢完成,針對 TB 至 PB 的結構化和半結構化資料執行複雜的分析查詢。大多數結果會在幾秒鐘內回來。您可以從小規模開始,每小時僅需 0.25 USD,無需承諾,並以每年每 TB 1,000 美元的價格向外擴充為 PB 的資料,不到傳統內部部署解決方案的十分之一。

Amazon Redshift Serverless

Amazon Redshift 無伺服器可讓您更輕鬆地執行和擴展分析,而無需管理資料倉儲基礎設施。開發人員、資料科學家和分析師可以跨資料庫、資料倉儲和資料湖進行工作,以建置報告和儀表板應用程式、執行近乎即時的分析、共用和共同作業資料,以及建置和訓練機器學習 (ML) 模型。在幾秒鐘內從大量資料轉換成深入解析。Amazon Redshift 無伺服器會自動佈建並智慧地擴展資料倉儲容量,即使是最苛刻且無法預測的工作負載也能提供快速效能,而且您只需按使用量付費。只要在 Amazon Redshift 查詢編輯器或您最愛的商業智慧 (BI) 工具中載入資料並立即開始查詢 easy-to-use,即可在零管理環境中繼續享受最佳的價格效能和熟悉的SQL功能。

Amazon QuickSight

Amazon QuickSight 是一種快速、雲端支援的商業智慧 (BI) 服務,可讓您輕鬆向組織中的每個人提供見解。 QuickSight 可讓您建立和發佈可從瀏覽器或行動裝置存取的互動式儀表板。您可以將儀表板嵌入到應用程式中,為客戶提供強大的自助服務分析。Amazon 可 QuickSight 輕鬆擴展到數萬名使用者,無需安裝任何軟體、要部署的伺服器或管理基礎設施。

AWS Clean Rooms

AWS Clean Rooms協助公司及其合作夥伴更輕鬆、安全地分析及協同合作其集體資料集,而無需共用或複製彼此的基礎資料。同 AWS Clean Rooms,客戶可以在幾分鐘內創建一個安全的數據清潔室,並與任何其他公司合作 AWS 雲端 生成有關廣告活動,投資決策以及研究和開發的獨特見解。

AWS Data Exchange

AWS Data Exchange可讓您輕鬆在雲端中尋找、訂閱和使用第三方資料。合格的資料提供者包括各類領先的品牌,例如路透社,他們每年以超過 220 萬種語言策劃資料;Change Healthcare,每年處理和匿名超過 140 億美元的醫療保健交易和 1 萬億美元的索賠;Dun & Bradstreet 擁有超過 3 億 3 億全球商業記錄的資料庫;以及 Foursquare,其位置資料來自 2.2 億美元的全球獨特消費者和超過 6000 萬個商業場所。

一旦訂閱了數據產品,您就可以使用 AWS Data Exchange API將資料直接載入 Amazon S3,然後使用各種各樣的方式進行分析 AWS 分析ML 服務。例如,房地產保險公司可以訂閱數據以分析歷史天氣模式,以校準不同地區的保險覆蓋要求;餐廳可以訂閱人口和位置數據以確定最佳擴張地區;學術研究人員可以通過訂閱有關二氧化碳排放的數據進行氣候變化研究;醫療保健專業人員可以訂閱歷史臨床試驗的匯總數據,以加快其研究活動。

對於數據提供商, AWS Data Exchange 可以很容易地達到數百萬 AWS 客戶無需為資料儲存、交付、計費和授權建置和維護基礎架構而移轉至雲端。

AWS Data Pipeline

AWS Data Pipeline是一種 Web 服務,可以幫助您可靠地處理和在不同之間移動數據 AWS 運算和儲存服務,以及內部部署資料來源,以特定的時間間隔。同 AWS Data Pipeline,您可以定期存取儲存資料、大規模轉換和處理資料,並將結果直接傳輸到 Amazon S3、Amazon、亞馬 AmazonDynamoDB 和 Amazon RDS 等AWS服務。EMR

AWS Data Pipeline 協助您輕鬆建立具備容錯能力、可重複且高可用性的複雜資料處理工作負載。您不必擔心確保資源可用性、管理工作間相依性、在個別工作中重試暫時性失敗或逾時,或是建立失敗通知系統。 AWS Data Pipeline 也可讓您移動和處理先前鎖定在內部部署資料孤島中的資料。

AWS 實體解析度

AWS Entity Resolutions 是一項服務,可協助您比對並連結儲存在多個應用程式、通道和資料存放區中的相關記錄,而無需建立自訂解決方案。使用靈活,可配置的 ML 和基於規則的技術, AWS Entity Resolutions 可以移除重複的記錄、透過連結不同的客戶互動來建立客戶個人檔案,以及跨廣告和行銷活動、忠誠度計劃和電子商務個人化體驗 例如,您可以將最近的事件(例如廣告點擊次數、購物車放棄和購買)連結至唯一的比對 ID,以建立客戶互動的統一檢視。

AWS Glue

AWS Glue是完全受管的擷取、轉換和 load (ETL) 服務,可讓客戶輕鬆準備和載入其資料以進行分析。您可以建立並執行ETL工作,只要在 AWS Management Console。 你只要點 AWS Glue 存儲在您的數據 AWS和 AWS Glue 探索您的資料,並將相關的中繼資料 (例如資料表定義和結構定義) 儲存在 AWS Glue Data Catalog。 編目後,您的資料便可立即搜尋、可查詢且可供使用。ETL

AWS Glue 數據集成引擎提供訪問數據使用阿帕奇星火 PySpark,和 Python。隨著添加 AWS Glue 對於 Ray,您可以使用開放原始碼統一運算架構 Ray 來進一步擴展工作負載。

AWS Glue 資料品質可以測量和監控 Amazon S3 資料湖、資料倉儲和其他資料儲存庫的資料品質。它會自動計算統計資料、建議品質規則,並可在偵測到遺失、過時或不良資料時監控並提醒您。您可以在 AWS Glue Data Catalog 並在 AWS Glue Data Catalog ETL工作。

AWS Lake Formation

AWS Lake Formation是一項可讓您在數天內輕鬆設定安全資料湖的服務。資料湖是一個集中式、經策管且安全的儲存庫,可用原始格式存放您的所有資料並準備進行分析。資料湖可讓您細分資料孤島,再結合不同類型的分析來取得洞察並指導得出更佳的商業決策。

不過,如今設定和管理資料湖需要許多手動、複雜且耗時的工作。這項工作包括從不同來源載入資料、監控這些資料流程、設定分割區、開啟加密和管理金鑰、定義轉換工作和監控其作業、將資料重組為單欄格式、設定存取控制設定、刪除重複多餘資料、比對連結記錄、授予資料集存取權限,以及隨時間稽核存取權限。

使用 Lake Formation 建立資料湖就像定義資料所在位置以及要套用的資料存取和安全性原則一樣簡單。Lake Formation 接著從資料庫和物件儲存收集資料並進行分類、將資料移至新的 Amazon S3 資料湖、使用 ML 演算法清理和分類資料,以及保護敏感資料的存取。然後,您的使用者可以存取集中式資料目錄,其中描述可用的資料集及其適當用法。然後,您的使用者可以利用這些資料集搭配他們選擇的分析和機器學習服務,例如 Amazon EMR 的 Apache Spark、Amazon Redshift SageMaker、Amazon Athena 和 Amazon QuickSight。

Amazon Managed Streaming for Apache Kafka(Amazon)MSK

適用 Managed Streaming for Apache Kafka (AmazonMSK) 是一項全受管服務,可讓您輕鬆建置和執行使用 Apache Kafka 處理串流資料的應用程式。Apache Kafka 是一個開放原始碼的平台,用於建立即時串流資料管線和應用程式。透過 AmazonMSK,您可以使用 Apache Kafka APIs 填入資料湖、串流資料庫之間的變更,以及為機器學習和分析應用程式提供支援。

Apache Kafka 叢集在生產環境中難以設定、擴展和管理。當您自行執行 Apache Kafka 時,您需要佈建伺服器、手動設定 Apache Kafka、在伺服器失敗時更換伺服器、協調伺服器修補程式和升級、架構叢集的高可用性、確保資料持久儲存和保護、設定監控和警示,以及仔細規劃調整事件以支援負載變更。Amazon 可MSK讓您輕鬆地在 Apache Kafka 上建置和執行生產應用程式,而無需 Apache Kafka 基礎設施管理專業知識。這意味著您花費更少的時間管理基礎結構,並有更多時間構建應用

只要在 Amazon MSK 主控台按幾下滑鼠,就能建立具有以 Apache Kafka 部署最佳實務為基礎的設定和組態的高可用性 Apache Kafka 叢集。Amazon MSK 會自動佈建和運行您的 Apache 卡夫卡群集。Amazon 會MSK持續監控叢集運作狀態,並自動替換運作狀態不良的節點,而不會停機應用程式 此外,Amazon 還通過加密靜態數據來MSK保護您的 Apache 卡夫卡集群的安全。

返回AWS 服務