SQL Server 2012 產品介紹
Analysis Services - Data Mining

當您在 Analysis Services 中開發資料採礦方案時,您首先會建立一個 Analysis Services 專案。在此專案中,您會定義將用於分析之資料的來源,然後設定一個包含演算法和自訂指示的模型來處理資料。您也可以在專案中繼續測試並精簡模型。當您對方案滿意之後,可以將其部署到其他伺服器,或在應用程式中使用該方案以提供預測與分析。

詳細資料

建立 Analysis Services 專案

當您開發資料採礦方案時,必須使用 Business Intelligence Development Studio,先建立一個新的 Analysis Services 專案。每個資料採礦專案都包含下列四種物件:資料來源、以資料來源為基礎的資料來源檢視、定義如何在模型中使用資料的採礦結構,以及建立並儲存模式的採礦模型。

如需詳細資訊,請參閱:定義 Analysis Services 專案>、<使用資料來源精靈來定義資料來源 (Analysis Services)>。

定義資料來源

資料來源會定義 Analysis Services 伺服器用來連接到資料來源的連接字串和驗證資訊。資料來源可以包含多個資料表或檢視。Analysis Services 可以同時使用來自關聯式與線上分析處理 (OLAP) 資料庫的資料集,或是來自外部提供者的資料集。

當您已經定義資料來源的這個連接之後,可以建立一個檢視,以識別與您模型相關的特定資料。資料來源檢視也會讓您自訂將資料來源中的資料提供給採礦模型的方式。您可以修改資料結構,使它與您的專案關係更加密切,或僅選擇特定種類的資料。如果您要篩選資料,可以在資料來源檢視中進行,或在模型層級應用的篩選中進行。

您需要的資料數目需求,以及如何清除並格式化該資料的需求,將會根據您用於調查該資料的演算法而有所不同。

如需詳細資訊,請參閱:定義資料來源檢視 (Analysis Services)>。

將採礦結構加入至 Analysis Services 專案

一旦您擁有足夠的資料可以開始分析,就能夠選取與您商務問題最相關之資料的資料行,以及將採購結構加入到專案中。採礦結構會定義從專案中資料來源檢視或 OLAP Cube 取得之資料的資料行,以及包含巢狀資料表的資料行。

若要加入新的採礦結構,啟動資料採礦精靈,引導您完成定義資料的程序,以及選擇性地建立初始資料採礦模型的程序。建立結構時,您也可以分割資料以包含用於建立模型的訓練資料集,以及用於測試或驗證以該結構為基礎之所有採礦模型的測試資料集。您可以使用資料採礦設計師的 [採礦結構] 索引標籤來修改現有的採礦結構,包括加入資料行和巢狀資料表。

如需詳細資訊,請參閱:建立新的採礦結構>、<資料採礦設計師>、<資料採礦精靈 (Analysis Services - 資料採礦)>。

使用資料採礦模型

您可以將一個或多個採礦模型加入至每個採礦結構。採礦模型會定義演算法或您將在資料上使用的分析方法。您可以透過產生資料的數學模型之演算法,執行資料來源檢視中的資料來處理每個模型。此程序也就是所謂的「定型模型」

模型經過處理之後,您可以使用視覺的方式瀏覽採礦模型,並據此建立預測查詢。

Analysis Services 提供處理採礦模型物件的數個選項,包括控制處理之物件以及處理方式的能力。例如,您可以處理結構並快取資料,然後繼續將新的模型加入到結構中。如果資料已經過快取,您可以使用「鑽研」(Drillthrough) 查詢,傳回有關在模型中使用之案例的詳細資訊。

如需詳細資訊,請參閱:資料採礦演算法 (Analysis Services - 資料採礦)>、<處理 Analysis Services 物件>、<針對採礦模型和採礦結構使用鑽研 (Analysis Services - 資料採礦)>。

驗證資料採礦模型

建立模型後,您可以調查結果,並判定效能最佳的模型。在資料採礦設計師的 [採礦模型檢視器] 索引標籤中,Analysis Services 會提供每個採礦模型類型的檢視器,您可以使用這些檢視器來瀏覽採礦模型。

在該設計師的 [採礦精確度圖表] 索引標籤中,Analysis Services 提供的工具可以用於直接比較採礦模型,然後選擇最精確或最實用的採礦模型。這些工具包括增益圖、收益圖表和分類矩陣。

您也可以使用交叉驗證報表 (SQL Server 2008 的新功能) 執行資料的反覆次取樣,以判斷模型是否偏差為特定的資料集。報表提供的統計資料可以用客觀的方式比較模型,並評估定型資料的品質。

如需詳細資訊,請參閱:檢視資料採礦模型>、<驗證資料採礦模型 (Analysis Services - 資料採礦)

建立預測

大部分資料採礦專案的主要目標是要使用採礦模型來建立預測。在瀏覽和比較採礦模型之後,您可以使用其中一個工具來建立預測。Analysis Services 提供一種稱為資料採礦延伸模組 (DMX) 的查詢語言,它是建立預測的基礎,而且可以輕鬆編寫指令碼。為了協助您建立 DMX 預測查詢,SQL Server 在 SQL Server Management Studio 和 Business Intelligence Development Studio 中提供了查詢產生器,而在 Management Studio 中提供了查詢編輯器的 DMX 範本。在 BI Development Studio 內,您可以從資料採礦設計師的 [採礦模型預測] 索引標籤中存取查詢產生器。

如需詳細資訊,請參閱:建立 DMX 預測查詢>、<資料採礦延伸模組 (DMX) 陳述式參考

 

SQL Server Management Studio


使用 BI Development Studio 來建立資料採礦專案的採礦模型之後,您可以在 Management Studio 中管理和使用模型以及建立預測。您可以使用 SQL Server Management Studio 中的查詢工具瀏覽模型中的資料、建立複雜的內容查詢,或管理儲存在 SQL Server 執行個體中的資料採礦物件。

如需詳細資訊,請參閱:SQL Server Management Studio 中的資料採礦>、<SQL Server Management Studio 中的資料採礦>。
 

SQL Server Reporting Services


在建立採礦模型之後,您可以將結果散發給更多觀眾。因為資料採礦的結果儲存在可以透過資料庫查詢輕易存取的統一結構描述中,因此您可以使用各種用戶端工具呈現分析的結果、瀏覽模型中的模式,或進行預測。

您可以在 Microsoft SQL Server Reporting Services 中使用報表設計師來建立報表,報表可用來呈現採礦模型所包含的資訊。您可以使用任何 DMX 查詢的結果做為報表的基礎,並利用 Reporting Services 中可用的參數化和格式化功能的優點。

如需詳細資訊,請參閱:DMX 的 Analysis Services 連接類型 (SSRS)>、<將 Reporting Services 整合到應用程式>。

以程式設計的方式使用資料採礦


Analysis Services 提供數個工具,讓您以程式設計的方式來使用資料採礦。DMX 語言會提供陳述式,您可用來建立、定型和使用資料採礦模型。您也可以使用 XML for Analysis (XMLA) 和 Analysis Services 指令碼語言 (ASSL) 的結合或使用分析管理物件 (AMO) 來執行這些工作。

您可以使用資料採礦結構描述資料列集,來存取與資料採礦相關聯的所有中繼資料。例如,您可以使用結構描述資料列集,來決定演算法支援的資料類型或存在於資料庫中的模型名稱。

如需詳細資訊,請參閱:資料採礦延伸模組 (DMX) 參考>、<資料採礦結構描述資料列集>、<在 Analysis Services (XMLA) 中使用 XML for Analysis> 

回上頁