建立支援持續改善的數據分析架構

建立數據分析系統的方法依企業需求及資源有所不同,這裡提出一個運用最小資源但可以有效支援持續改善及問題解決的數據分析架構。

數據分析架構

上面的概念圖中,左側列出問題解決或持續改善的關鍵步驟,這些步驟中會包含數個重要任務;右側是支援這些任務的數據分析功能。說明如下:

持續改善及問題解決的關鍵步驟

六標準差和 8D 是產業界常用的持續改善及問題解決的方法。儘管着重的思維及程序小有差異,兩者大部分使用相同的方法及工具,同樣注重落實解決問題的關鍵步驟,及追踨對策效果和預防問題發生或再發。

解決問題的關鍵步驟:(1) 先了解問題 ,(2) 再由問題現象,尋找及確認原因,(3) 之後根據發生原因決定解決方案。 這三步驟的過程中,包含了下列重要的任務:

  1. 探索及了解問題:

    • 定義問題的衡量指標,一個或多個指標。
    • 確立衡量指標的操作型定義,包括所涵蓋的項目、範圍、區間及計算方法。
    • 評估衡量指標的現況。
    • 分析衡量指標:趨勢分析、差異分析。
    • 若己建立指標模型,根據模型分析指標、深入了解問題。
  2. 根據問題的關鍵資訊,假設及驗證原因:

    • 查詢類似問題的歷史資料及其驗證過的原因,是否重複發生或是新事件。
    • 探索影響衡指標的關鍵因子及其關聯性或因果關係:利用暨有資料或實驗驗證。
    • 建立或更新(產品/製程)指標模型。
  3. 根據發生原因選擇及執行對策:

    • 最佳化對策。
    • 模擬對策及預測結果:效益及風險分析。
    • 監控執行中的對策,若有需要,更正指標模型或重做決策。

支援持續改善的數據分析架構

數據分析架構依據改善流程的任務需求,分為幾個區塊:

  1. 儀表板及分析介面:
    使用者透過儀表板追蹤各項指標的狀況及變化,及評估指標的現況,或是預警可能的問題。進一步的分析,例如趨勢分析或差異分析,則透過分析介面來進行。

    • 在探索問題的階段,儀表板提供了一個簡單的介面來追踨問題發展的狀況,輔助團隊實施防堵措施;分析介面則幫助團隊更有效的了解問題,找出可能的原因。
    • 在執行對策的階段,儀表板的功能可以讓團隊輕鬆的追踨對策的效果及監控可能的風險。
  2. 分析報告:
    跳脫表格式的數字報表,分析報告整合相關的數據,依據使用者的需求及納含企業團隊的專業,建構分析的流程,產出對使用者更具有明確意義,可據以行動的報告。 分析報告可以幫助團隊更有效率的完成某些可程式化的問題解決報告,比起人工撰寫報告,這提供幾個好處:

    • 可程式化的報告可以透過程式累積企業的知識,提高報告的正確性和有用資訊的程度。
    • 報告內容及原始資料來源可追溯,容易修正報告中的錯誤,並預防再發生。
    • 報告可自動(或半自動)分類歸檔,容易累積至企業知識庫。
    • 速度!

    此外,像生產會議的例行報告,可以不只是有前一日的各個生產指標狀態,更可以的整合過去的資料,分析趨勢變化。進一步可以跟據企業內部已產生的知識及經驗做原因分析,及預測可能的結果和影響,以便及早因應。

    研發、工程、測試報告或者持續改善的報告也可以整合企業內部的團隊知識,先規劃好報告的內容架構,數據收集完成之後,即可很容易的產生高品質的報告,供團隊做為決策輔助。

  3. 產品,製程,指標型模型:
    從較簡單的樹狀決策到複雜的機器學習模型,模型用以解釋指標(或是產品、製程)的行為特性,用以分析指標的狀態,預測指標發展。模型是數據分析的心臟,單純的儀表板只能追踨指標的狀況,模型提供分析介面及分析報告更具有洞見的內容。預測及提供可行的建議都依賴模型。

    • 在探索問題的階段,模型提供團隊一個快速又精確的方法來了解問題,甚至找到原因。
    • 在問題解決完成之後,模型可能需要被適度的修正。
  4. 數據庫:
    收集分析所需要的數據。分為三部分:

    • 第一部分是在解決問題過程所產生及收集的數據,主要目的在保留研究的數據,必要時可以重新產生報告,確認重覆性或可能問題點。
    • 第二部分是在執行解決方案時所決定要收集的數據,用來追蹤執行的成效及監控可能的風險。
    • 第三部分是從主資料庫所轉移過來的數據,目的是擴大數據基礎,以建立分析模型及提供儀表板和分析介面及時的數據。

    數據庫不一定要是關聯資料庫,文字檔或 csv 都可以適當的被歸檔至數據庫中。

  5. 知識庫:
    主要為分析報告收集的位置,由於程式化的分析報告主要是以網頁(HTML)格式產生,並加註 tag 及分類,這些累積的知識,很容易的被重複參考使用。

    知識庫的建立及維持是企業累積知識的重要方法。企業常見各類的研究報告,實驗報告或問題解決報告散落在各個工程或管理人員的電腦中,很難以做統合運用,往往浪費掉企業寶貴的資源。