• Description

📊 資料取樣 (Data Sampling)

基本概念

設計實驗 (DOE) 通常用於從系統中收集新資料。但在許多情況下,已有大量資料被收集,甚至多到難以直接分析。
例如:來自實際運行元件上的感測器,會在元件整個使用壽命期間連續記錄健康監測數據。

SmartUQ 資料取樣工具 可以將龐大的資料集劃分成較小的子集合,模擬出一個空間填充型 (Space-Filling) DOE
與傳統 先設計再收集資料 DOE 不同,資料取樣(例如 子取樣 Subsampling切片取樣 Sliced Sampling)是直接從 既有的輸入輸出資料對 中挑選能代表設計空間的資料點。

🔄 資料取樣流程 (Workflow)

輸入資料來源:模擬數據或實驗數據,通常規模龐大。

挑選代表性子集:透過 SmartUQ 工具,將資料分割成小型子集,仍能完整代表設計空間。

效益:

  • 降低計算負擔
  • 保留進階分析的精準度
  • 透過保留資料集,可進行模型驗證,節省模擬與測試資源

🔹 子取樣演算法 (Subsampling Algorithms)

  • 從大型資料集中挑選使用者指定數量的代表點。
  • 與隨機切割不同,子取樣會挑選出能模擬空間填充 DOE 的點,避免偏差。
  • 透過 智慧選點,只用部分資料就能維持分析準確度,同時大幅降低計算成本。
  • 保留下來的大型資料集則可用於 模型驗證,確保預測可靠性。


📌 子取樣流程
將既有資料集縮小,挑選子集,使其分佈接近空間填充 DOE

🔹 切片取樣演算法 (Sliced Sampling Algorithms)

  • 與切片設計概念類似,將資料集分割為多個子群組 (Slices)
  • 初始資料集不需要是假設為空間填充設計。
  • 每個切片可用於:
    • 建立代用模型 (Emulator / Surrogate Model)
    • 模型驗證

獨特優勢:Divide & Combine

  • 每個切片分別建立自己的代用模型
  • 再將所有子模型 合併成一個最終模型
  • 支援 平行運算,降低記憶體需求
  • 能有效處理 大規模資料集的進階分析

📌 切片取樣流程
將資料集切分為四個區塊,每個區塊皆近似於空間填充 DOE,最後再整合結果。