Користувач:AnatoliiSavin/Кількісна оцінка невизначеності
Кількісна оцінка невизначеності (англ. uncertainty quantification) — це наука про кількісну характеристику та оцінку невизначеностей як в обчислювальних, так і в реальних застосуваннях. Вона намагається визначити, наскільки ймовірні певні результати, якщо деякі аспекти системи точно невідомі. Прикладом може бути передбачення прискорення людського тіла під час лобового зіткнення з іншим автомобілем: навіть якщо швидкість була точно відома, невеликі відмінності у виробництві окремих автомобілів, наскільки щільно затягнутий кожен болт тощо призведуть до різних результатів, які можна передбачити лише в статистичному значенні.
Багато проблем у природничих науках та інженерії також насичені джерелами невизначеності. [./Https://en.wikipedia.org/wiki/Computer_experiment Комп'ютерні експерименти] на комп'ютерних симуляціях є найпоширенішим підходом для вивчення проблем у кількісній оцінці невизначеності.[1][2][3][4]
Невизначеність може входити в математичні моделі та експериментальні вимірювання в різних контекстах. Один із способів класифікувати джерела невизначеності полягає в тому, щоб розглянути наступне: [5]
- Параметр невизначеності
- Це походить від параметрів моделі, які є вхідними даними для комп’ютерної моделі (математичної моделі), але чиї точні значення невідомі експериментаторам і не можуть контролюватись у фізичних експериментах, або чиї значення не можуть бути точно визначені статистичними методами . Деякими прикладами цього є локальне прискорення вільного падіння в експерименті з падаючим об’єктом, різні властивості матеріалу в аналізі кінцевих елементів для інженерії та невизначеність мультиплікатора в контексті оптимізації макроекономічної політики .
- Параметрична невизначеність
- Це відбувається через мінливість вхідних змінних моделі. Наприклад, розміри оброблюваної деталі в процесі виробництва можуть не точно відповідати проєкту та інструкціям, що спричинить мінливість її продуктивності.
- Структурна невизначеність
- Також відома як "неадекватність моделі", "упередженість моделі" або "розбіжність моделі", це відбувається через відсутність знання фізики, що лежить в основі проблеми. Це залежить від того, наскільки точно математична модель описує справжню систему для реальної життєвої ситуації, враховуючи той факт, що моделі майже завжди є лише наближеннями до реальності. Одним із прикладів є моделювання процесу падіння об’єкта за допомогою моделі вільного падіння; сама модель є неточною, оскільки завжди існує тертя повітря. У цьому випадку, навіть якщо в моделі немає невідомого параметра, все одно очікується розбіжність між моделлю та справжньою фізикою.
- Алгоритмічна невизначеність
- Також відома як "числова невизначеність" або "дискретна невизначеність". Цей тип походить від числових помилок і числових наближень для реалізації комп’ютерної моделі. Більшість моделей надто складні для отримання точного рішення. Наприклад, метод скінченних елементів або метод скінченних різниць можна використовувати для наближення розв’язання рівняння з частинними похідними (що вносить числові помилки). Іншими прикладами є числове інтегрування та скорочення нескінченної суми, які є необхідними наближеннями в чисельній реалізації.
- Експериментальна невизначеність
- Також відома як "похибка спостереження", це походить від мінливості експериментальних вимірювань. Експериментальна невизначеність є неминучою, і її можна помітити, повторюючи вимірювання багато разів, використовуючи однакові налаштування для всіх вхідних даних/змінних.
- Інтерполяція невизначеності
- Це пов’язано з відсутністю доступних даних, зібраних за допомогою комп’ютерного моделювання та/або експериментальних вимірювань. Для інших вхідних налаштувань, які не мають даних моделювання чи експериментальних вимірювань, потрібно інтерполювати або екстраполювати, щоб передбачити відповідні реакції.
Невизначеність іноді класифікують за двома категоріями, [6] [7] що особливо помітно в медичних застосуваннях.
- Алеаторна (або випадкова) невизначеність
- Алеаторична невизначеність, також відома як "стохастична невизначеність", є репрезентативною для невідомих, які відрізняються кожного разу, коли ми запускаємо той самий експеримент. Наприклад, одна стріла, випущена з механічного лука, який точно дублює кожен пуск (те саме прискорення, висота, напрямок і кінцева швидкість), не вражатиме ту саму точку цілі через випадкові та складні коливання стрижня стріли, знання яких неможливо визначити достатньо, щоб усунути результуючий розкид точок попадання. Аргумент тут, очевидно, полягає у визначенні поняття «неможливо». Те, що ми не можемо виміряти достатньо за допомогою наших доступних на даний момент вимірювальних пристроїв, не обов’язково виключає існування такої інформації, яка б перемістила цю невизначеність у наведену нижче категорію. Алеаторика походить від латинського "alea" або кості, що означає азартну гру.
- Епістемічна (або пізнавальна) невизначеність
- Епістемічна невизначеність, також відома як "систематична невизначеність", пов’язана з речами, які в принципі можна знати, але не їх не враховують на практиці. Це може бути тому, що вимірювання є неточним, тому що модель нехтує певними ефектами, або тому, що певні дані були навмисно приховані. Прикладом джерела такої невизначеності може бути опір в експерименті, призначеному для вимірювання прискорення сили тяжіння поблизу земної поверхні. Зазвичай використовується гравітаційне прискорення 9,8 м/с² ігноруючи вплив опору повітря, але опір повітря да об’єкту можна виміряти та включити в експеримент, щоб зменшити результуючу невизначеність у розрахунку гравітаційного прискорення.
- Комбінована поява та взаємодія алеаторної та епістемічної невизначеності
- Алеаторна та епістемічна невизначеність також можуть виникати одночасно в одному вираженні. Наприклад, коли експериментальні параметри демонструють алеаторну невизначеність, і ці експериментальні параметри вводяться в комп’ютерне моделювання. Якщо потім для кількісного визначення невизначеності сурогатна модель, наприклад процес Гаусса або розширення поліноміального хаосу, вивчається з комп’ютерних експериментів, цей сурогат виявляє епістемічну невизначеність, яка залежить від алеаторної невизначеності експериментальних параметрів або взаємодіє з нею. [4] Таку невизначеність більше не можна класифікувати лише як алеаторну або епістемічну, вона є більш загальною інференціальною невизначеністю висновків.
У реальних застосуваннях присутні обидва типи невизначеностей. Кількісна оцінка невизначеності має на меті чітко виразити обидва типи невизначеності окремо. Кількісна оцінка алеаторичних невизначеностей може бути відносно простою, де традиційна (частотницька) ймовірність є найосновнішою формою. Часто використовуються такі методи, як метод Монте-Карло. Розподіл ймовірностей може бути представлений його моментами (у гауссовому випадку достатньо середнього значення та коваріації, хоча, загалом, навіть знання всіх моментів до будь-якого високого порядку все одно не визначає функцію розподілу однозначно), або такими нещодавними методами, як Кархунена–Лове та розширення поліноміального хаосу . Щоб оцінити епістемічну невизначеність, докладаються зусилля, щоб зрозуміти знання (відсутність знань) про систему, процес або механізм. Епістемічну невизначеність зазвичай розуміють через призму баєсівської ймовірності, де ймовірності інтерпретуються як вказівки на те, наскільки впевненою може бути раціональна людина щодо конкретного твердження.
У математиці невизначеність часто характеризують у термінах розподілу ймовірностей. З цієї точки зору епістемічна невизначеність означає відсутність впевненості в тому, яким є відповідний розподіл ймовірностей, а алеаторична невизначеність означає невпевненість у тому, якою буде випадкова вибірка, взята з розподілу ймовірностей.
Існують два основних типи проблем у кількісній оцінці невизначеності: одна – це пряме поширення невизначеності (де різні джерела невизначеності поширюються через модель, щоб передбачити загальну невизначеність реакції системи), а інша – зворотна оцінка невизначеності моделі та невизначеності параметрів (де параметри моделі калібруються одночасно з використанням даних тестування). Більш поширеним є дослідження першої проблеми, і для неї було розроблено більшість методів аналізу невизначеності. З іншого боку, остання проблема привертає все більшу увагу в спільноті інженерів-проєктувальників, оскільки кількісна оцінка невизначеності моделі та наступні передбачення справжньої реіації(й) системи становлять великий інтерес для проєктування надійних систем.
Поширення невизначеності – це кількісна оцінка невизначеностей на виході(ах) системи, що поширюється від невизначених вхідних даних. Вона зосереджена на впливі на результати параметричної мінливості, перерахованої в джерелах невизначеності. Об’єктами аналізу поширення невизначеності можуть бути:
- Оцінка моментів нижчого порядку виходів, тобто середнє значення та дисперсію.
- Оцінка надійності виходів. Це особливо корисно в розробці надійності, де вихідні дані системи зазвичай тісно пов’язані з продуктивністю системи.
- Оцінка повного розподілу ймовірностей виходів. Це корисно в сценарії оптимізації корисності, де для обчислення корисності використовується повний розподіл.
Враховуючи деякі експериментальні вимірювання системи та деякі результати комп’ютерного моделювання з її математичної моделі, зворотна кількісна оцінка невизначеності оцінює розбіжність між експериментом і математичною моделлю (яка називається корекцією упередженості), а також оцінює значення невідомих параметрів у моделі, якщо такі є (що називається калібруванням параметрів або просто калібруванням). Загалом це набагато складніша проблема, ніж пряме поширення невизначеності; однак це має велике значення, оскільки зазвичай реалізується в процесі оновлення моделі. Існує кілька сценаріїв зворотної кількісної оцінки невизначеності:
![](http://upload.wikimedia.org/wikipedia/commons/thumb/f/f2/Bias_Correction.png/300px-Bias_Correction.png)
Корекція упередженості кількісно визначає неадекватність моделі, тобто розбіжність між експериментом і математичною моделлю. Загальна формула оновлення моделі для корекції упередженості така:
де позначає експериментальні вимірювання як функцію кількох вхідних змінних , позначає реакцію комп'ютерної моделі (математичної моделі), позначає адитивну функцію розбіжності (вона ж функція упередженості), а позначає експериментальну невизначеність. Метою є оцінка функції розбіжності , а як побічний продукт – оновлена модель . Інтервал довіри передбаченню надається разом з оновленою моделлю як кількісна оцінка невизначеності.
Калібрування параметрів оцінює значення одного або кількох невідомих параметрів у математичній моделі. Загальна формула оновлення моделі для калібрування така:
де позначає реакцію комп’ютерної моделі, яка залежить від кількох невідомих параметрів моделі , а позначає справжні значення невідомих параметрів у ході експериментів. Мета полягає в тому, щоб оцінити , або отримати розподіл ймовірностей що охоплює найкраще знання справжніх значень параметрів.
Це розглядає неточну модель з одним або декількома невідомими параметрами, а її формулювання оновлення моделі поєднує обидва сценарії разом:
Це найповніша формулювання оновлення моделі, яка включає всі можливі джерела невизначеності, і для її вирішення потрібно найбільше зусиль.
Було проведено багато досліджень для вирішення проблем кількісної оцінки невизначеності, хоча більшість із них стосується поширення невизначеності. Протягом останніх одного-двох десятиліть також було розроблено низку підходів для проблем зворотної кількісної оцінки невизначеності, які виявилися корисними для більшості проблем малого та середнього масштабу.
Існуючі підходи до поширення невизначеності включають імовірнісні та неімовірнісні підходи. В основному існує шість категорій ймовірнісних підходів до поширення невизначеності: [8]
- Методи на основі моделювання: Моделювання Монте-Карло, вибірка за значимістю, адаптивна вибірка тощо.
- Загальні сурогатні методи: У неінструктивному підході сурогатна модель вивчається, щоб замінити експеримент або моделювання дешевим і швидким наближенням. Сурогатні методи також можуть бути використані повністю баєсівським способом. [9] [4] [10] [11] Цей підхід виявився особливо ефективним, коли вартість вибірки, наприклад, обчислювально дорогого моделювання, є непомірно високою.
- Методи, засновані на локальному розширенні: Ряди Тейлора, метод збурень тощо. Ці методи мають переваги, коли мають справу з відносно невеликою мінливістю вхідних даних і виходами, які не виражають високої нелінійності. Ці лінійні або лінеаризовані методи детально описані в статті Поширення невизначеності .
- Методи, засновані на функціональному розширенні: Розширення Неймана, ортогональне розширення або розширення Кархунена–Ловева, з розширенням поліноміального хаосу і вейвлет-розширеннями як окремими випадками.
- Методи на основі найбільш вірогідної точки: Метод надійності першого порядку і метод надійності другого порядку.
- Методи на основі числового інтегрування: Повне факторне чисельне інтегрування і зменшення розмірності.
Для неімовірнісних підходів інтервальний аналіз, [12] нечітка теорія, теорія можливостей і теорія доказів є одними з найбільш широко використовуваних.
Імовірнісний підхід вважається найбільш строгим підходом до аналізу невизначеності в інженерному проєктуванні через його узгодженість з теорією аналізу рішень. Його наріжним каменем є розрахунок функцій щільності ймовірності для статистики вибірки. Це можна виконати строго для випадкових змінних, які можна отримати як перетворення змінних Гауса, що призводить до точних інтервалів довіри.
У регресійному аналізі та проблемах найменших квадратів стандартна помилка оцінок параметрів легко доступна, яку можна розширити до довірчого інтервалу .
За баєсівською системою існує кілька методологій зворотної кількісної оцінки невизначеності. Найскладнішим напрямком є націлення на вирішення проблем як з корекцією упередженості, так і з калібруванням параметрів. Виклики таких проблем включають не лише вплив неадекватності моделі та невизначеності параметрів, але й брак даних як комп’ютерного моделювання, так і експериментів. Поширеною ситуацією є те, що вхідні параметри не однакові в експериментах і моделюваннях. Інша поширена ситуація полягає в тому, що параметри, отримані з експериментів, вводяться в моделювання. Для обчислювально дорогих симуляцій часто необхідна сурогатна модель, наприклад процес Гаусса або поширення поліноміального хаосу, що визначає зворотну проблему для пошуку сурогатної моделі, яка найкраще наближена до моделювання. [4]
Підхід до зворотної кількісної оцінки невизначеності – це модульний баєсівський підхід. [5] Модульний баєсівський підхід отримав свою назву від процедури з чотирьох модулів. Окрім поточних доступних даних, слід призначити попередній розподіл невідомих параметрів.
- Модуль 1: Моделювання процесу Гауса для комп’ютерної моделі
Щоб вирішити проблему, пов’язану з відсутністю результатів моделювання, комп’ютерну модель заміняють моделлю процесу Гауса (ПГ)
де
є розмірністю вхідних змінних, а – розмірність невідомих параметрів. Поки заздалегідь визначено, , відомі як гіперпараметри моделі процесу Гауса, необхідно оцінювати за допомогою оцінки максимальної правдоподібності. Цей модуль можна розглядати як узагальнений метод крігінгу.
- Модуль 2: Моделювання процесу Гауса для функції розбіжності
Подібно до першого модуля функція розбіжності замінюється моделлю процесу Гауса
де
Разом із попереднім розподілом невідомих параметрів і даними як комп’ютерних моделей, так і експериментів можна отримати оцінки максимальної ймовірності для . У той же час, з модуля 1 також оновлюється.
- Модуль 3: Апостеріорний розподіл невідомих параметрів
Теорема Байєса застосована для обчислення апостеріорного розподілу невідомих параметрів:
де включає всі фіксовані гіперпараметри в попередніх модулях.
- Модуль 4: Передбачення експериментальної реакції та функції розбіжності
Повністю баєсівський підхід вимагає не тільки пріоритетів для невідомих параметрів , але також слід призначити і пріоритети для інших гіперпараметрів . Він складається з наступних кроків: [13]
- Вивести апостеріорний розподіл ;
- Інтегрувати і отримати . Цей єдиний крок завершує калібрування;
- Передбачення експериментальної реакції та функції розбіжності.
Однак підхід має істотні недоліки:
- У більшості випадків є дуже складною функцією . Тому й інтеграція стає дуже складною. Крім того, якщо пріоритети для інших гіперпараметрів не вибираються ретельно, складність числового інтегрування зростає ще більше.
- На етапі прогнозування передбачення (яке повинно принаймні включати очікуване значення реакції системи) також вимагає чисельного інтегрування. Для інтеграції часто використовується метод Монте-Карло марковських ланцюгів; однак це обчислювально дорого.
Повністю баєсівський підхід вимагає величезної кількості обчислень і, можливо, ще не практичний для роботи з найскладнішими ситуаціями моделювання. [13]
Теорії та методології розширення невизначеності набагато краще встановлені порівняно зі зворотною кількісною оцінкою невизначеності. Для останнього залишаються невирішеними кілька труднощів:
- Питання розмірності: Обчислювальні витрати різко зростають із збільшенням розмірності проблеми, тобто з кількістю вхідних змінних та/або кількістю невідомих параметрів.
- Питання ідентифікованості:[14] Різні комбінації невідомих параметрів і функції розбіжності можуть давати однаковий експериментальний прогноз. Отже, різні значення параметрів не можуть бути розрізнені/ідентифіковані. Ця обставина обходиться в баєсівському підході, де такі комбінації усереднюються.[4]
- Неповна реакція моделі: Відноситься до моделі, яка не має рішення для деяких комбінацій вхідних змінних.[15][16]
- Кількісна оцінка невизначеності у вхідних величинах: Відсутність важливих подій у доступних даних або критичних величин, які не ідентифіковані аналітиками через, наприклад, обмеження існуючих моделей.[17]
- Малий розгляд впливу виборів, зроблених аналітиками.[18]
- ↑ Sacks, Jerome; Welch, William J.; Mitchell, Toby J.; Wynn, Henry P. (1989). Design and Analysis of Computer Experiments. Statistical Science. 4 (4): 409—423.
- ↑ Iman, Ronald L.; Helton, Jon C. (1988). An Investigation of Uncertainty and Sensitivity Analysis Techniques for Computer Models. Risk Analysis. Wiley. 8 (1): 71—90. Bibcode:1988RiskA...8...71I. doi:10.1111/j.1539-6924.1988.tb01155.x. ISSN 0272-4332.
- ↑ Walker, W.E.; Harremoës, P.; Rotmans, J.; van der Sluijs, J.P.; van Asselt, M.B.A.; Janssen, P.; Krayer von Krauss, M.P. (2003). Defining Uncertainty: A Conceptual Basis for Uncertainty Management in Model-Based Decision Support. Integrated Assessment. Swets & Zeitlinger Publishers. 4 (1): 5—17. Bibcode:2003IntAs...4....5W. doi:10.1076/iaij.4.1.5.16466. ISSN 1389-5176.
{{cite journal}}
:|hdl-access=
вимагає|hdl=
(довідка) - ↑ а б в г д Ranftl, Sascha; von der Linden, Wolfgang (13 листопада 2021). Bayesian Surrogate Analysis and Uncertainty Propagation. Physical Sciences Forum. 3 (1): 6. arXiv:2101.04038. doi:10.3390/psf2021003006. ISSN 2673-9984. Помилка цитування: Некоректний тег
<ref>
; назва «:0» визначена кілька разів з різним вмістом - ↑ а б Kennedy, Marc C.; O'Hagan, Anthony (2001). Bayesian calibration of computer models. Journal of the Royal Statistical Society, Series B (Statistical Methodology). 63 (3): 425—464. doi:10.1111/1467-9868.00294. Помилка цитування: Некоректний тег
<ref>
; назва «KennedyOHagan» визначена кілька разів з різним вмістом - ↑ Der Kiureghian, Armen; Ditlevsen, Ove (2009). Aleatory or epistemic? Does it matter?. Structural Safety. 31 (2): 105—112. doi:10.1016/j.strusafe.2008.06.020.
- ↑ Matthies, Hermann G. (2007). Quantifying Uncertainty: Modern Computational Representation of Probability and Applications. Extreme Man-Made and Natural Hazards in Dynamics of Structures. NATO Security through Science Series. с. 105—135. doi:10.1007/978-1-4020-5656-7_4. ISBN 978-1-4020-5654-3.
- ↑ Lee, S. H.; Chen, W. (9 травня 2008). A comparative study of uncertainty propagation methods for black-box-type problems. Structural and Multidisciplinary Optimization. Springer Science and Business Media LLC. 37 (3): 239—253. doi:10.1007/s00158-008-0234-7. ISSN 1615-147X.
- ↑ Cardenas, IC (2019). On the use of Bayesian networks as a meta-modeling approach to analyse uncertainties in slope stability analysis. Georisk: Assessment and Management of Risk for Engineered Systems and Geohazards. 13 (1): 53—65. Bibcode:2019GAMRE..13...53C. doi:10.1080/17499518.2018.1498524.
- ↑ Ranftl, Sascha; Melito, Gian Marco; Badeli, Vahid; Reinbacher-Köstinger, Alice; Ellermann, Katrin; von der Linden, Wolfgang (31 грудня 2019). Bayesian Uncertainty Quantification with Multi-Fidelity Data and Gaussian Processes for Impedance Cardiography of Aortic Dissection. Entropy. 22 (1): 58. Bibcode:2019Entrp..22...58R. doi:10.3390/e22010058. ISSN 1099-4300. PMC 7516489. PMID 33285833.
- ↑ Ranftl, Sascha; Müller, Thomas Stephan; Windberger, Ursula; von der Linden, Wolfgang; Brenn, Günter (3 травня 2021), Data and codes for 'A Bayesian Approach to Blood Rheological Uncertainties in Aortic Hemodynamics', doi:10.5281/zenodo.5237189, процитовано 12 січня 2022
- ↑ Jaulin, L.; Kieffer, M.; Didrit, O.; Walter, E. (2001). Applied Interval Analysis. Springer. ISBN 1-85233-219-0.
- ↑ а б Bayarri, M. J.; Berger, J. O.; Liu, F. (1 березня 2009). Modularization in Bayesian analysis, with emphasis on analysis of computer models. Bayesian Analysis. Institute of Mathematical Statistics. 4 (1): 119—150. doi:10.1214/09-ba404. ISSN 1936-0975. Помилка цитування: Некоректний тег
<ref>
; назва «Liu» визначена кілька разів з різним вмістом - ↑ Arendt, Paul D.; Apley, Daniel W.; Chen, Wei; Lamb, David; Gorsich, David (28 вересня 2012). Improving Identifiability in Model Calibration Using Multiple Responses. Journal of Mechanical Design. ASME International. 134 (10): 100909. doi:10.1115/1.4007573. ISSN 1050-0472.
- ↑ Cardenas, IC (2019). On the use of Bayesian networks as a meta-modeling approach to analyse uncertainties in slope stability analysis. Georisk: Assessment and Management of Risk for Engineered Systems and Geohazards. 13 (1): 53—65. Bibcode:2019GAMRE..13...53C. doi:10.1080/17499518.2018.1498524.
- ↑ van den Eijnden, AP; Schweckendiek, T; Hicks, MA (2021). Metamodelling for geotechnical reliability analysis with noisy and incomplete models. Georisk: Assessment and Management of Risk for Engineered Systems and Geohazards. 16 (3): 518—535. doi:10.1080/17499518.2021.1952611.
- ↑ Cardenas, I.; Aven, T.; Flage, R. (2022). Addressing challenges in uncertainty quantification. The case of geohazard assessments. Geosci. Model Dev. Discuss. 16 (6): 1601—1615. doi:10.5194/gmd-16-1601-2023.
{{cite journal}}
:|hdl-access=
вимагає|hdl=
(довідка) - ↑ Cardenas, I.; Aven, T.; Flage, R. (2022). Addressing challenges in uncertainty quantification. The case of geohazard assessments. Geosci. Model Dev. Discuss. 16 (6): 1601—1615. doi:10.5194/gmd-16-1601-2023.
{{cite journal}}
:|hdl-access=
вимагає|hdl=
(довідка)
[[Категорія:Математична статистика]] [[Категорія:Дослідження операцій]] [[Категорія:Математичне моделювання]] [[Категорія:Прикладна математика]]