Задача про перебірливу наречену

Матеріал з Вікіпедії — вільної енциклопедії.
Перейти до навігації Перейти до пошуку
Графіки ймовірностей отримання найкращого кандидата (червоні кружечки) з n заявок і k/n (сині хрестики), де k — розмір вибірки

Задача про перебірливу наречену, або проблема зупинки вибору — демонстрація застосування теорії оптимальної зупинки[1][2], яка широко вивчається в галузі прикладної ймовірності[en], статистики та теорії прийняття рішень. Вона також відома як проблема секретаря, проблема приданого султана, проблема метушливого залицяльника, гра гугол і проблема найкращого вибору. Її рішення також відоме як правило 37 %[3].

Основний варіант постановки проблеми такий: уявіть адміністратора, який хоче найняти найкращого секретаря з претендентів на відповідну посаду; претенденти можуть бути оцінені за рейтингом. Претенденти опитуються по черзі у випадковому порядку. Рішення щодо кожного конкретного претендента приймається відразу після співбесіди. Після відмови претендент не може бути прийнятий на роботу. Під час співбесіди адміністратор отримує достатньо інформації, щоб оцінити рейтинг претендента серед усіх опитаних на даний момент претендентів, але немає можливості порівняти з претендентами, які ще не розглядалися. Питання полягає в оптимальній стратегії (зупинки вибору) щоб максимізувати ймовірність вибору найкращого претендента. Якщо рішення можна відкласти до кінця, задачу можна вирішити за допомогою простого алгоритму вибору максимального відстеження поточного максимуму (і претендента, який його досяг), і вибору загального максимуму в кінці. Складність полягає в тому, що рішення потрібно приймати негайно.

Найкоротший точний доказ, відомий на сьогоднішній день, забезпечується алгоритмом шансів. Він передбачає, що оптимальна ймовірність виграшу завжди принаймні (де e — основа натурального логарифма), і що це справедливо у більш загальному випадку. Правило оптимальної зупинки передбачає стратегію відмови першим які проходять співбесіду, а потім вибору першого претендента, який є кращим за всіх претендентів, опитаних на даний момент (або продовження до останнього претендента, якщо цього ніколи не відбувається). Іноді цю стратегію називають правилом зупинки , оскільки ймовірність зупинитися на найкращому претенденті за допомогою цієї стратегії вже приблизно для помірних значень . Одна з причин, чому проблемі секретаря приділено так багато уваги, полягає в тому, що оптимальна стратегія для цієї проблеми (правило зупинки) проста і вибирає єдиного найкращого кандидата приблизно в 37 % випадків, незалежно від того, чи є 100 чи 100 мільйонів претендентів[4].

Формулювання

[ред. | ред. код]

Хоча існує багато варіацій, основну проблему можна сформулювати так[5]:

  1. Існує єдине вакантне місце.
  2. Є n претендентів на посаду і значення n відоме.
  3. Про кожного претендента можна сказати, кращий він за іншого чи гірший.
  4. Претенденти опитуються послідовно у випадковому порядку, причому кожен порядок є однаково ймовірним.
  5. Одразу після співбесіди претендент приймається або відхиляється, і рішення не підлягає скасуванню.
  6. Рішення прийняти або відхилити претендента може ґрунтуватися лише на відносних рангах претендентів, з якими на даний момент було проведено співбесіду.
  7. Метою загального рішення є найвища ймовірність вибору найкращого претендента з усієї групи. Це еквівалентно максимізації очікуваної нагороди, при цьому виграш визначається як одиниця для найкращого претендента та нуль в інших випадках.

Кандидат визначається як претендент, який під час співбесіди є кращим за всіх попередніх співбесід. Пропустити вживається в значенні «відмовити відразу після співбесіди». Оскільки метою завдання є вибір єдиного найкращого претендента, для прийняття розглядатимуться лише кандидати. «Кандидат» у цьому контексті відповідає поняттю запису в перестановці.

Виведення оптимальної стратегії

[ред. | ред. код]

Оптимальним підходом для цієї задачі є правило зупину. Згідно з ним, інтерв'юер відхиляє перших r − 1 претендентів (нехай претендент M буде найкращим серед цих r — 1 претендентів), а потім вибирає першого наступного претендента, який кращий за претендента M. Можна показати, що оптимальна стратегія належить цьому класу стратегій[джерело?]. (Зауважте, що ми ніколи не повинні вибирати претендента, який не є найкращим, якого ми бачили досі, оскільки він не може бути найкращим претендентом у цілому). Для довільного r розглянемо ймовірність того, що обрано найкращого претендента.

Сума не визначена для r = 1, але в цьому випадку єдиною можливою стратегією є вибір першого претендента, отже P(1) = 1/n. Ця сума отримана завдяки спостереженню, що якщо претендент i є найкращим претендентом, тоді він вибирається тоді і тільки тоді, коли найкращий претендент серед перших i − 1 претендентів є серед перших r − 1 претендентів, яких було відхилено. Якщо спрямувати n до нескінченності та позначити як границю (r−1)/n, використовуючи t замість (i−1)/n і dt замість 1/n, суму можна наблизити інтегралом

Беручи похідну від P(x) за , прирівнюючи її до 0 та вирішуючи для змінної x, ми знаходимо, що оптимальне x дорівнює 1/e. Таким чином, оптимальна зупинка наближується до n/e зі збільшенням n і найкращий претендент вибирається з імовірністю 1/e.

Для малих значень n оптимальне r також можна отримати стандартними методами динамічного програмування. Оптимальні граничні значення r та ймовірність вибору найкращої альтернативи P для кількох значень n наведені в наступній таблиці[ком 1].

1 2 3 4 5 6 7 8 9 10
1 1 2 2 3 3 3 4 4 4
1.000 0.500 0.500 0.458 0.433 0.428 0.414 0.410 0.406 0.399

Ймовірність вибору найкращого кандидата в класичній проблемі секретаря збігається до .

Альтернативне рішення

[ред. | ред. код]

Ця задача та кілька її модифікацій можуть бути розв'язані (включно з доказом оптимальності) простим способом за допомогою алгоритму шансів, який також має інші застосування. Модифікації проблеми секретаря, які можна розв'язати за допомогою цього алгоритму, включають випадкову доступність претендентів, більш загальні гіпотези про претендентів, які можуть бути цікавими для особи, яка приймає рішення, групові інтерв'ю претендентів, а також певні моделі для випадкової кількості претендентів[джерело?].

Обмеження

[ред. | ред. код]

Розв'язання проблеми секретаря має сенс застосовувати лише тоді, коли є виправданим припущення, що претенденти не знають про застосовану стратегію прийняття рішень, оскільки перші претенденти взагалі не мають шансів і тому можуть не з'явитися на співбесіду.

Одним з важливих недоліків застосування рішення класичної проблеми секретаря є те, що кількість претендентів має бути відома заздалегідь, що рідко трапляється. Один із способів подолання цієї проблеми — припустити, що кількість заявників є випадковою величиною із відомим розподілом (Пресман і Сонін, 1972). Однак для цієї моделі оптимальне рішення, як правило, набагато складніше. Крім того, оптимальна ймовірність успіху тепер вже не близька до 1/e, а зазвичай нижча. Це можна тлумачити як «ціну» за відсутність інформації про кількості претендентів. Однак у цієї моделі ціна висока. Залежно від вибору розподілу , оптимальна ймовірність виграшу може наближатися до нуля. Пошук способів вирішення цієї нової проблеми призвів до нової моделі, яка дає так званий 1/e-закон найкращого вибору.

1/e-закон найкращого вибору

[ред. | ред. код]

Суть моделі базується на ідеї, що життя є послідовним і що проблеми реального світу виникають у реальному часі. Крім того, легше оцінити проміжки часу, коли конкретні події (прибуття претендентів) мають відбуватися частіше (якщо вони взагалі відбуваються), ніж оцінювати розподіл кількості конкретних подій, які відбуватимуться. Ця ідея призвела до так званого уніфікованого підходу (1984): Модель визначається наступним чином: претендент має бути вибраний на певному часовому інтервалі із невідомої кількості претендентів, які можуть бути оцінені за рейтингом. Мета полягає в тому, щоб максимізувати ймовірність вибору лише найкращих претендентів за гіпотези, що всі послідовності прибуття претендентів різного рангу однаково ймовірні. Припустимо, що всі претенденти мають однакову, але незалежну один від одного щільність функції часу прибуття на , і нехай позначає відповідну функцію розподілу часу прибуття, тобто

, .

Нехай таке, що Розглянемо стратегію очікування та спостереження за всіма претендентами до часу а потім виберемо, якщо це можливо, першого кандидата після часу , кращого за всіх попередніх. Тоді ця стратегія, яка називається 1/e-стратегія, має такі властивості:

Стратегія 1/e

(i) дає для всіх ймовірність успіху принаймні 1/e,
(ii) оптимальна стратегія мінімаксу коли невідомо,
(iii) не вибирає жодного з претендентів (якщо є принаймні один претендент) з імовірністю, яка точно дорівнює 1/e.

1/e-закон, доведений у 1984 році Ф. Томасом Брюссом[en], став несподіванкою. Причина полягала в тому, що приблизне значення 1/e раніше вважалося недосяжним у моделі для невідомого , тоді як це значення 1/e тепер було досягнуто як нижня межа ймовірності успіху, і це в моделі з, можливо, набагато слабшими гіпотезами (див., наприклад, Math. Reviews 85:m).

Однак існує багато інших стратегій, які досягають (i) і (ii) і, крім того, працюють набагато краще, ніж 1/e-стратегія одночасно для всіх >2. Простим прикладом є стратегія, яка вибирає (якщо це можливо) першого відносно найкращого кандидата після часу за умови, що принаймні один претендент з'явився до цього часу, а в іншому випадку вибирає (якщо це можливо) другого відносно найкращого кандидата після часу [6].

1/e-закон іноді плутають із розв'язком класичної проблеми секретаря, описаної вище, через подібну роль числа 1/e. Однак у 1/e-законі, ця роль є більш загальною. Результат також сильніший, оскільки він справедливий для невідомої кількості претендентів і оскільки модель, заснована на розподілі часу прибуття F є більш сприйнятливою для практичного застосування.

Гра гугол

[ред. | ред. код]

У статті «Хто вирішив проблему секретаря?» (Фергюсон[en], 1989)[1], стверджується, що проблема секретаря вперше з'явилася в друкованому вигляді в колонці «Математичні ігри»[en] Мартіна Гарднера в лютому 1960 року в Scientific American:

Попросіть когось взяти довільну кількість аркушів, і на кожному аркуші написати позитивне число. Числа можуть варіюватися від дрібних дробів одиниці до числа гугол (одиниця з сотнею нулів) або навіть більше. Ці аркуші перевертають лицьовою стороною вниз і перемішують на столі. По черзі ви перевертаєте аркуші стороною вгору. Мета полягає в тому, щоб припинити гортати аркуші, коли ви дійдете до числа, яке, на вашу думку, є найбільшим у серії. Ви не можете повернутися назад і вибрати раніше перевернутий аркуш. Якщо ви перегортаєте всі аркуші, то, звичайно, ви повинні вибрати останній[7].

Фергюсон зазначив, що гра секретаря залишилася невирішеною, як гра з нульовою сумою з двома протидіючими гравцями[1]. У цій грі:

  • Аліса, поінформований гравець, таємно пише різні числа на картках.
  • Боб, «зупиняючий» гравець, спостерігає за числами і може припинити перевертання карток коли забажає, виграючи, якщо остання повернута картка має загальну максимальне число.
  • Боб хоче вгадати максимальне число з якомога більшою ймовірністю, тоді як мета Аліси полягає в тому, щоб ця ймовірність була якомога нижчою.

Така постановка проблеми має дві відмінності від основної проблеми секретаря:

  • Алісі не має записувати числа цілком випадково. Вона може записати їх відповідно до будь-якого спільного розподілу імовірностей щоб ввести в оману Боба.
  • Боб спостерігає за фактичними значеннями, написаними на картках, які він може використовувати у своєму процесі прийняття рішень.

Аналіз стратегії

[ред. | ред. код]

Аліса спочатку записує n чисел, які потім перемішує. Отже, їх порядок не має значення, тобто числа Аліси мають бути випадковою послідовністю змінних[en] . Тоді стратегія Аліси полягає лише у виборі найскладнішої послідовності випадкових змінних з множини взаємозамінних послідовностей.

Стратегію Боба можна формалізувати як правило зупинки для послідовності .

Ми кажемо, що правило зупинки для Боба є стратегією зупинки відносного рангу, якщо воно залежить лише від відносних рангів , а не від їх числових значень. Іншими словами, це еквівалентно тому, що хтось таємно втрутився після того, як Аліса вибрала свої номери, і змінив кожне число в на його відносний ранг (впорядковуючи рівні значення довільним чином). Наприклад, змінюється на або з рівною ймовірністю. Це еквівалентно тому, якби Аліса застосувала взаємозамінну випадкову перестановку до . Тепер, оскільки єдина взаємозамінна випадкова перестановка  — це просто рівномірний розподіл усіх перестановок , оптимальна стратегія зупинки відносного рангу є оптимальним правилом зупинки для проблеми секретаря, наведеної вище, з ймовірністю виграшуТоді мета Аліси полягає в тому, щоб переконатися, що Боб не зможе діяти краще, ніж стратегія зупинки відносного рангу.

Згідно з правилами гри, послідовність Аліси має бути взаємозамінною, але щоб досягти успіху в грі, Аліса не повинна вибирати незалежну послідовність. Якщо Аліса вибере числа незалежно за якимось фіксованим розподілом, це дозволить Бобу грати краще. Щоб зрозуміти це інтуїтивно, уявіть, що , і Аліса вибирає обидва числа за нормальним розподілом , незалежно один від одного. Тоді якщо Боб перегорне першу картку і побачить , то він може цілком впевнено перевернути другу картку, а якщо Боб переверне першу картку і побачить , то він зможе досить впевнено вибирати число на першій картці. Аліса може діяти краще, вибравши які позитивно корелюють.

Отже, повністю формальна постановка проблеми виглядає так:

Чи існує взаємозамінна послідовність випадкових величин , така, що для будь-якого правила зупинки , ?

Рішення

[ред. | ред. код]

При , якщо Боб грає за оптимальною стратегією зупинок відносного рангу, ймовірність його виграшу становить 1/2. Дивовижно, що для Аліси не існує стратегії мінімаксу, що тісно пов'язане з парадоксом Т. Ковера[8] та парадоксом двох конвертів. Зокрема, Боб може використовувати таку стратегію: генерується випадкове число . Якщо , вибирається , інакше — . З цією стратегією Боб може виграти з ймовірністю, що перевищує 1/2. Припустімо, що числа Аліси різні, тоді за умови, що , Боб виграє з імовірністю 1/2, але за умови , Боб перемагає з імовірністю 1.

Зауважте, що випадкове число можна взяти з будь-якого випадкового розподілу, якщо має ненульову ймовірність.

Однак для будь-якого , Аліса може побудувати взаємозамінну послідовність так, що ймовірність виграшу Боба становить не більше [1].

Але для відповідь така: Аліса може вибирати випадкові числа (які є залежними випадковими змінними) таким чином, що Боб не може грати краще, ніж за допомогою класичної стратегії зупинки на основі відносних рангів[9].

Ефективність евристичних методів

[ред. | ред. код]

Решта статті знову стосується проблеми секретаря для відомої кількості претендентів.

Очікувана ймовірність успіху для трьох евристичних методів

Штейн, Сіл та Рапопорт (2003) вивели очікувані ймовірності успіху для кількох психологічно правдоподібних евристичних методів, які можуть бути використані в проблемі секретаря. Вони досліджували такі евристичні методи:

  • Правило відсікання: не приймати жодного з перших y претендентів; після цього вибирати першого наступного претендента (тобто претендента з відносним рангом 1). Це правило має як окремий випадок оптимальну стратегію для класичної проблеми секретаря, для якої y = r.
  • Правило підрахунку кандидатів: вибирати y-го претендента. Зауважте, що це правило не обов'язково пропускає претендентів; правило ґрунтується виключно на кількості претендентів, які пройшли співбесіду, а не на будь-якій інформації про претендентів, що залишилися, чи загальному розмірі групи претендентів.
  • Правило послідовних невідповідних претендентів: вибрати першого відповідного претендента після співбесід з y невідповідних претендентів (тобто претендентів з відносним рангом > 1).

Кожний евристичний метод має один параметр y. На рисунку (показано праворуч) показано очікувану ймовірність успіху для кожної евристичного метода як функцію y для задач із n = 80.

Варіант з вимірюваним виграшем (англ. Cardinal payoff variant)

[ред. | ред. код]

Пошук єдиного найкращого кандидата може здатися досить складною метою. Можна уявити, що інтерв'юер скоріше найме претендента з вищим рангом, ніж претендента з нижчим рангом, і не намагатиметься найняти лише найкращого претендента. Тобто інтерв'юер виграє від вибору претендента, який не обов'язково є найкращим, і цей виграш збільшується разом із цінністю обраного претендента.

Щоб змоделювати цю проблему, припустімо, що претендентів мають «справжні» значення випадкової величини X, згенеровані незалежно і однаково за рівномірним розподілом на [0, 1]. Подібно до класичної проблеми, описаної вище, інтерв'юер тільки спостерігає, чи є кожен претендент на даний момент найкращим (кандидат), повинен відразу прийняти або відхилити кожного претендента, і повинен прийняти останнього претендента, якщо досягнуто кінця списку. (Уточнимо, що, інтерв'юер не дізнається фактичний відносний ранг кожного претендента. Інтерв'юер дізнається лише про те, чи має претендент відносний ранг 1). Однак у цій версії виграш визначається справжньою цінністю обраного претендента. Наприклад, якщо інтерв'юер обирає претендента, справжня цінність якого дорівнює 0,8, то інтерв'юер отримає 0,8. Мета інтерв'юера полягає в тому, щоб максимізувати очікувану цінність обраного претендента.

Оскільки цінність претендентів згенеровано незалежно і однаково за рівномірним розподілом на [0, 1], математичне сподівання t-го претендента, враховуючи, що визначається як

Як і в класичній задачі, оптимальна стратегія визначається порогом, який для цієї проблеми ми позначатимемо , за якого інтерв'юер повинен почати приймати претендентів. Берден показав, що c є або або [10]. (Насправді, це значення, ближче до .) Це випливає з того факту, що враховуючи проблему з претендентами, очікуваний виграш для деякого довільного порогу є

Диференціюючи за c, отримуємо

Навчання в парадигмі частково-інформаційного послідовного пошуку. Числа відображають очікувані значення кандидатів на основі їхнього відносного рейтингу (із загальної кількості претендентів m, побачених на даний момент) у різних точках пошуку. Очікування розраховуються на основі випадку, коли їх значення рівномірно розподілені між 0 і 1. Інформація про відносний ранг дозволяє інтерв'юеру точніше оцінювати претендентів, оскільки вони накопичують більше точок даних для їх порівняння.

Оскільки для всіх допустимих значень , ми знаходимо, що максимізується при . Оскільки V є опуклою функцією у , оптимальним цілочисельним порогом має бути або . Таким чином, для більшості значень інтерв'юер почне приймати претендентів раніше у версії з вимірюваним виграшем, ніж у класичній версії, де метою є вибір єдиного найкращого претендента. Зауважте, що це не асимптотичний результат: він справедливий для всіх . Цікаво, що якщо кожен із претендентів має фіксоване окреме значення від до , тоді максимізується при , з тими самими міркуваннями щодо опуклості, що й раніше[11]. Для інших відомих розподілів оптимальну стратегію можна розрахувати за допомогою динамічного програмування.

Більш загальна форма цієї проблеми, запропонована Пеллі та Кремером (2014)[12], передбачає, що під час інтерв'ю з новим претендентом, інтерв'юер порівнює рейтинг претендента відносно всіх претендентів, яких опитували раніше. Ця модель узгоджується з уявленнями про те, що інтерв'юер навчається, продовжуючи процес пошуку, накопичуючи набір минулих даних, які можна використовувати для оцінки нових претендентів. Перевага цієї так званої часткової інформаційної моделі полягає в тому, що рішення та результати, досягнуті з урахуванням інформації про відносний ранг, можна безпосередньо порівняти з відповідними оптимальними рішеннями та результатами, якби інтерв'юер отримав повну інформацію про цінність кожного претендента. Цей варіант проблеми з повною інформацією, в якій претендентів відбирають незалежно від відомого розподілу, а інтерв'юер прагне максимізувати очікувану цінність обраного кандидата, спочатку розв'язали Мозер (1956)[13], Сакагучі (1961)[14] і Карлін (1962).

Інші варіанти задачі

[ред. | ред. код]

Є кілька варіантів задачі секретаря, які також мають прості та елегантні рішення.

Вибір другого найкращого претендента з однієї спроби

[ред. | ред. код]

Один варіант замінює мету вибору найкращого претендента на мету вибору другого найкращого[15][16][17]. Роберт Дж. Вандербей[en] називає це проблемою «випускників аспірантури», стверджуючи, що «найкращі» випускники підуть до Гарварду. Для цієї задачі ймовірність успіху для парної кількості заявників дорівнює . Ця ймовірність прямує до 1/4 коли n прямує до нескінченності, ілюструючи той факт, що легше вибрати найкращого претендента, ніж другого за найкращим.

Вибір k кращих претендентів, використовуючи k спроб

[ред. | ред. код]

Розглянемо задачу вибору k найкращих претендентів з n претендентів, використовуючи k спроб.

Загалом, метод оптимального прийняття рішення починається зі інтерв'ю з претендентами, жоден з яких не вибирається; потім вибирається кожний претендент, який є кращим за перших претендентів, доки список претендентів не буде вичерпано або не буде обрано найкращих k претендентів. Якщо залишається постійним, коли , то ймовірність успіху збігається до [18]. Відповідно до Вандербея (1980), якщо , то ймовірність успіху дорівнює .

Вибір найкращого претендента, використовуючи кілька спроб

[ред. | ред. код]

У цьому варіанті гравець має спроб і виграє, якщо будь-який вибір є найкращим. Оптимальна стратегія для цієї проблеми належить до класу стратегій, визначених набором порогових чисел , where .

Зокрема, уявіть, що у вас є листів про прийняття на роботу, позначених від до . У вас буде службовців з найму, кожен з яких триматиме по одному листу. Ви продовжуєте проводити співбесіди з претендентами та розміщуєте їх у таблиці, яку бачить кожен зі службовців. Тепер службовець надішле свій лист про прийняття на роботу першому кандидату, який є кращим за всіх кандидатів від до . (Невикористані листи про прийняття за замовчуванням надаються останнім претендентам, як і в стандартній проблемі секретаря)[19].

При , кожне , для деякого раціонального числа [20].

Імовірність виграшу

[ред. | ред. код]

Коли , ймовірність виграшу збігається до . Загалом, для додатних цілих чисел , ймовірність виграшу збігається до , де [20].

Гілберт, Мостеллер (1966) обчислили ймовірність до , де .

Matsui, Ano (2016) запропонували загальний алгоритм. Наприклад, .

Експериментальні дослідження

[ред. | ред. код]

Психологи-експериментатори та економісти вивчали поведінку реальних людей щодо прийняття рішень в ситуаціях, схожих на проблему секретаря[21]. Значною мірою ця робота показала, що люди, як правило, припиняють пошук надто рано. Принаймні частково це можна пояснити вартістю оцінювання претендентів. Це може свідчити про те, що у реальному світі люди недостатньо довго чекають, коли стикаються з проблемами, де альтернативи рішення зустрічаються послідовно. Наприклад, намагаючись вирішити, на якій автозаправній станції вздовж шосе зупинитися, щоб заправити автомобіль, люди можуть зупинитися раніше, ніж слід. В цьому випадку, вони, як правило, платять за паливо більше, ніж якби вони шукали довше. Те ж саме може бути вірно, коли люди шукають авіаквитки в Інтернеті. Експериментальне дослідження таких проблем, як проблема секретаря, іноді називають дослідженням поведінкових операцій[en].

Нейронні кореляти

[ред. | ред. код]

Хоча є багато нейронаукових досліджень щодо інтеграції інформації, або репрезентації переконань у завданнях сприйняття рішень тваринами[22][23] і людьми[24], відносно мало відомо про те, як приймається рішення припинити збір інформації.

Дослідники вивчали нейронні основи вирішення проблеми секретаря у здорових добровольців за допомогою функціональної МРТ[25]. Марковський процес вирішування використовувався для кількісного визначення цінності продовження пошуку в порівнянні з поточним варіантом. Рішення прийняти чи відхилити варіант залучали тім'яну та дорсолатеральну префронтальну кору, а також смугасте тіло, острівцеву кору та передню поясну частину[en]. Таким чином, області мозку, які раніше були залучені до інтеграції доказів і представлення винагород кодують значення порогів, які викликають рішення про вибір.

Історія

[ред. | ред. код]

Ймовірно, проблема секретаря була представлена ​​в 1949 році Меррілом М. Фладом[en], який назвав її проблемою нареченої в лекції, яку він прочитав того року. Він кілька разів посилався на цю проблему протягом 1950-х років, наприклад, у виступі на конференції в Пердью 9 травня 1958 року, і згодом вона стала широко відомою у фольклорі, хоча в той період нічого не було опубліковано. У 1958 році він надіслав листа Леонарду Гіллману[en], і приблизно дюжину копій друзям, у тому числі Семюелю Карліну[en] та Дж. Роббінсу, з описом доказу оптимальної стратегії з додатком Р. Палермо, який довів, що серед усіх стратегій домінує стратегія, яку можна сформулювати як «беззастережно відхилити перших p претендентів, потім прийняти наступного претендента, який кращий з перших p»[26].

Першу публікацію, ймовірно, зробив Мартін Ґарднер в журналі Scientific American в лютому 1960 року. Він дізнався про задачу секретаря від Джона Х. Фокса молодшого та Л. Джеральда Марні, які незалежно один від одного придумали еквівалентну проблему в 1958 році; вони назвали її «грою гугол». Фокс і Марні не мали оптимального рішення; Гарднер звернувся за порадою до Лео Мозера[en], який (разом з Дж. Р. Паундером) надав коректний аналіз для публікації в журналі. Незабаром після цього кілька математиків написали Гарднеру, щоб розповісти йому про еквівалентну проблему, про яку вони дізналися в неофіційних розмовах, і всі ці чутки, швидше за все, можна простежити до оригінальної роботи Флада[27].

1/e-закон найкращого вибору належить Ф. Томасу Брюссу[en][28].

Фергюсон має велику бібліографію та вказує на те, що подібну (але іншу) проблему розглядав Артур Кейлі 1875 році, а ще раніше Йоганн Кеплер який витратив 2 роки на дослідження 11 кандидатів на шлюб протягом 1611—1613 років після смерті його першої дружини[29].

Комбінаторне узагальнення

[ред. | ред. код]

Проблему секретаря можна узагальнити на випадок, коли є кілька різних робіт. Так само, є претендентів, які з'являються у випадковому порядку. Коли претендент з'являється, він відкриває набір невід'ємних чисел. Кожне значення визначає його кваліфікацію для однієї з робіт. Адміністратор повинен не тільки прийняти рішення про те, брати претендента на роботу чи ні, але і призначити його на одну з вакансій на постійній основі. Мета полягає в тому, щоб знайти і призначити претендентів так, щоб сума кваліфікацій була якомога більшою. Ця проблема ідентична пошуку відповідності максимальної ваги в двочастковому графі зі зваженими ребрами, де вузлів однієї сторони з'являються у випадковому порядку. Таким чином, це окремий випадок онлайн-проблеми двочасткового зіставлення.

Шляхом узагальнення класичного алгоритму для проблеми секретаря можна отримати призначення, де очікувана сума кваліфікацій лише в разів менше, ніж оптимальне (офлайн) призначення[30].

Див. також

[ред. | ред. код]

Примітки

[ред. | ред. код]
  1. а б в г Ferguson, Thomas S. (August 1989). Who Solved the Secretary Problem?. Statistical Science (англ.). 4 (3): 282—289. doi:10.1214/ss/1177012493.
  2. Hill, Theodore P. (2009). Knowing When to Stop. American Scientist (англ.). 97 (2): 126—133. doi:10.1511/2009.77.126. ISSN 1545-2786. S2CID 124798270. For French translation, see cover story in the July issue of Pour la Science (2009).
  3. Thomson, Jonny (21 April 2022). Mathematicians suggest the "37% rule" for your life's biggest decisions. Big Think (англ.). Процитовано 6 February 2024.
  4. С. М. Гусейн-Заде, Разборчивая невеста. с. 18, М.: МЦНМО, 2003
  5. С. М. Гусейн-Заде. Разборчивая невеста, с. 3-4, М.: МЦНМО, 2003
  6. Gnedin, 2021.
  7. Gardner, 1966.
  8. Cover, Thomas M. (1987), Cover, Thomas M.; Gopinath, B. (ред.), Pick the Largest Number, Open Problems in Communication and Computation (англ.), New York, NY: Springer, с. 152, doi:10.1007/978-1-4612-4808-8_43, ISBN 978-1-4612-4808-8, процитовано 25 червня 2023
  9. Gnedin, 1994.
  10. Bearden, 2006.
  11. Jones, Maxwell; Nene, Advait (20 серпня 2024). Secretary Problem Variant Deep Dive (англ.).
  12. Palley, Asa B.; Kremer, Mirko (8 липня 2014). Sequential Search and Learning from Rank Feedback: Theory and Experimental Evidence. Management Science (англ.). 60 (10): 2525—2542. doi:10.1287/mnsc.2014.1902. ISSN 0025-1909.
  13. Moser, Leo (1956). On a problem of Cayley. Scripta Math (англ.). 22: 289—292.
  14. Sakaguchi, Minoru (1 червня 1961). Dynamic programming of some sequential sampling design. Journal of Mathematical Analysis and Applications (англ.). 2 (3): 446—466. doi:10.1016/0022-247X(61)90023-3. ISSN 0022-247X.
  15. Rose, John S. (1982). Selection of nonextremal candidates from a random sequence. J. Optim. Theory Appl. (англ.). 38 (2): 207—219. doi:10.1007/BF00934083. ISSN 0022-3239. S2CID 121339045.
  16. Szajowski, Krzysztof (1982). Optimal choice of an object with ath rank. Matematyka Stosowana. Annales Societatis Mathematicae Polonae, Series III (англ.). 10 (19): 51—65. doi:10.14708/ma.v10i19.1533. ISSN 0137-2890.
  17. Vanderbei, Robert J. (21 червня 2021). The postdoc variant of the secretary problem. Mathematica Applicanda. Annales Societatis Mathematicae Polonae, Series III (англ.). 49 (1): 3—13. doi:10.14708/ma.v49i1.7076. ISSN 2299-4009.
  18. Girdhar, Dudek, 2009.
  19. Гілберт, Мостеллер (1966).
  20. а б Matsui, Ano (2016).
  21. Bearden, Murphy, and Rapoport, 2006; Bearden, Rapoport, and Murphy, 2006; Seale and Rapoport, 1997; Palley and Kremer, 2014
  22. Shadlen, M. N.; Newsome, W. T. (23 January 1996). Motion perception: seeing and deciding. Proceedings of the National Academy of Sciences (англ.). 93 (2): 628—633. Bibcode:1996PNAS...93..628S. doi:10.1073/pnas.93.2.628. PMC 40102. PMID 8570606.
  23. Roitman, Jamie D.; Shadlen, Michael N. (1 November 2002). Response of Neurons in the Lateral Intraparietal Area during a Combined Visual Discrimination Reaction Time Task. The Journal of Neuroscience (англ.). 22 (21): 9475—9489. doi:10.1523/JNEUROSCI.22-21-09475.2002. PMC 6758024. PMID 12417672.
  24. Heekeren, Hauke R.; Marrett, Sean; Ungerleider, Leslie G. (9 May 2008). The neural systems that mediate human perceptual decision making. Nature Reviews Neuroscience. 9 (6): 467—479. doi:10.1038/nrn2374. PMID 18464792. S2CID 7416645.
  25. Costa, V. D.; Averbeck, B. B. (18 October 2013). Frontal-Parietal and Limbic-Striatal Activity Underlies Information Sampling in the Best Choice Problem. Cerebral Cortex (англ.). 25 (4): 972—982. doi:10.1093/cercor/bht286. PMC 4366612. PMID 24142842.
  26. Flood, 1958.
  27. Gardner, 1966, Problem 3.
  28. Bruss, 1984.
  29. Ferguson, 1989.
  30. Kesselheim, Thomas; Radke, Klaus; Tönnis, Andreas; Vöcking, Berthold (2013). An Optimal Online Algorithm for Weighted Bipartite Matching and Extensions to Combinatorial Auctions. Algorithms – ESA 2013. Lecture Notes in Computer Science (англ.). Т. 8125. с. 589—600. doi:10.1007/978-3-642-40450-4_50. ISBN 978-3-642-40449-8.

Посилання

[ред. | ред. код]

Посилання

[ред. | ред. код]

Пояснювальні примітки

[ред. | ред. код]
  1. import numpy as np
    import pandas as pd
    
    # Визначаємо функцію, для якої потрібно знайти максимум
    def func(r, n):
        if r == 1:
            return 0
        else:
            return (r - 1) / n * np.sum([1 / (i - 1) for i in range(r, n+1)])
    
    # Визначаємо функцію для вирішення задачі для певного n
    def solve(n):
        values = [func(r, n) for r in range(1, n+1)]
        r_max = np.argmax(values) + 1
        return r_max, values[r_max - 1]
    
    # Визначаємо функцію для друку результатів у вигляді таблиці Markdown
    def print_table(n_max):
        # Готуємо дані для таблиці
        data = [solve(n) for n in range(1, n_max+1)]
        df = pd.DataFrame(data, columns=['r', 'Max Value'], index=range(1, n_max+1))
        df.index.name = 'n'
        
        # Перетворення DataFrame на Markdown і друк
        print(df.transpose().to_markdown())
    
    # Друк таблиці для n від 1 до 10
    print_table(10)