Перейти до вмісту

Конфіденційність пошукової системи

Матеріал з Вікіпедії — вільної енциклопедії.

Конфіденційність в пошукових системах — це складова конфіденційності в інтернеті, яка стосується даних користувачів, що збираються пошуковими системами. Проблеми конфіденційності особи в пошукових системах, можуть набувати різних форм, наприклад, через здатність пошукових систем зберігати окремі пошукові запити, історію переглядів[en], IP-адреси та кукі-файли, а також аналізувати поведінку користувачів.[1]

Хоч власники пошукових систем часто стверджують, що останні збирають дані для того, щоб краще адаптувати результати пошуку до конкретного користувача та надати йому кращий досвід пошуку, вони також можуть зловживати цими даними та порушувати недоторканність приватного життя, продаючи накопичені дані рекламодавцям для отримання прибутку.[1]

Для осіб, зацікавлених у збереженні своєї приватності під час пошуку в інтернеті, існують такі варіанти збереження конфіденційності, якː використання програмного забезпечення на кшталт браузера Tor, яке робить місцеперебування користувача та його особисту інформацію анонімними,[2] або використання пошукової системи, орієнтованої на конфіденційність.[3]

Політики конфіденційності пошукових систем

[ред. | ред. код]

На сайтах пошукових систем зазвичай публікується їх політика конфіденційності для того, щоб інформувати користувачів системи про те, які їхні дані можуть бути зібрані та з якою метою вони можуть бути використані.[4][5] Хоч ці політики можуть бути спробою забезпечити прозорість функціонування пошукової системи, але багато людей — її користувачів ніколи їх не читають.[6] Це пов'язано з принципом повідомлення та згоди, за яким побудовано багато політик конфіденційності.

Політика повідомлення та згоди, по суті, полягає в тому, що сайт показує користувачеві політику конфіденційності та просить його натиснути на кнопку, щоб погодитися з нею. Це робиться для того, щоб він міг вільно вирішити, чи продовжувати користуватися сайтом, чи ні.[7] Ще однією проблемою, пов'язаною з розміщенням політики конфіденційності, є те, що її важко зрозуміти багатьом користувачам.[5]

Типи даних, які можуть збирати пошукові системи

[ред. | ред. код]

Більшість пошукових систем можуть збирати особисту інформацію про своїх користувачів відповідно до власної політики конфіденційності. Ці дані можуть бути будь-якими — від інформації про місцеперебування до кукі-файлів, IP-адрес, історії пошукових запитів, історії переходів по сайтах та цифрових відбитків пристроїв.[3][4][8][9]

Дані користувачів можуть зберігатися в пошукових системах, якими вони користувались, протягом тривалого проміжку часу. Наприклад, дані, зібрані компанією Google про своїх користувачів, зберігаються до 9 місяців.[10][11] Деякі дослідження стверджують, що насправді цей термін становить 18 місяців.[12] Дані про користувачів використовуються розробниками пошукових системи з різними цілями, наприклад, для оптимізації та персоналізації їх результатів пошуку, цільового маркетингу,[7] а також для захисту користувачів від шахрайства та фішингових атак.[3] Такі дані можуть збиратися за допомогою кукі-файлів навіть тоді, коли користувач не увійшов до свого облікового запису або використовує іншу IP-адресу.[7]

Використання

[ред. | ред. код]

Персоналізація користувачів

[ред. | ред. код]

Пошукова система може створювати профіль користувача, який допомагає їй вирішити, які посилання слід показувати на різні пошукові запити, подані користувачем, або яку показувати йому рекламу.[8] На зібраних даних можуть використовувати алгоритми машинного навчання для вдосконалення моделі профілювання, щоб точніше передбачати, на що може натиснути той чи інший користувач.[13]

Одним із прикладів є те, як Google Scholar враховує історію публікацій користувача, щоб видавати йому результати, які вона вважає релевантними для нього.[1] Персоналізація також присутня у рекомендаційних системах Amazon та IMDb, які використовують попередньо зібрану інформацію про користувача, щоб пропонувати йому книги та фільми відповідно.[13] Для того, щоб відбувалася персоналізація, користувачеві не потрібно входити у свій обліковий запис.[2]

Таргетована реклама

[ред. | ред. код]

Маркетингова компанія DoubleClick, яка надавала послуги з інтернет-реклами, куплена Google 2008 року була дочірньою компанією останньої до червня 2018 року, коли Google провела ребрендинг DoubleClick і приєднала її до своєї маркетингової платформи Google Marketing Platform. Сайти, які співпрацювали з DoubleClick, зберігали на комп'ютерах користувачів кукі-файли, які відстежували всі сторінки з її рекламою. Коли корпорація Google готувалась до придбання DoubleClick, існувало занепокоєння з приводу того, що це дозволить їй створювати повніші профілі своїх користувачів, оскільки вона зможе додатково відстежувати відвідувані ними вебсайти.[14] Це може призвести до того, що користувачам показуватиметься реклама, яка буде ефективнішою завдяки використанню поведінкового таргетингу.[12]

Поліпшення якості пошуку

[ред. | ред. код]

Історії запитів користувачів до пошукових систем та їх переходів до результатів пошуку мають вирішальне значення для оптимізації пошукової видачі. Вони також допомагають розробляти алгоритми, які використовуються пошуковими системами для видачі результатів, таких як PageRank.[3]

Організації, що займаються питаннями конфіденційності

[ред. | ред. код]

Існують організації, такі як Electronic Privacy Information Center[en] (EPIC) та Privacy International, які зосереджені на захисті прав користувачів на конфіденційність.[3][7] Так, 2007 року EPIC подала скаргу до Федеральної торгової комісії США, стверджуючи, що Google не повинна мати можливості придбати DoubleClick на тій підставі, що це поставить під загрозу конфіденційність її користувачів.[7]

Сприйняття конфіденційності користувачами

[ред. | ред. код]

Були проведені експерименти з вивчення поведінки споживачів, коли їм надавали інформацію про рівень дотримання конфіденційності інтернет-магазинами, інтегруючи рейтинги конфіденційності з пошуковою системою. Для досліджуваної групи дослідники використовували пошукову систему під назвою Privacy Finder, яка сканує вебсайти та автоматично генерує піктограму, що показує рівень конфіденційності, які вони надають споживачеві, порівняно з політикою конфіденційності, яку споживач вказав як бажану для нього. Результати експерименту показали, що учасники основної групи, які користувалися пошуковою системою, що вказувала на рівень конфіденційності, купували товари з вебсайтів, які надавали їм вищий рівень конфіденційності, тоді як учасники контрольної групи обирали товари, які були найдешевшими.[15]

Етичні дискусії

[ред. | ред. код]

Позиція за збір даних

[ред. | ред. код]

Збір даних користувачів пошуковими системами можна розглядати як позитивну практику, оскільки це дозволяє пошуковій системі персоналізувати результати. Це означає, що користувачі отримуватимуть більш доречні результати та їм показуватиметься більш релевантна реклама, коли для цього будуть використовуватися їхні дані, такі як минулі пошукові запити, інформація про місцеперебування та кліки. Крім того, пошукові системи, як правило, безкоштовні для користувачів і можуть залишатися на плаву завдяки тому, що одним з основних джерел їхнього доходу є реклама, яка може бути більш ефективною, коли вона таргетована.[3]

Позиція проти збору даних

[ред. | ред. код]

Збір даних користувачів також можна розглядати як зловживання приватних компаній задля власної фінансової вигоди або як тактику нав'язливого спостереження. Пошукові системи можуть заробляти гроші на таргетованій рекламі, оскільки рекламодавці готові платити більше за показ своєї реклами найбільш зацікавленим споживачам. Крім того, коли пошукова система збирає та каталогізує великі обсяги даних про своїх користувачів, існує ймовірність їх витоку. Також державні органи можуть вимагати у пошукових систем надати дані певного користувача.[16] Інформація з бази даних пошукових запитів також може бути витребувана приватними особами для використання в цивільних справах, таких як розлучення або трудові спори.[7]

Випадки порушень конфіденційності даних

[ред. | ред. код]

Публікація пошукових даних AOL

[ред. | ред. код]

У 2006 році для дослідницьких цілей компанія AOL оприлюднила дані з близько 20 мільйонів пошукових запитів, зроблених приблизно 650 000 унікальними користувачами.[12] Хоч користувачам присвоїли унікальні ідентифікаційні номери замість їхніх імен, все одно за цими ідентифікаторами можна було встановити справжню особу багатьох із них включно, з їхнім приблизним місцеперебуванням, а також імена їхніх друзів та членів родини, проаналізувавши те, що вони шукали.[8][12] Прикладом цього є те, як New York Times ідентифікувала Тельму Арнольд за допомогою «зворотного пошуку».[7][12] Користувачі також іноді здійснюють так званий его-пошук[en], тобто вони шукають себе, щоб побачити, яка інформація про них є в інтернеті, що ще більше полегшує ідентифікацію нібито анонімних користувачів.[7] Багато пошукових запитів, опублікованих AOL, були викривальними або, в певному сенсі, надзвичайно приватними, наприклад, «як вбити свою дружину» або «чи можна всиновити дитину після спроби самогубства».[7] Ці дані були використані в кількох експериментах з вимірювання ефективності рішень для захисту конфіденційності користувачів.[1][17]

Google та Yahoo

[ред. | ред. код]

І Google, і Yahoo стали об'єктами китайської хакерської атаки у 2010 році. У той час як компанія Google серйозно відреагувала на цю ситуацію, найнявши нових інженерів з кібербезпеки та інвестувавши кошти в захист даних користувачів, Yahoo обрала м'якший підхід. Google почала платити хакерам за пошук вразливостей у 2010 році, тоді як Yahoo пішла цим шляхом у 2013 році. Після витоку даних, зробленим Едвардом Сноуденом, компанія Yahoo також була визнана як поширена хакерська мішень для шпигунів різних країн, але після цього Yahoo так і не надала своєму новопризначеному директору з інформаційної безпеки ресурси, щоб реально змінити ситуацію всередині компанії. У 2012 році Yahoo найняла Маріссу Майєр, яка раніше працювала в Google, на посаду нового генерального директора, але вона вирішила не вкладати багато коштів у безпеку Yahoo та навіть відмовилася від впровадження такого заходу безпеки, як примусового скидання всіх паролів користувачів після зломів сайту.[18]

Станом на кінець 2016 року Yahoo оголосила, що протягом 2013 і 2014 років зламано щонайменше 1,5 мільярда облікових записів її користувачів. Злом 2013 року скомпрометував понад мільярд акаунтів, а злом 2014 року — близько 500 мільйонів акаунтів. Скомпрометовані дані включали особисту інформацію, таку як номери телефонів, адреси електронної пошти та дати народження, а також такі дані, як питання безпеки, що використовуються для скидання паролів, та зашифровані паролі. Yahoo зробила заяву, в якій зазначила, що злами були результатом дій осіб, що фінансуються державою, а у 2017 році Міністерство юстиції США висунуло звинувачення двом російським розвідникам у змові з метою зламу Yahoo та крадіжки даних користувачів. Станом на 2016 рік, злами Yahoo у 2013 та 2014 роках були найбільшими за всю історію.[18]

У жовтні 2018 року стався витік даних Google+, який потенційно торкнувся близько 500 000 акаунтів, що призвело до закриття цієї платформи.[19]

Доступ державних органів до пошукових даних

[ред. | ред. код]

Державні органи можуть вимагати у пошукових систем надати дані користувачів з багатьох причин.[3] Так, у 2006 році уряд США вимагав цього в рамках Закону Про захист дітей в інтернеті[en], однак Google відмовилася виконати цю вимогу.[7] Хоча захист приватності дітей в інтернеті може вважатися благородною метою, існують сумніви щодо того, чи можуть державні органи мати доступ до таких персональних даних для її досягнення. В інших випадках вони можуть бути потрібні для цілей національної безпеки — доступ до баз даних пошукових запитів з метою запобігання терористичним атакам є поширеним прикладом.[16][9]

Ще одне занепокоєння щодо доступу державних органів до даних користувачів пошукових систем — це «розповзання функцій», термін, який в цьому випадку означає, що дані, спочатку зібрані державними органами для цілей національної безпеки, з часом можуть бути використані в інших цілях, наприклад, для стягнення боргів.[7]

Див. також

[ред. | ред. код]

Примітки

[ред. | ред. код]
  1. а б в г Pekala, Shayna. 2017. «Privacy and User Experience in 21st Century Library Discovery». Information Technology and Libraries36(2):48–58.
  2. а б Ridgway, Renee. 2017. «Against a Personalisation of the Self». Ephemera: Theory & Politics in Organization17(2):377–97.
  3. а б в г д е ж Lenard, Thomas M. and Paul H. Rubin. 2010. «In Defense of Data: Information and the Costs of Privacy». Policy & Internet2(1):1–56.
  4. а б Dolin, Ron A. 2010. «Search Query Privacy: The Problem of Anonymization». Hastings Science and Technology Law Journal2(2):137–82.
  5. а б Nissenbaum, Helen. 2011. «A Contextual Approach to Privacy Online». Daedalus, the Journal of the American Academy of Arts & Sciences140(4):32–48.
  6. Strahilevitz, Lior Jacob and Matthew B. Kugler. 2016. «Is Privacy Policy Language Irrelevant to Consumers?» The Journal of Legal Studies45(S2).
  7. а б в г д е ж и к л м Tene, Omer. 2008. «What Google Knows: Privacy and Internet Search Engines». Utah Law Review2008(4):1433–92.
  8. а б в Wicker, Jörg and Stefan Kramer. 2017. «The Best Privacy Defense Is a Good Privacy Offense: Obfuscating a Search Engine User's Profile». Data Mining and Knowledge Discovery31(5):1419–43.
  9. а б Squitieri, Chad. 2015. «Confronting Big Data: Applying the Confrontation Clause to Government Data Collection». Virginia Law Review101(7):2011–49.
  10. Viejo, Alexandre and Jordi Castellà-Roca. 2010. «Using Social Networks to Distort Users' Profiles Generated by Web Search Engines». Computer Networks 54(9):1343–57.
  11. Evans, David S. n.d. «The Online Advertising Industry: Economics, Evolution, and Privacy». The Journal of Economic Perspectives23(3):37–60.
  12. а б в г д Chiru, Claudiu. 2016. «Search Engines: Ethical Implications». Economics, Management, and Financial Markets11(1):162–67.
  13. а б van Otterlo, Martijn. 2014. «Automated Experimentation in Walden 3.0. : The Next Step in Profiling, Predicting, Control and Surveillance». Surveillance & Society 12(2):255–72.
  14. Church, Peter and Georgina Kon. 2007. «Google at the Heart of a Data Protection Storm». Computer Law & Security Report23(5):461–65.
  15. Tsai, Janice Y., Serge Egelman, Lorrie Cranor, and Alessandro Acquisti. 2011. «The Effect of Online Privacy Information on Purchasing Behavior: An Experimental Study». Information Systems Research22(2):254–68.
  16. а б Foley, Jayni. 2007. «Are Google Searches Private? An Originalist Interpretation of the Fourth Amendment in Online Communication Cases». Berkeley Technology Law Journal22(1):447–75.
  17. Pàmies-Estrems, David, Jordi Castellà-Roca, and Alexandre Viejo. 2016. «Working at the Web Search Engine Side to Generate Privacy-Preserving User Profiles». Expert Systems with Applications64:523–35.
  18. а б Trautman, Lawrence J. and Peter C. Ormerod. 2016. «Corporate Directors' and Officers' Cybersecurity Standard of Care: The Yahoo Data Breach». SSRN Electronic Journal66(5).
  19. Newman, Lily Hay (10 грудня 2018). A New Google+ Blunder Exposed Data From 52.5 Million Users. Wired. ISSN 1059-1028. Процитовано 29 травня 2019.