Перейти до вмісту

Semantic Scholar

Матеріал з Вікіпедії — вільної енциклопедії.
(Перенаправлено з S2CID)
Semantic Scholar
Логотип
Логотип
Посиланняsemanticscholar.org
ТипПошукова система
АвторІнститут штучного інтелекту ім. Аллена[en]
Започатковано2 листопада 2015[1]
Рейтинг Alexa758[2]

Семантичне вчення[джерело?], англ. Semantic Scholar — це дослідницький інструмент для наукової літератури на основі штучного інтелекту, розроблений в Інституті ШІ ім. Аллена та оприлюднений у листопаді 2015 року.[3] Він використовує досягнення в обробці природної мови для створення резюме для наукових робіт.[4] Команда Semantic Scholar активно досліджує використання штучного інтелекту в оброблянні природної мови, машинному навчанні, взаємодії людини з комп'ютером і пошуку інформації.[5]

Semantic Scholar починався як база даних, присвячена темам інформатики, геонауки та нейронауки.[6] Однак у 2017 році система почала включати до свого корпусу біомедичну літературу[en].[6] Станом на вересень 2022 року вони налічували понад 200 мільйонів публікацій з усіх галузей науки.[7]

Технології

[ред. | ред. код]

Semantic Scholar надає короткий виклад наукової літератури(Scientific literature) одним реченням. Однією з його цілей було вирішення проблеми читання численних заголовків і довгих анотацій на мобільних пристроях.[8] Цей інструмент також сприяє тому, щоб три мільйони наукових робіт, які публікуються щорічно, досягли читачів, оскільки, за оцінками, лише половина цієї літератури коли-небуть читається.[9]

Штучний інтелект використовується для вловлення змісту публікації, генеруючи його за допомогою «абстрактної» техніки.[4] У проекті використовується поєднання машинного навчання, обробляння природної мови та машинного бачення, щоб додати рівень семантичного аналізу до традиційних методів аналізу цитування та витягти відповідні цифри, таблиці, сутності та місця проведення з документів.[10][11]

На відміну від Google Scholar і PubMed, Semantic Scholar призначено для виділення найважливіших і впливових елементів публікації.[12] Технологія ШІ має виявляти, приховані зв'язки і зв'язки між темами досліджень.[13] Як і раніше, цитовані пошукові системи, Semantic Scholar також використовує графові структури, які включають Microsoft Academic Knowledge Graph, Springer Nature's SciGraph і Semantic Scholar Corpus.[14]

Кожній статті, розміщеній у Semantic Scholar, присвоюється унікальний ідентифікатор під назвою Semantic Scholar Corpus ID (скорочено S2CID). Наступний запис є прикладом:

Liu, Ying; Gayle, Albert A; Wilder-Smith, Annelies; Rocklöv, Joacim (March 2020). The reproductive number of COVID-19 is higher compared to SARS coronavirus. Journal of Travel Medicine. 27 (2). doi:10.1093/jtm/taaa021. PMID 32052846. {{S2CID|211099356}}.

Semantic Scholar є безкоштовним у використанні та на відміну від подібних пошукових систем (тобто Google Scholar) не шукає матеріали, які знаходяться «за стіною» платного доступу.[15][6]

Одне дослідження порівнювало пошукові можливості Semantic Scholar за допомогою систематичного підходу та виявило, що пошукова система була точною на 98,88 % при спробі розкрити дані.[15] У цьому ж дослідженні вивчалися інші функції Semantic Scholar, включно з інструменти для опитування метаданих, а також кілька інструментів цитування.[15]

Кількість користувачів і публікацій

[ред. | ред. код]

Станом на січень 2018 року, після проєкту 2017 року, який додав біомедичні статті та резюме тем, корпус Semantic Scholar включав понад 40 мільйонів робіт з інформатики та біомедицини.[16] У березні 2018 року Даг Реймонд, який розробляв ініціативи машинного навчання для платформи Amazon Alexa, був найнятий для керівництва проектом Semantic Scholar.[17] Станом на серпень 2019 року кількість включених метаданих статей (не фактичних PDF-файлів) зросла до понад 173 мільйонів[18] після додавання записів Microsoft Academic Graph.[19] У 2020 році партнерство між Semantic Scholar і University of Chicago Press Journals зробило всі статті, опубліковані в University of Chicago Press, доступними в корпусі Semantic Scholar.[20] Наприкінці 2020 року Semantic Scholar проіндексувало 190 мільйонів документів.[21]

У 2020 році кількість користувачів Semantic Scholar досягла семи мільйонів на місяць.[8]

Див. також

[ред. | ред. код]
  • Citation analysis – Examination of the frequency, patterns, and graphs of citations in documents
  • Citation index — Index of citations between publications
  • Knowledge extraction — Creation of knowledge from structured and unstructured sources
  • List of academic databases and search engines
  • Scientometrics — Study of measuring and analysing science, technology and innovation

Примітки

[ред. | ред. код]
  1. Jones, Nicola (2015). Artificial-intelligence institute launches free science search engine. Nature. doi:10.1038/nature.2015.18703. ISSN 1476-4687.
  2. https://www.alexa.com/siteinfo/semanticscholar.org
  3. Eunjung Cha, Ariana (3 листопада 2015). Paul Allen's AI research group unveils program that aims to shake up how we search scientific knowledge. Give it a try. The Washington Post. Архів оригіналу за 6 November 2019. Процитовано 3 листопада 2015.
  4. а б Hao, Karen (18 листопада 2020). An AI helps you summarize the latest in AI. MIT Technology Review (англ.). Процитовано 16 лютого 2021.
  5. Semantic Scholar Research. research.semanticscholar.org. Процитовано 22 листопада 2021.
  6. а б в Fricke, Suzanne (12 січня 2018). Semantic Scholar. Journal of the Medical Library Association (англ.). 106 (1): 145—147. doi:10.5195/jmla.2018.280. ISSN 1558-9439.
  7. Matthews, David (1 вересня 2021). Drowning in the literature? These smart software tools can help. Nature. Процитовано 5 вересня 2022. ...the publicly available corpus compiled by Semantic Scholar — a tool set up in 2015 by the Allen Institute for Artificial Intelligence in Seattle, Washington — amounting to around 200 million articles, including preprints.
  8. а б Grad, Peter (24 листопада 2020). AI tool summarizes lengthy papers in a sentence. Tech Xplore (англ.). Процитовано 16 лютого 2021.
  9. Allen Institute's Semantic Scholar now searches across 175 million academic papers. VentureBeat (амер.). 23 жовтня 2019. Процитовано 16 лютого 2021.
  10. Bohannon, John (11 листопада 2016). A computer program just ranked the most influential brain scientists of the modern era. Science. doi:10.1126/science.aal0371. Архів оригіналу за 29 квітня 2020. Процитовано 12 листопада 2016.
  11. Divvala S. PDFFigures 2.0: Mining figures from research papers — 2016.
  12. Semantic Scholar. International Journal of Language and Literary Studies. Процитовано 9 листопада 2021.
  13. Baykoucheva, Svetla (2021). Driving Science Information Discovery in the Digital Age (англ.). Chandos Publishing. с. 91. ISBN 978-0-12-823724-3.
  14. Jose, Joemon M.; Yilmaz, Emine; Magalhães, João; Castells, Pablo; Ferro, Nicola; Silva, Mário J.; Martins, Flávio (2020). Advances in Information Retrieval: 42nd European Conference on IR Research, ECIR 2020, Lisbon, Portugal, April 14–17, 2020, Proceedings, Part I (англ.). Cham, Switzerland: Springer Nature. с. 254. ISBN 978-3-030-45438-8.
  15. а б в Hannousse, Abdelhakim (2021). Searching relevant papers for software engineering secondary studies: Semantic Scholar coverage and identification role. IET Software (англ.). 15 (1): 126—146. doi:10.1049/sfw2.12011. ISSN 1751-8814.
  16. AI2 scales up Semantic Scholar search engine to encompass biomedical research. GeekWire (амер.). 17 жовтня 2017. Архів оригіналу за 19 січня 2018. Процитовано 18 січня 2018.
  17. Tech Moves: Allen Instititue Hires Amazon Alexa Machine Learning Leader; Microsoft Chairman Takes on New Investor Role; and More. GeekWire. 2 травня 2018. Архів оригіналу за 10 травня 2018. Процитовано 9 травня 2018.
  18. Semantic Scholar. Semantic Scholar. Архів оригіналу за 11 August 2019. Процитовано 11 серпня 2019.
  19. AI2 joins forces with Microsoft Research to upgrade search tools for scientific studies. GeekWire. 5 грудня 2018. Архів оригіналу за 25 серпня 2019. Процитовано 25 серпня 2019.
  20. The University of Chicago Press joins more than 500 publishers working with Semantic Scholar to improve search and discoverability. RCNi Company Limited (англ.). Процитовано 22 листопада 2021.
  21. Dunn, Adriana (14 грудня 2020). Semantic Scholar Adds 25 Million Scientific Papers in 2020 Through New Publisher Partnerships (PDF). Semantic Scholar. Архів оригіналу (PDF) за 15 листопада 2021. Процитовано 22 листопада 2021. [Архівовано 2021-11-15 у Wayback Machine.]

Посилання

[ред. | ред. код]