Een groep Amerikaanse techbedrijven en organisaties hebben een dataset omtrent COVID-19 gepubliceerd. De dataset is vrijgegeven onder de naar COVID-19 Open Research Dataset (CORD-19). Met deze data krijgen onderzoekers toegang tot populaire wetenschappelijke bronnen, om zo het gevecht tegen het virus te ondersteunen.

CORD-19 bestaat uit meer dan 24.000 artikelen die zijn geschreven over COVID-19, met onder andere informatie uit GitHub data archieven en andere onderzoek wat kan worden aangemerkt als niet-academisch. De dataset zal up to date worden gehouden met nieuwe informatie.

De initiatiefnemers geven aan dat de dataset “machine readable” is, wat de set geschikt maakt voor onderzoek door middel van machine learning. De Allen Institute for Artificial Intelligence, één van de grootste bijdrages aan het project, is er van overtuigd dat AI een grote rol kan spelen bij het oplossen van het probleem.

Microsoft is eveneens een grote spelers in dit project. “We moeten samenkomen als bedrijven, overheden en wetenschappers, en onze beste technologieën op het gebieden van biomedische geneeskunde, epidemiologie, AI en andere wetenschappen toepassen”, aldus Microsoft-Chief Scientific Officer Eric Horvitz.

Deze dataset is op initiatief van de Office of Science en Technology Policy vanuit het Witte Huis opgezet.