DBpedia — Vikipēdija Pāriet uz saturu

DBpedia

Vikipēdijas lapa
DBpedia
DBpedia logo
Izstrādātājs Leipcigas Universitāte, Berlīnes Brīvā Universitāte, OpenLink Software
Sākotnējā versija 23 January 2007
Stabilā versija DBpedia Snapshot 2022-03 / 2022.gada 2.maijs[1]
Progr. valoda Scala, Java, VSP
Operētājsistēma Virtuoso Universal Server
Veids Semantiskais tīmeklis, Linked Data
Licence GNU Vispārējā publiskā licence
Repozitorijs Labot šo Vikidatos
Tīmekļa vietne dbpedia.org

DBPedia ir projekts, kura mērķis ir iegūt strukturētu informāciju no Vikipēdijas. Iegūtā strukturētā informācija ir pieejama vispasaules tīmeklī.[2] No DBpedia lietotāji var iegūt informāciju par Vikipēdijas resursu īpašībām, to savstarpējo saistību, kā arī saites uz citām saistītām datu kopām.[3] Tims Bērnerss-Lī DBpedia projektu min kā vienu no pazīstamākajām Linked Data projekta daļām.[4]

DBpedia projektu uzsāka Berlīnes Brīvā Universitāte un Leipcigas Universitāte sadarbībā ar OpenLink Software kompāniju,[5] pirmā datu kopa tika publicēta 2007. gadā. Pateicoties brīvai licencei, datu kopu jebkurš var izmantot tālāk dažādos veidos.

Lielākā daļa Vikipēdijas satura ir rakstīta brīvā tekstā, tomēr Vikipēdijas rakstos atrodama arī strukturēta informācija: "infokastes", rakstu kategorijas, attēli, ģeogrāfiskas koordinātas, saites uz ārējiem resursiem. Šī informācija tiek apstrādāta un ievieta datu kopā, pret kuru var izpildīt vaicājumus.

2010. gada aprīlis: DBpedia datu kopa saturēja vairāk kā 3,4 miljonus lietu, tai skaitā vismaz 312 000 personu, 413 000 vietu (tai skaitā 311 000 apdzīvotu vietu), 94 000 mūzikas albumu, 49 000 filmas, 15 000 datorspēles, 140 000 organizācijas (tai skaitā 31 000 firmas un 31 000 mācību iestāžu), 146 000 sugu un 4600 slimību. Datu kopā ir šo lietu nosaukumi un īsi apraksti 92 dažādā valodā, 1 461 000000 saites uz attēliem, 5,5 miljoni saišu uz tīmekļa lapām, 4,8 miljoni saišu uz ārējām RDF datu kopām, 565 000 Vikipēdijas kategoriju un 75 000 YAGO kategoriju. Izmantojot šo datu kopu, iespējams kombinēt informāciju no vairākiem Vikipēdijas šķirkļiem vienlaicīgi. Piemēram, sagatavojot informāciju par rakstnieka darbiem, dati var tikt iegūti gan no autora šķirkļa, gan no atsevišķu rakstu darbu šķirkļiem.

DBpedia projekta sagatavotajām datu kopām tiek lietots RDF datu formāts.

2010. gada aprīlis: Datu kopa satur 1 miljardu informācijas vienību (RDF trijniekus). No tiem 257 miljoni trijnieku iegūti no angļu, un 766 miljoni no citu valodu Vikipēdijām.[6]

Pret DBpedia savākto faktuālo informāciju iespējams izpildīt vaicājumus, kuru atbilžu sagatavošanai būtu nepieciešama informācija no daudz dažādiem Vikipēdijas šķirkļiem. Vaicājumus formulē SPARQL valodā, tā ir RDF datiem paredzēta valoda, līdzīga SQL. Piemēram, iedomāsimies, ka interesējamies par japāņu mangas seriālu Tokyo Mew Mew un vēlamies atrast šī seriāla ilustratora citus darbus un to žanrus.

Tā kā DBpedia informāciju no Vikipēdijas šķirkļiem apkopo vienā datu kopā, ar šo vaicājumu varam iegūt interesējošo informāciju, pat precīzi nezinot, kurā Vikipēdijas šķirklī atrodas katrs informācijas fragments:

 PREFIX dbprop: <http://dbpedia.org/property/>
 PREFIX db: <http://dbpedia.org/resource/>
 SELECT ?who ?work ?genre WHERE { 
  db:Tokyo_Mew_Mew dbprop:illustrator ?who .
  ?work  dbpprop:author ?who .
  OPTIONAL { ?work dbpprop:genre ?genre } .
 }

DBpedia datu kopa ir RDF līmenī saistīta ar citām tīmeklī brīvi pieejamām datu kopām. Programmas var DBpedia datus izmantot un papildināt ar informāciju no šīm saistītajām datu kopām. 2010. gada aprīlī bija vairāk kā 4,8 miljoni saišu starp DBpedia un ārējām datu kopām, tai skaitā: Freebase, OpenCyc, UMBEL Arhivēts 2019. gada 27. augustā, Wayback Machine vietnē., GeoNames, MusicBrainz, CIA World Fact Book Arhivēts 2013. gada 10. maijā, Wayback Machine vietnē., DBLP Arhivēts 2010. gada 2. martā, Wayback Machine vietnē., Project Gutenberg, DBtune, Jamendo, Eurostat, Uniprot, Bio2RDF, ASV cilvēku skaitīšanas dati. [7][8] Saites uz DBpedia satur Thomson Reuters OpenCalais, avīzes The New York Times Linked Open Data projekti un Zemanta pakalpojums.[9][10][11] BBC izmanto DBpedia savu datu sakārtošanai.[12][13] Faviki ļauj veidot semantiskas atzīmes, izmanto DBpedia.[14]

Uzņēmums Amazon piedāvā DBpedia publisko datu kopu, kas var tikt integrēta Amazon Web Services platformā.[15]

Ārējās saites

[labot šo sadaļu | labot pirmkodu]
  1. [1]
  2. Christian Bizer, Jens Lehmann, Georgi Kobilarov, Soren Auer, Christian Becker, Richard Cyganiak, Sebastian Hellmann, DBpedia — A crystallization point for the Web of Data Arhivēts 2010. gada 2. februārī, Wayback Machine vietnē.. Web Semantics: Science, Services and Agents on the World Wide Web, Volume 7, Issue 3, The Web of Data, September 2009, Pages 154-165, ISSN 1570-8268
  3. «Komplett verlinkt - Linked Data» (German). 3sat. 2009-06-19. Arhivēts no oriģināla, laiks: 2013-01-06. Skatīts: 2009-11-10.
  4. Sers Tims Bērnerss-Lī sarunā ar Talis par Semantisko tīmekli Arhivēts 2013. gada 10. maijā, Wayback Machine vietnē.. Intervijas atšifrējums angliski, ierakstīts 2008. gada 7. februārī.
  5. Arhivēta kopija. Atjaunināts: 2009-11-23
  6. «DBpedia dataset». DBpedia. Arhivēts no oriģināla, laiks: 2010-04-30. Skatīts: 2008-09-26.
  7. , http://esw.w3.org/topic/TaskForces/CommunityProjects/LinkingOpenData/DataSets/LinkStatistics. Atjaunināts: 2009-11-24
  8. , http://esw.w3.org/topic/TaskForces/CommunityProjects/LinkingOpenData/DataSets/Statistics. Atjaunināts: 2009-11-24
  9. «First 5,000 Tags Released to the Linked Data Cloud». open.blogs.nytimes.com. Skatīts: 2009-11-10.
  10. «Life in the Linked Data Cloud». www.opencalais.com. Arhivēts no oriģināla, laiks: 2009-11-24. Skatīts: 2009-11-10. Wikipedia has a Linked Data twin called DBpedia. DBpedia has the same structured information as Wikipedia – but translated into a machine-readable format.
  11. «Zemanta talks Linked Data with SDK and commercial API». blogs.zdnet.com. Arhivēts no oriģināla, laiks: 2010-02-28. Skatīts: 2009-11-10. Zemanta fully supports the Linking Open Data initiative. It is the first API that returns disambiguated entities linked to dbPedia, Freebase, MusicBrainz, and Semantic Crunchbase.
  12. «European Semantic Web Conference 2009 - Georgi Kobilarov, Tom Scott, Yves Raimond, Silver Oliver, Chris Sizemore, Michael Smethurst, Christian Bizer and Robert Lee. Media meets Semantic Web - How the BBC uses DBpedia and Linked Data to make Connections». www.eswc2009.org. Arhivēts no oriģināla, laiks: 2009-06-08. Skatīts: 2009-11-10.
  13. «BBC Learning - Open Lab - Reference». bbc.co.uk. Arhivēts no oriģināla, laiks: 2009-08-25. Skatīts: 2009-11-10. Dbpedia is a database version of Wikipedia. It's used in a lot of projects for a wide range of different reasons. At the BBC we are using it for tagging content.
  14. «Semantic Tagging with Faviki». www.readwriteweb.com. Arhivēts no oriģināla, laiks: 2010. gada 29. janvārī.
  15. «Amazon Web Services Developer Community : DBPedia». developer.amazonwebservices.com. Arhivēts no oriģināla, laiks: 2010-02-13. Skatīts: 2009-11-10.