msgbartop
Блог для общения группы товарищей, объединенных идеями удобного управления знаниями, интеграции wiki и онтологий
msgbarbottom

27 Ноя 09 Фасетный поиск по Wikipedia/DBPedia

В конце сентября был запущен фасетный поиск на данных, которые DBPedia извлекла из Википедии. Проект делался совместно с немецкой поисковой компанией Neofine и находится здесь: http://dbpedia.neofonie.de/browse/.
Таким образом, теперь для ответа на вопросы типа «Какие ученые родились в России в период с 1900 по 1910 год» нам не нужно знать SPARQL, а достаточно использовать соответствующие фильтры в интерфейсе поисковика от DBPedia и Neofine: http://dbpedia.neofonie.de/browse/rdf-type:Scientist/personBirthDate-year~:1900~1910/personBirthPlace:Russian%20Empire/ (обратите внимание на человеко-читаемые урлы, в которых можно увидеть названия свойств и концептов из RDF представления DBPedia).

В фильтрах есть контекстные подсказки, благодаря которым для задания запроса необязательно знать терминологию онтологии DBPedia.

Существенных недостатков пока обнаружено несколько:

  • Данные требуют унификации.  В списке стран, например, можно обнаружить и Russian Empire и Russia, и мы получаем разные результаты для этих случаев: http://dbpedia.neofonie.de/browse/rdf-type:Scientist/personBirthDate-year~:1900~1910/personBirthPlace:Russian%20Empire/ и http://dbpedia.neofonie.de/browse/rdf-type:Scientist/personBirthDate-year~:1900~1910/personBirthPlace:Russia/. Понятно, что авторы английской Википедии использовали разные названия для страны, но если при чтении текста это было некритично, то при использовании в процессе вывода становится серьезной проблемой
  • Пока есть поддержка только английской версии энциклопедии. Будем надеяться, что в скором времени фасетный поиск будет реализован также для русского и других языков.

Несмотря на это, фасетный поиск по Wikipedia/DBPedia был назван немецким правительством одной из 365 самых инновационных идей в Германии.

Метки: , , , , ,

Leave a Comment