Семантическая нейронная сеть ConceptNet представляет из себя библиотеку обо всём, что необходимо компьютерам в качестве знаний о мире. Это очень важно, например, чтобы понять текст, который ввёл пользователь.
ConceptNet основан на узлах, которые состоят из слоёв и концепций и сделаны в виде слов либо фраз естественного языка и знаков отношений между ними. Возможно представление совершенно любых вещей и предметов, которые должны усваиваться компьютерами, чтобы поиск был удобным, можно было отвечать на поставленные вопросы и понимать мотивы действий человека на компьютере. Если вам пришла в голову идея соорудить свой личный суперкомпьютер вместе с великолепным ConceptNet, то это достойная идея для первого времени.
Интерфейс программирования приложений и документация
О новой версии нейронной сети ConceptNet 5.1 подробно написано на официальной странице вики проекта.
В документацию же входят данные по использованию REST API, позволяющем получать данные по отдельным узлам, делать запросы информации по параметрам и запросы на измерение семантического расстояния между узлами.
Общедоступность ConceptNet 5
Сеть строится на трудах и знания тысяч добровольцев, и она бесплатна. Поэтому её выпускают под выбор двух лицензий Creative Commons. Первая – Creative Commons Attribution-ShareAlike 3.0. Это полный ConceptNet 5, со всей информацией, которую смогли собрать. Вторая – это Creative Commons Attribution 3.0, по которой пользователю предоставляется часть информации совершенно бесплатно для любых целей. Эта часть называется «ConceptNet 5 Основной». И хотя эта версия тоже неплоха, но многие данные из Википедии и DBpedia в ней отсутствуют, а они являются продуктами Attribution-ShareAlike.
Посильная помощь
Именно благодаря волонтёрам последняя версия сети стала намного более насыщенной в плане знаний и фактов о мире и людях. Данные поступают почти отовсюду, по этой причине любой пользователь может привнести свои знания, полезные не только для сети, но и для других людей.
В последней версии ConceptNet также остался большой вклад из прошлой версии в развитие системы Open Mind Common Sense. Очень многая информация берётся из английской версии Википедии и Викисловаря. При помощи DBpedia сеть извлекает данные из блоков информации, появляющихся в статьях. Не отстаёт и WordNet, из которого приходит большое количество данных.
ConceptNet – гиперграф
Любой оператор сети, рассказывая, как по ней идёт информация, уделяет внимание узлам. В отличие от предыдущей версии, эта является свободным от другого ПО гиперграфом, другими словами – набором вершин и рёбер различных форматов, в том числе и JSON. Конечно, вам видней, каким ПО пользоваться, чтобы взаимодействовать с сетью, но можно попробовать Solr. Эта система позволяет пользоваться поиском нужной информации в ConceptNet.
Форматы семантической нейронной сети
Если пользователю необходимо, чтобы вся информация сети была в его приложении, то можно попробовать скачать её в одном из трёх форматов:
Первый – flat JSON. В этом формате содержится каждая строка из узла сети;
Второй – Solr JSON. Этот формат позволяет загружать данные в индексе Apache Solr для быстрого поиска;
Третий – CSV. Формат, удобный для командной строки поиска, выглядящий в форме данных, расположенных в таблицах.