Инфографика: главные источники данных для чат-ботов

Люди все чаще обращаются к чат-ботам — для общения, поиска советов или получения справочной информации. Поисковые системы также все активнее используют нейросети, чтобы формировать готовые ответы на запросы. Но возникает закономерный вопрос: откуда чат-боты берут данные, которые затем выдают пользователю?

Инфографика: главные источники данных для чат-ботов / © Visualcapitalist

Согласно анализу, проведенному сотрудниками американской публичной компании Semrush, большие языковые модели (LLM), такие, как ChatGPT, чаще всего ссылаются на Reddit и Wikipedia в поисках фактов. Для подтверждения географических данных модели обычно используют Mapbox и OpenStreetMap.

По словам специалистов Semrush, более 40% информации, выданной чат-ботом в ответ на запрос, оказалось цитатами из социальной сети Reddit, а свыше 26% — из самой популярной в мире онлайн-энциклопедии Wikipedia.