Иллюстрация twitter.com
Компания «Крибрум» провела измерение фоновой частотности использования слов в сообщениях Twitter на русском языке. Исследование проводилось на основе данных системы автоматизированного мониторинга и анализа контента социальных медиа «Крибрум» за август 2013 г., которые сравнивались с аналогичным расчетом годичной давности (август 2012г.).
За прошедший год в частотном словаре русскоязычного Твиттера произошли заметные изменения. Список самых используемых терминов (значимых слов и словосочетаний, за исключением предлогов, союзов и других служебных слов, с частотой употребления не менее 1 раза в час) в августе 2012 года был таким:
rt человек хороший день один знать простой любить писать #ff жизнь смотреть новый год утро время говорить игра россия онлайн спать думать #follow
Этот список содержит только 3 специфических термина, не связанных с содержанием разговоров между собой живых людей, - это хештеги #ff и #follow (маркеры взаимного фоловинга) и маркер ретвита "rt".
Через год, в августе 2013 года, наиболее частотными терминами стали:
rt #gameinsight скачать инструкция золотой собрать #android монета монета золотой собрать монета собрать золотой собрать монета золотой #androidgames книга #да #ipadgames #ipad человек хороший бесплатный день журнал игра
Как видно из списка, пространство русскоязычного Твиттера в 2013 году было захвачено мобильными играми, в первую очередь играми компании «Game Insight». «Человеческих» слов в списке самых частотных стало заметно меньше. Причиной этому стали повышение объемов как спама, так и ретвитов, что снизило «видимость» оригинального контента.
В списке самых частых (за вычетом явного спама) глаголов, то есть действий, в 2012 году были: «любить», «писать», «смотреть», «говорить» и «спать». В 2013 году топ-5 действий изменился: вместо «писать» и «спать», люди стали «знать» и «проверять», причем последний глагол оказался самым частотным.
Слова «человек», «хороший», «день» и «один» остаются самыми популярными в человеческом общении – они присутствуют в обоих списках 10 самых частотных слов, из которых исключены технические и спам-термины. Полные топ-10 за два года и дальнейшие выводы представлены на инфографике ниже.
Другие наблюдения за тем, что и как обсуждается в социальных медиа, читайте в блоге «Крибрум». Сегодня – об интересе к Apple и Samsung в цифрах.