Snapshot de la base PostgreSQL du scraper Reddit (tables posts + comments).
Aucune sélection : on décrit ici le corpus brut, avant tout filtre thématique.
Vue d'ensemble normalisée du corpus (pour la section méthodes du papier).
| Subreddits | 20 — r/kdramas, r/KoreanFood, r/korea, r/InstantRamen, r/squidgame, r/koreanvariety, r/asiandrama, r/kdramarecommends… |
|---|---|
| Période couverte | 2011-06-10 → 2026-05-21 |
| Posts | 39 765 |
| Commentaires | 1 144 614 |
| Auteurs uniques | 213 465 |
| Langue principale | anglais |
| Commentaires médians par fil | 13 |
| Profondeur max observée | 9 niveaux |
| Exclusions | commentaires au corps vide écartés des analyses textuelles |
| Anonymisation | pseudonymes non affichés ; verbatims reliés au fil source |
| Politique de citation | extraits courts, lien vers le commentaire Reddit d'origine |
Volume mensuel de posts et de commentaires.