テクノロジー
デジタル・スタイロメトリー(Digital Stylometry)
コンピュータを用いて文章の文体を統計的に分析し、作者特定やテキストの真贋判定を行う技術。文学研究からサイバーセキュリティまで幅広く活用される。
意味 {#meaning}
デジタル・スタイロメトリーとは、コンピュータと統計的手法を用いて、文章の文体特徴(単語の頻度、文の構造、句読点の使い方など)を定量的に分析する技術および研究分野を指します。個人の書き方の「癖」をデジタルデータとして抽出し、比較照合することで、そのテキストが誰によって書かれた可能性が高いかを統計的に推測します。主に、匿名文書の作者特定、文学作品の真贋判定、AI生成テキストと人間作成テキストの識別、サイバー犯罪における犯人特定などに用いられます。
由来・背景 {#origin}
「スタイロメトリー」自体は、ギリシャ語の「stylos(筆記具、スタイル)」と「metron(測定)」に由来し、19世紀末に文学研究の分野で手作業による文体分析が始まりました。20世紀後半からのコンピュータの普及と自然言語処理(NLP)技術の発展により、大量のテキストデータを高速かつ客観的に分析することが可能になったことで、「デジタル・スタイロメトリー」として進化・確立しました。特に21世紀に入り、インターネット上の匿名性のある情報(SNS投稿、ダークウェブ上の文書など)の増加、フェイクニュースやAIによる自動生成テキストの台頭により、その重要性が急速に高まり、文学研究だけでなく、法医学、サイバーセキュリティ、情報戦の分野でも注目されるようになりました。
例文・使い方 {#examples}
- 「この匿名掲示板の書き込み、以前の脅迫メールとデジタル・スタイロメトリーで分析したら、文体が酷似していると判明した。」
- 「最新のデジタル・スタイロメトリー技術を使えば、AIが生成した記事と人間が書いた記事をかなりの精度で識別できるようになった。」
- 「シェイクスピアの未発表作品とされる草稿の真贋を巡り、専門家がデジタル・スタイロメトリーを応用して文体分析を行っている。」