デジタル・ヒューマニティーズ(digital humanities)とは、人文科学に対しコンピュータを積極的に応用すること。歴史、哲学、文学、宗教学や社会学の研究において、テキスト分析技術や統計処理、地理情報システム、シミュレーション技術を適用し、新しいアプローチを見出す方法論だ。最近だと「AIが書いたハリポタ」「シェイクスピアの”中の人”は何人?」が有名やね。

 講演は秋草俊一郎さんの「文学とコンピュータが出会うとき」というテーマだ(訳すのは「私」ブログ で知った)。文学におけるデジタル・ヒューマニティーズの最新事例や、面白いアプローチをしている研究者が、つぎつぎと飛び出してくる。特に、「本を読まずに文学する方法」や、「統計分析から得られたベストセラーの法則」、「文体を決めるのは時代やジェンダー」が興味深いトピックだった。1時間30分が一瞬に感じるくらい、めちゃめちゃ面白かったので、ここにまとめる(記事化は許可をいただいてます)。

Dh1


 ポイントは、文学を「読む」ほうに主眼をおいているところ。「読む」のはヒトの仕事だろ? なんて思ってると、カルチャーショックを受けるだろう。



 まずは、「本を読まずに文学する方法」。フランコ・モレッティ『遠読』を中心に、世界文学への挑戦ともいえる「新しい読み方」が紹介される。それは、「いかに読まないか」を追求する読み方である。

 つまりこうだ。いわゆる正典(カノン)を精読することから生じる文学には限界があるという主張だ。崇め奉られている「世界文学」といっても、要するに欧米という地域を中心に、文を生産・消費する商業システムで生き残った作品群にすぎぬ。そしてその量もハンパではなく、原典を「精読(close reading)」していてはそれだけで一生終わる。

 だから、「精読」の対義語として「遠読(distant reading)」が提唱される。要素だけを抽出して読んだり、原典ではなく翻訳を通じて読むのもあり。コンピュータや統計手法を用いたデータ解析を行い、文学を自然科学や社会学のモデルでとらえ直すのだ。これにより、テクスト自体が消えてしまってもいい。「テクストをいかに読めばいいかは分かっている、さあ、いかにテクストを読まないか学ぼうではないか」と煽ってくる。

 わたしのレビューは、[本を読まずに文学する『遠読』]にまとめたが、この講義では「シャーロック・ホームズが生き残った理由」や「ハムレットのネットワーク相関図」、さらに世界文学空間の歴史的生成と支配構造を解析したパスカル・カザノヴァ『世界文学空間』が紹介される。究極の支配は言語(≒思考・思想)の支配だという考えに立つと、それに抗うための『遠読』という捉え方をしても面白い。



 次に、「統計分析から得られたベストセラーの法則」として、マシュー・ジョッカーズ『ベストセラーコード』が紹介される。ある本がベストセラーになるかを判断するためのアルゴリズムを開発する話だ。2800種以上の小説の特徴(文体、プロット、テーマetc)をインプットとし、膨大な小説を機械学習させることで、ベストセラーになる小説を(そうなる前に)予測可能とするのだ。

Dh2


 面白かったのは、プロットラインのグラフ。ストーリーにおける喜怒哀楽をプラス、マイナスに分けて、小説の各場面で、プラスの方向、マイナスの方向にどれぐらい振られているかを視覚化する試みだ。『ダ・ヴィンチ・コード』と『フィフティ・シェイズ・オブ・グレイ』のそれぞれの解析結果を重ねると、プロットラインの起伏がいかに似ているかに目を奪われる。昔から「三幕構成」といわれるが、読者の感情を緻密にコントロールすることが売れることの秘密なのかもしれぬ。