一般語
著者生存

Aozora Bunko : 青空文庫検索



検索の仕組み

  1. 検索の対象
    「青空文庫」に収録されている全作品を対象とする。 このため、著作権が消滅した作品だけでなく、著作権が生きている(が著作権者が許諾した)作品も検索の対象となるが、 著作権が生きている作品の本文は、検索結果には表示しない。
  2. 検索方法
      「一般語」欄で文字列検索。更に、「著者生存」欄で、著者(又は翻訳者)の生存期間を指定して絞り込み。
    1. 複数語 (AND)
      「一般語」欄に複数の語を空白で区切って指定すると、それら全てを同一作品内に含む作品のみを示す(作品内AND検索)。
    2. 複数語 OR
      「一般語」欄に複数の語を | (縦棒)で区切って指定すると、それらのどれかを同一作品内に含む作品を示す(作品内OR検索)。
    3. 活用語・異表記
      活用語は、文中に現われた活用形に加えて、終止形でも検索する(事がある)。又、異なる表記 (イヴァノーヴナ・イワノーブナ)でもでも検索する(事がある)。
      これを防ぎ、厳密の当該表記だけを検索するには、"イヴァノーヴナ"と引用符で括って指定。
    4. 正規表現(regular expression)も指定出来る。 例:「権[理利]」(権利・権理)、「ボ[ーオ]?イ」 (ボーイ、ボオイ、ボイ)。
      但し、「^」(先頭)・「$」(末尾)は、それぞれ語頭・語末を示し、 このときの「語」はmecabの認定によるので、必ずしも期待通りの結果を返さない事がある。
      又、正規表現検索は、インデクスを使わず全件(96,458,272件)検索するため、遅い。
  3. 用例表示
    当該用例を含む文と、その前・後の文を含め3文を表示する。
    複数語検索した場合、 同一作品内での共起を検索しているので、必ずしも表示される用例中にそれらの全ての語が表示される保証は無い。 (将来的には、「同一作品内」・「同一文内」の選択を可能とする予定)。
    「文」は句点又は閉じ引用符(」)で認識するので、 句点を用いない著者では長大な用例となり、頻繁な会話の交替は極端に短い用例になる事がある。このあたりは、近い将来の改善を期す。
  4. 表示モード
    次の三つのモードがあり、著者・書名欄をクリックする度に次のモードに移行する。
    1. 著者モード: 著者あたり用例1つのみを表示する。
    2. 作品モード: 当該著者の全ての作品について、作品あたり用例1つのみを表示する。
    3. 全例モード: 当該著者の当該の作品について、全用例を表示する。ここで、著者・書名欄をクリックすると、「著者モード」に戻る。

判明している問題

次は、当面解決の予定が無い。

  1. 踊り字を、展開した形で検索出来ない。例:「つゞき」を「つづき」から検索出来ない。
  2. 特に、二字以上の繰返しの「くの字点」を、展開した形で検索する事が出来ない。 例:「いろ/\」を「いろいろ」から検索出来ない。「一心見る/\四劫に溢れ」を「一心見る見る四劫に溢れ」から検索出来ない。

 → resume search
joao-roiz.jp

contact mtoyo@joao-roiz.jp for technical problems