全文検索とは
全文検索とは「検索対象文書の本文から特定の文字列を探し出す」ことを、一般に全文検索と呼びます。たとえば図書館で図書を探すとき、通常は書名や著者名、刊行年を指定して探すことになりますが、本文に何らかの文字列が含まれる図書を探す、というのが全文検索です。全文検索は便利な機能ですが、これを行うには、本文
全文検索とは「検索対象文書の本文から特定の文字列を探し出す」ことを、一般に全文検索と呼びます。たとえば図書館で図書を探すとき、通常は書名や著者名、刊行年を指定して探すことになりますが、本文に何らかの文字列が含まれる図書を探す、というのが全文検索です。全文検索は便利な機能ですが、これを行うには、本文
はじめにDoqueDBは、自由度の高い日本語全文検索や類似文書検索を特長とするデータベース管理システム(DBMS)です。今回、同様の機能をもつ他社ソフトウェアと性能比較を行いましたので、結果を公開します。Elasticsearchなど、データベース機能を持たない全文検索エンジンは対象としておりま
DoqueDBにはPerlのAPIも付属しています。現時点ではこれといったマニュアルもなく、また、特別なインストーラーなどは準備しておりません。ソースコードの doqueDB/sydney/Perl フォルダー以下のファイル(DBDとNet以外にあるものは不要)を適当な場所に配置しておけば、p
DoqueDBではUnicodeの任意の文字をデータとして扱うことができます。 この記事では文字の取り扱いについて注意すべきことがらをまとめます。Unicode追加面の文字を扱うことができます Unicodeの基本多言語面だけでなく、追加面の文字もデータとして操作できます。
こちらのカテゴリーでは、DoqueDBを活用するために役立つ、技術情報の解説記事を順次掲載していく予定です。ご期待ください。