2 つのテキスト A と B を対象として、文字列の出現頻度を計算し、和集合 union および共通集合 intersection を調べます。文字列は、行でひとまとめとして考えます。
まず、"Count Freq" をクリックして文字列の出現頻度を計算します。計算結果はタブ区切りのテキスト形式であり、表計算シートへ貼り付けることも可能です。 次に、"Filter" をクリックして、頻度に基づくカットオフを行います。必要とする出現回数の最底値を 2 以上に設定することによって、各集合において再現的に出現している文字列を選択できます。
引き続いて、"Union" をクリックすると、集合 A と B のどちらかには存在する全文字列が非重複に報告されます。"Intersect" をクリックすると、集合 A と B の両方で共通して含まれる文字列のみが非重複に報告されます。
文字列情報はサーバーへ送信されずに、計算はウェブブラウザで行われます。入力可能なテキストファイルのサイズ上限は各 1 MBです。ページ右上の "Paste example data" を押すと、テストデータ(2 m 以上の樹木の種類についての調査例、A: 静岡県、B: 福岡県)が入力欄に挿入されます。
String_Union_Intersect 0.7 (last modified on 2023 Nov)