システムからダウンロードしたデータで、「山田 太郎」のように氏名が1つのセルに入っていたり、「2026-03-06」のように日付がハイフンで繋がっていたりすることはよくありますよね。
エクセルではデータタブにある区切り位置という機能を使って列を分けますが、毎月同じ作業をするのは手間がかかります。
この記事では、特定の文字や記号を目印にしてデータを分割するCell Splitterノードの使い方を解説します。
Cell Splitterノードとは?
KNIMEのCell Splitter(セルスプリッター)ノードは、指定した記号(スペースやカンマ、ハイフンなど)を基準にして、1つの列のデータを複数の新しい列に切り分けてくれるアイコンです。
名寄せやデータクレンジング作業を行う前の下準備として、データを扱いやすい単位にバラバラにするためによく使われます。
さっそく、Modern UIの画面でノードを配置していきましょう。
ノードの設定手順と分割のルール
- キャンバスに配置する:画面左側の+ボタンからCell Splitterを検索し、キャンバスに配置して線をつなぎます。
- 設定画面を開く:ノードをダブルクリックして設定画面を開きます。
- 分割したい列を選ぶ:Target columnのプルダウンから、分割の対象にしたい列(氏名や住所など)を選びます。
区切り文字(デリミタ)を指定する
設定画面の中央にあるDelimiterという入力欄に、分割の目印にしたい文字を入力します。
氏名を苗字と名前に分けたい場合は、ここに入っている文字を消して、キーボードで半角スペース(または全角スペース)を1回だけ入力します。
ハイフンで分けたい場合はハイフン記号を入力します。
分割した後の列の扱いを決める
設定画面の下部にあるOutputという項目で、分割したデータをどのように出力するかを選びます。
- as new columns:分割したデータを、元の列の右側に新しい列として追加します。通常はこの設定を選んでおけば間違いありません。
- as list:少し高度な設定ですが、分割したデータをリストという特殊な形式にまとめて1つのセルに収納します。
また、そのすぐ下にあるチェックボックス(Remove input column)にチェックを入れると、分割し終わった後の元の列を自動的に削除してくれます。エクセルの区切り位置機能と同じように、元のデータを上書きして消したい場合はここにチェックを入れます。
実行ボタンを押して結果を確認
設定が終わったらOKを押し、ノードの上の緑色の実行ボタンをクリックします。
ノードの右側の三角マークをクリックしてデータを確認すると、指定したスペースや記号を境目にして、データが綺麗に複数の列に分かれているはずです。
氏名を分けた後にRule Engineノードを使って特定の苗字の人だけを抽出するなど、次の処理へスムーズにつなげることができますよ。
