PR

テスト用のダミーデータ作成ツールとエクセル不要の自動生成法

この記事は約2分で読めます。

「このエクセル業務を自動化したいけれど、いきなり本番の顧客リストを使って練習して、もしデータを壊してしまったらどうしよう…」
新しいツールを触り始めた時、誰もが一度は感じる不安ですよね。

この記事では、個人情報漏洩のリスクをゼロにし、安全にツールを練習するためのダミーデータ(テストデータ)の作り方を解説します。

ダミーデータ(テストデータ)が必要な理由

業務改善の仕組みを作る際、実際の売上データや顧客の個人情報が入ったファイルをそのままテストに使うのは非常に危険です。
万が一、誤って上書き保存してしまったり、重複データ削除のノードで設定を間違えて必要な行まで消してしまったりすると、取り返しのつかない大事故につながります。

そのため、本番と同じような列名やデータ形式を持ちながら、中身は完全に架空のものであるダミーデータを用意し、そこで動作確認を行うのが鉄則です。

エクセルやWebツールで作成する限界

ダミーデータを作る方法はいくつかあります。
Web上でテストデータ生成と検索すれば、架空の氏名や住所を作ってくれる無料のWebサイトが見つかります。数十行のデータであれば、こうしたサイトからコピーしてエクセルに貼り付けるのが手軽です。

しかし、100万行を超えるようなビッグデータの処理スピードをテストしたい場合、Webツールでは作成の上限に引っかかってしまったり、ダウンロードに途方もない時間がかかったりします。

ノーコードツールで大量のダミーデータを自動生成

大量のダミーデータが必要な場合は、データ処理に特化したKNIME自身に作らせてしまうのが一番簡単でスピーディーです。
KNIMEには、Data Generator(データジェネレーター)という、架空のデータを自動で生み出すための専用ノードが最初から用意されています。

キャンバスにData Generatorノードを配置してダブルクリックし、設定画面を開きます。
Number of rowsという項目に、作成したい行数(たとえば10000)を入力し、実行ボタンを押すだけで、一瞬にして1万行のランダムな数字の羅列を持つテストデータが完成します。

さらに、Math Formulaノードを使って掛け算をしたり、特定の文字を足したりすることで、より本番のデータに近い形に加工していくことも可能です。
安全な砂場(テスト環境)を自分で用意できるようになれば、失敗を恐れずに色々な自動化のアイデアを試すことができますよ。

【独学派のあなたへ】まずは「基礎」を固めたいなら、この一冊。

当サイトの記事で「点」の知識は増えますが、「線」として体系的に学び直したいなら、『ネイティブが最初に覚える英会話フレーズ300』が最適です。ネイティブの子どもが覚える順で、本当に使うフレーズだけを効率的にインプットできます。

【本気で変えたいあなたへ】英語で「夢を叶える」なら、プロと伴走。

「英語を学んだその先で、キャリアやライフスタイルを変えたい!」そんな高い目標を持つなら、独学には限界があります。女性専用コーチング【スターズ】は、あなたの目標に合わせて学習・キャリア・マインドまで徹底サポート。挫折させない環境で、英語を「使って叶える」ステージへ導いてくれます。

データ分析の基礎
タイトルとURLをコピーしました