趣味等

パワークエリについて

パワークエリとは

最近仕事でデータ分析をする機会があり、いろいろ勉強していたら、Excelの機能にデータ成形に役立つ「パワークエリ」というものがあることを知りました。

使い方を調べていたら、これはすごい(今さらですが、使う機会がなかった人間からすると、この機能は衝撃です。)。

最初はとっつきにくかったけど、Excelドカタチャンネル等で勉強しながらいじっていたら、少しわかるようになりました。

パワークエリとは、データを成形するための機能であり、その整形過程を記録することができるものです。

例えば、元データの列を削除したら、それを記録しておけるので、新しく取り込んだ同様の構造のデータであれば、同じ列を自動で削除します。

同じフォルダ内に月別の集計表のファイルが何カ月分かあれば、それをひとつのシートに結合できます。新しい月のデータを同じフォルダ内へ放り込んだら自動で結合します。

ExcelでいうVLOOKUP関数のように一つの列を起点にシートを結合できる。その他さまざまな加工ができ、それを記録しておけるというものです。

ぼくは年に一回しか使わないデータ(1年更新)があり、それを加工して分析することがあるので、そこにこの機能を使ってみることにしました。

しばらく解決できなかったエラー

最初に長いことつまづいた点を紹介します。

元データは5万行くらいあるものです。これを毎年同じ加工をして、分析をしています。加工の内容としては、必要のない列の削除、シートの結合(マージといい、VLOOKUPと同様のことができる)、列の入れ替え、テキストの変換等です。

元データの構成は変わらず、行だけが毎年増えていくだけですので、パワークエリが使えると判断しました。構成が変わるとうまく機能しない場合もあるようなので。

練習でいろいろやってみていましたが、どうしてもうまくいかないところがありました。それは、①列を削除 ②マージ ③元データを交換 ④データ更新 という流れで作業をした際に、エラーが出てうまく機能しなかったことです。エラーの内容は「結合する列が見つかりません」とかだったと思います。

動画等ではソース変更(元データの交換)の際はデータソース設定から一括変更した方が楽とあったので、そのようにしていました。しかしそれをすると、マージする際に使用していたコードのマスタのテーブルのソースも一括で変更されてしまいます

元データを最新のものに更新する際は、元データをフォルダから削除後に、全く同じ名前の最新データをフォルダに格納する。違う名前のデータにするのであれば、クエリのステップで一番最初にある「ソース」の場面で読み込んでるデータ名を変更してあげる。この2つのどちらかで解決することができると思います。個人的には削除してから同じ名前のフォルダを格納する方が間違いが少ないと思いました。

元データを変更した時に、ピボットグラフまでちゃんと更新されたときはうれしかったです。

まだまだ勉強中ですが、いろいろできて楽しいですね。これなら来年データ更新した際も、データ成形に時間を取られずに、分析に集中できそうです。