みなさんはエクセルを使うことはありますか?
私はよくあるのですが、そのエクセルでのデータ分析をストレスなく進めるために総務省が「データ入力の統一ルール」を策定しました。
へぇ、こんなものがあるんだ、と思ったので今回はこのルールをご紹介します。
総務省が示したデータ入力の統一ルールって?
このルール、正式名称は「統計表における機械判読可能なデータの表記方法の統一ルール」となります。
令和2年の12月に策定されていました。
私は、今回日経トレンディのポッドキャストで知りました。
〇今月号の日経トレンディ「ずるいエクセル学びなおし」
で、さっそく総務省のHPを見てみたわけです。
チェックすべきはこの15項目
「統一ルール」はPDFファイルで見ることができます。
PDFで22ページなので、そこまで分量は多くはないので、すが要点は以下の15項目。
- データ形式:ファイル形式は Excel か CSV となっているか
- データ・項⽬:1セル1データとなっているか
1セルに複数データが入っていると、編集やデータ加工の手間が増えます。
- データ・項⽬:数値データは数値属性とし、⽂字列を含まないこと
円やkgなどの文字列が入っていると、計算ができません。
- データ・項⽬:セルの結合をしていないか
1件のデータを、横1⾏で⼊⼒(レコード)⼜は縦1列で入力しましょう
- データ・項⽬:スペースや改⾏等で体裁を整えていないか
スペースや改行があると検索がむつかしくなります。
- データ・項⽬:項⽬名等を省略していないか .
- データ・項⽬:数式を使⽤している場合は、数値データに修正しているか
数式を使⽤してセルの値を⼊⼒している場合、並べ替え等を⾏った場合、正確な値が表⽰されなくなる可能性があるので、値に変換しておきましょう
- データ・項⽬:オブジェクトを使⽤していないか
- データ・項⽬: データの単位を記載しているか
単位が含まれる項⽬については、別セルにその項⽬の単位を⼊⼒
- データ・項⽬:機種依存⽂字を使⽤していないか。
①のような機種依存文字は判読されないことがあります。
- データ・項⽬: e-Stat の時間軸コードの表記、⻄暦表記⼜は和暦に⻄暦の併記が
されているか .
和暦表⽰のみでは、元号が切り替わる際に⼿作業で⻄暦等に変換する必要があります。
その時にはe-Stat で⽤いている時間軸コードを活⽤することで、データ収集や横断的利⽤の⾃動化が容易となります。
- データ・項⽬:地域コード⼜は地域名称が表記されているか
地域名だけだと省略して記載されていると混乱が生じることがあります。
「統計に⽤いる標準地域コード」を併記しておくと混乱を予防できます。
- データ・項⽬:数値データの同⼀列内に特殊記号(秘匿等)が含まれる場合
データを記載したくない場合は斜線表示だと計算がむつかしくなります。
「***」や「0」「X」などの値を入力しましょう。
- 表の構成:データが分断されていないか
不必要な空白を入れないようにしましょう。
- 表の構成:1シートに複数の表が掲載されていないか
1シートに複数の表が掲載されていると、正確な計算や昇順・降順の並べ替えなどができない場合がある。
PDFには実例も交えてわかりやすく説明されていました。
〇マクロや関数などが紹介されています。「エクセルでこんなことできるんだ」と知っておくためにさらっと一読しておくといいと思います。