業務プロセスの概要
1. 調査票の受付整理・入力
地方公共団体などを通じて提出された調査票等の調査書類は、種類・数量を確認し、整理した後、調査票保管室で厳重に管理します。
調査票は、統計作成処理を行うために、OCR(光学式文字読取)装置による画像解析とデータ入力の処理を行い、同時に重複や抜けがないか装置が確認します。OCR装置で認識できなかった文字は、コンピュータで検出し、補正処理を行います。
2. 調査票自由記入事項の符号化(分類符号の格付)
調査票に記入された「事業の内容」、「仕事の種類」や「家計の収入・支出の種類」などの自由記入事項は、統計作成処理ができるように分類基準(産業分類、職業分類、収支項目分類など)に従ったコーディング(符号格付)を行います。
コンピュータで自動的にコーディングするオートコーディングの研究開発により、処理の自動化が進んでいますが、複雑多岐にわたる記入内容や新たな産業、職業、商品・サービスは日々出現し、これらはコンピュータにより判断することはできません。そのような内容の判断は、産業や職業などに関する専門知識と適合する分類を即座に判断する技能を有する専門職員が対応します。
3. クリーンデータの作成
OCR装置で入力したデータやコーディングした分類符号を基に、調査票の記入漏れ、記入誤り、記入内容の矛盾、異常値などをコンピュータによりチェックし、個々のデータの妥当性を審査します。
個々のデータの欠損や調査項目間のデータ不整合は、作成する統計の品質や信頼性の低下に直結するため、これらを抽出し、論理的・数理的補正などデータのクリーニングを行います。
4. 結果表の作成
クリーニングされたデータについて、コンピュータを介して結果表作成システムにより集計し、結果表を作成します。
集計においては、統計調査ごとに設計した推定方法によるクロスセクション・データの集計のほか、季節調整法を適用した時系列データの集計、多変量解析法による集計、統計精度を推定する誤差集計など、統計理論に基づく各種の集計を行っています。
5. 結果表の審査
作成した結果表について、集計結果と別のチェックプログラムで集計した結果を比較するダブルチェック等の形式チェック、統計数値の論理的整合性の検証、過去の数値との時系列検証、各種情報を利用しての分析的チェック、異常値・特異値の検証など、結果数値の妥当性の審査をさまざまな角度から行い、結果表の品質を保持しています。
作成した結果表は、各種媒体により、総務省統計局その他統計調査を実施した各府省に提出します。
※ これらの統計作成業務(調査票の受付~結果表の審査)のプロセスは、例えば、毎月その結果が発表される労働力調査(完全失業率など)については約2週間、消費者物価指数(全国)については約1月で行っています。