びおの珠玉記事
第88回
統計の日に
※リニューアルする前の住まいマガジンびおから珠玉記事を再掲載しました。
(2014年10月18日の過去記事より再掲載)
10月18日は、「統計の日」。
1870(明治3)年に「府県物産表」についての太政官布告が公布された日にちなんで制定されました。
府県物産表は、農林水産物、工業生産物などの産業製品の生産高を府県ごとに集計したもので、日本初の近代的統計といわれています。
所管の民部省は、国力の厚薄貧富を説明する、として各府県に物産の集計を命じました。
この文書の日付は明治3年9月24日となっています。新暦換算した10月18日が、1973年の閣議で統計の日として制定されました。
これとは別に、世界統計デーも10月20日に定められています。10月は、5年に1度の国勢調査もあります。何かと統計づいた月ですね。
月次・年次の住宅着工をはじめとして、住宅の滅失調査や空き家実態の調査などがあります。
http://www.mlit.go.jp/statistics/details/jutaku_list.html
5年に1度の住宅の現状調査です。住宅の構造や面積、世帯人数などから、腐朽や破損といった情報、通勤方法等。
住宅土地統計調査
http://www.stat.go.jp/data/jyutaku/
住宅金融に関わる調査など
住宅金融支援機構 調査研究
http://www.jhf.go.jp/about/research/index.html
さまざまな統計に関する情報のメールマガジン
統計メールニュース
http://www.stat.go.jp/info/mail/
統計とはなんぞや
統計というのは、先に挙げた政府の資料のように、調査結果のデータそのものを差すこともあるように、あくまでそれ自体は数値でしかありません。
統計をどのように使うか、ということが重要です。
「宇宙戦争」等の作品で知られるSF作家のH.G.ウェルズは、統計的な思考は、いつの日か読み書きの能力と同じくらい市民に必要になるだろう、と記しています。1903年のことです。
時代はながれて、現在はビッグデータの時代といわれています。
統計というのは、大きく分けると記述統計と推測統計にわけられます。
記述統計は、データを計算し、その分布を明らかにし、その性質を読み取りやすくしていくものです。
推測統計は、データの一部から、母集団となるより大きなデータ全体の傾向を推測するものです。
たとえば、5年に1度の国勢調査は全国の世帯全てを調査するもので、記述統計の範疇です。おなじく5年に1度の住宅土地統計調査は、こちらは全世帯の調査ではなく、抽出された調査対象の結果を元に全国の値を推定したものです。
推測統計では正しい値がでないのではないか、といぶかしがる人もいるかもしれません。でも、最近の統計手法はずいぶん正確になってきていて、たとえば選挙報道では、出口調査というサンプルだけで、母集団全体の結果、すなわち当落がほぼ当たるようになってきています。
先に挙げた統計データの多くは国が政策立案のために調査をしているものですが、同時に民間の事業にも大きく影響してきます。そのときに、それが記述統計だから、推測統計だから、という差はあまり問題になりません。
ビッグデータ
統計学とはまた別のアプローチで、ちかごろは「ビッグデータ」という言葉をよく耳にします。一部のデータから推測するのではなく、大量のデータをまとめて処理して企業の戦略に反映していく、という使われ方をします。
ビッグデータといってもピンからキリまでありますが、わかりやすいものでいえば、たとえばGoogleで何かを検索すると、「もしかして」と検索キーワードを提示されたり、途中まで入力しただけの文字の、その先を提示してくれたりします。
大量の検索データの中から、あなたが検索しようとしたのはきっとこれでしょう、と提示されるのです。もちろん、自身がいま入力したキーワードも、ビッグデータのひとつとなって、次の誰かの推測に使われます。
amazonで本を購入しようとすると、「この商品を買った人は、こんなものも買っています」というオススメが表示されます。
好みの傾向もビッグデータから提示され、それがまあ大体当たってしまって、さらに消費をしてしまうのです。
少し意味合いが違いますが、携帯電話、スマートフォンなどの文字入力では、予測変換が一般的で、文字を途中まで入力すると、変換しそうな言葉を羅列してくれます。
時間の短縮にもなりますし、興味のあるものを次々に紹介してくれて、たしかに便利な機能です。
ちかごろは、ニュースキュレーションサービスも流行しています。スマートニュース、グノシーといったサービスが、短い時間でニュースがわかる、話題を豊富に持っておける、として宣伝しています。
これらのサービスも、自分が好きなジャンルを登録することで同一系統のニュースが表示され、またビッグデータによるニュースオススメ機能を持っていて、「あなたが見たニュースを見た人は、こういうのも見ていますよ」とお知らせしてくれます。
けれど、amazonのオススメに出てくる本は、実際のところ、もう持っていたり、知っているものしか出てこないこともしばしばです。だって、同じような傾向のものなんですから、そりゃあ当たり前です。
ニュースキュレーションサービスで紹介されるニュースは、あるジャンルを深く知っていくことは出来るかもしれませんが、別のジャンルにはまったく無頓着になってしまう可能性が潜んでいます。
人はamazonでしか本を買わないわけではないし、ニュースキュレーションでしかニュースを見ないわけではない。けれど、そういう人も増えていると思いませんか?
買い物や情報収集が効率化されるのは、いい面もありますが、偶然の出会いで、全然違う世界を知るチャンスがせまくなっているかもしれません。
統計に乗って効率よくやりながら、たまにはそれを疑ったり、違うことを覗いてみる。それも、ウェルズの言った統計学の知見の一つかもしれません。
「びお」も、ときどき毛色の違った記事が出てきますけれど、素敵な偶然がお届けできたらいいな、と思っています。