皆さんこんにちは。松尾です。
今回は、僕が学生時代に行った研究について説明させていただきます。
僕は、学生時代に川崎病という、主に幼児がかかる病気のデータ解析を行っていました。
ここで皆さん、「データ解析」という言葉を一度は聞いたことがあると思います。統計手法の一つである解析ですが、多くの企業でもビッグデータを用いたデータ解析により、ビジネスを成長させたり、回復させた事例があります。
でも、データ解析って医療分野にも使えるの?って思っている人もいると思います。
今では経営のスタンダードになりつつあるデータ解析。しかし、データ解析の意味をしっかりと理解できているでしょうか?そもそもデータ解析って何なのでしょうか?基本的な内容と、医療分野への応用例を説明してどういうものかを分かってもらえたら幸いです。
データ解析の意味、本当に分かっていますか?
データ解析とは、一般的に「様々な種類のデータを大量に集め、加工し、集計しやすい形式に変換、図表化することで、今まで気が付かなかった知見を発見すること」と言われています。
似たような言葉で、「データ分析」がありますが、「分析」と「解析」では言葉の意味が以下のように異なります。
- 分析:複雑な事柄を一つ一つの要素や成分に分け、その構成などを明らかにすること。
- 解析:事物の構成要素を細かく理論的に調べることによって、その本質を明らかにすること。
よって、「データ分析」、「データ解析」の目的は
- データ分析の目的:現状のデータ(数字)を知ること。
- データ解析の目的:なぜそのデータ(数字)なのか、原因を探ること。
となります。
データ解析で大切なことは、解析結果から何を得て、それをどう活用するかという点です。つまり、解決したい問題や課題、検証や軌道修正が必要な事が前提にあり、それをサポートする手段として用いられていることで、本領を発揮するものです。
データ解析で川崎病の発症の原因解明へ
では、どのように川崎病のデータ解析をするのか。ここからは、学生時代の研究をもとに説明をしていきます。
データベースに登録された、数万件の患者のデータから、年齢・性別・住んでいる地域・発症した時期などの条件でデータを絞り出し、そこから発症する人の特徴を捉えるという研究を行っていました。また、人の流れのデータとの関係を調べることで、感染症との関連性があるのかを調べました。川崎病は発見されてから50年以上経過していますが、未だに発症の原因が解明されていない病気です。そのため、この結果を用いることで、川崎病の発症の原因の解明に繋がることが期待されます。
このように、解決したい問題をサポートする手段として、データ解析を用いることができます。