1. HOME
  2. ブログ
  3. IT技術
  4. 【前処理編】肺のCT画像からCOVID19かどうかの判断は可能か?【機械学習】
【前処理編】肺のCT画像からCOVID19かどうかの判断は可能か?

【前処理編】肺のCT画像からCOVID19かどうかの判断は可能か?【機械学習】

前処理編~肺のCT画像からCOVID19か予想できるのか?

肺のCT画像

今回は、肺の CT 画像から、COVID 19か否かを予測する深層学習モデルを、「PyTorch」で実装してみたいと思います。

PyTorch を採用した理由は、「Kaggle」での実装例も多く、公式ドキュメントも充実しているためです。

というわけで、Kaggle に公開されているデータセットを用いて、「二値分類」をしていきたいと思います。

実行は、すべて Kaggle の notebook 上で行っているので、自宅にGPUがない方でも、すぐに試すことができます。

ちなみに、こちらの記事は「プログラミングで分類に挑戦する」ということが目的で、COVID 19を確実に分類できるわけではありませんので、予めご了承をお願い致します。

こちらの記事もオススメ!



データの下見と前処理

今回使用するデータセットは、「COVID 19の画像」と「そうではない画像」とで、フォルダ分けして与えられています。

DataFrameにまとめる

使いやすいよう、「Pandas」のデータフレームに、まとめておくことにしました。

以下のように、「covid」の列が疾患か否かを示しており、疾患である場合のラベルは「1」です。

DataFrameにまとめる

「train」「test」ともに、COVID 19である割合は、5割ほどで乖離はなさそうでした。

画像をみてみる

画像分類をするとき、「何枚かの画像は、自分の目で見る」ということが大事です。

特に医療画像では、作成された過程などにより、かなりの差異が生じます。

たとえば、下の3枚の画像が似ていないことは、明らかですね。

肺のレントゲン画像1
肺のレントゲン画像2
肺のレントゲン画像3

また、画像のサイズも、均一ではなさそうです。

この差をなくすために、前処理が一般的に必要とされていますが、今回はお試しなので割愛します。

ちなみに COVID 19では、肺の部分が、白く抜けたようになります。

交差検証をする

機械学習モデルの作成において大事なことは、「特徴量生成」や「どのモデルを使うか」より、適切な Validation をとることだ。

という金言があるように、データの分け方を考えることは、かなり重要です。

とりあえずの層化抽出

今回は、「正例」と「負例」との割合と、fold ごとに等しくする層化抽出を行います。

メタデータが与えられている場合なら、他の分け方を考えても良いと思います。

CT 画像の形式としてよくある「DICOM データ」では、患者 ID が付随している可能性が高いです。

この場合は、「GroupKFold」を用いることが、選択肢となります。

理由は、同じ患者の画像が別の fold に混ざることで、不当に精度が上がることを防ぐため。

同じ患者であれば、「画像が似ている」か「同じ疾患を持っている」、という判断もできます。

準備編へつづく!

こちらの記事は、【準備編】へつづきます。

こちらの記事もオススメ!



ライトコードよりお知らせ

にゃんこ師匠にゃんこ師匠
システム開発のご相談やご依頼はこちら
ミツオカミツオカ
ライトコードの採用募集はこちら
にゃんこ師匠にゃんこ師匠
社長と一杯飲みながらお話してみたい方はこちら
ミツオカミツオカ
フリーランスエンジニア様の募集はこちら
にゃんこ師匠にゃんこ師匠
その他、お問い合わせはこちら
ミツオカミツオカ
   
お気軽にお問い合わせください!せっかくなので、別の記事もぜひ読んでいって下さいね!

一緒に働いてくれる仲間を募集しております!

ライトコードでは、仲間を募集しております!

当社のモットーは「好きなことを仕事にするエンジニア集団」「エンジニアによるエンジニアのための会社」。エンジニアであるあなたの「やってみたいこと」を全力で応援する会社です。

また、ライトコードは現在、急成長中!だからこそ、あなたにお任せしたいやりがいのあるお仕事は沢山あります。「コアメンバー」として活躍してくれる、あなたからのご応募をお待ちしております!

なお、ご応募の前に、「話しだけ聞いてみたい」「社内の雰囲気を知りたい」という方はこちらをご覧ください。

ライトコードでは一緒に働いていただける方を募集しております!

採用情報はこちら

書いた人はこんな人

ライトコードメディア編集部
ライトコードメディア編集部
「好きなことを仕事にするエンジニア集団」の(株)ライトコードのメディア編集部が書いている記事です。

関連記事

採用情報

\ あの有名サービスに参画!? /

バックエンドエンジニア

\ クリエイティブの最前線 /

フロントエンドエンジニア

\ 世界はお前の手の中に・・・ /

モバイルエンジニア

\ サービスの守り神! /

インフラエンジニア