マツ枯れ樹冠を物体検出アルゴリズムのYOLOv5で自動検出するという研究をやっています。
R6.3の森林学会@東京農大の発表では,データ数が876組(JPG+TXT)と少なく,過学習が発生したと思われ,検出精度も上がり切りませんでした。
その後がんばってデータ数を5,050組(JPG+TXT)に増やしました。
エクスプローラ画面の先頭と末尾です(5,050組×2=10,100ファイル)。


これら5,050組のデータを,訓練用,検証用,テスト用に分けてYOLOv5に掛けるつもりです。
学会発表時ではホールドアウト法でやったのですが,今回は5分割交差検証(クロスバリデーション)法でやりたいです。
イメージはこんな感じです↓。

前回の876組のときにはExcelを使って手動で訓練用と検証用を分けたのですが,データ数が増えたので,もう手作業はやりたくないです。
どなたか,フォルダ内のファイルの組(JPGとTXT)を,ランダムに特定の割合(今回は,10%,18%,18%,18%,18%,18%)(フォルダ名:test, fold1, fold2, fold3, fold4, fold5)に自動で分ける方法を教えてもらえないでしょうか。
よろしくお願いします。
posted by Dr.koba at 11:06|
Comment(0)
|
TrackBack(0)
|
AI(人工知能)
|

|