2024年07月30日

プランBとプランC

被害3区分,5,050組のデータセットによる学習結果が芳しくなかったことを受け,プランBとプランCを考えました。

私の職場の同僚向けのメール文面の画像を載せておきます↓。
メール文面_1.png

7/30(火)現在,プランBでの学習中です。
プランBではmAP50が0.75前後出ています。
速報まで。


posted by Dr.koba at 06:05| Comment(0) | TrackBack(0) | AI(人工知能) | このブログの読者になる | 更新情報をチェックする

2024年07月27日

被害3区分のtrain.pyの実行結果

ひとつ前の記事
https://gpsrsgis.seesaa.net/article/504059919.html
で,5,050組のデータセット(jpg+txt)をランダムに,10,18,18,18,18,18%の割合で6分割する方法についてお尋ねしました。

灯台下暗しで,統計ソフト"R"の達人である,職場の同僚がRでスクリプトを書いてくれ,分割してくれました(感謝!)。

3,636組のtrainデータと909組のvalidデータを使い,5分割交差検証をやった結果です↓。
被害3区分の学習結果.gif

結果は期待外れでした。検出精度の指標のひとつであるmAP50で0.8以上,あわよくば0.9台が出るかと思ったのですが,mAP50は概ね0.65前後までしか上がらず,大ショックでした。
しばらく意気消沈してメンタルがやられそうになりました。
甘くないです。

温井さんのトマトの3区分(完熟,収穫少し前,未熟)の例ではmAP50>0.9であり,
https://farml1.com/tomato_yolov5/#google_vignette
北京林業大学のマツ枯れ被害3区分でもmAP50が0.8近く出ているのに,
https://www.mdpi.com/1999-4907/13/11/1880
どうしてなのか,よくわかりません。

今後じっくり考察してみます。


posted by Dr.koba at 10:14| Comment(0) | TrackBack(0) | AI(人工知能) | このブログの読者になる | 更新情報をチェックする

2024年07月19日

(教えてください!)フォルダ内のファイルの組を特定の割合に分ける方法

マツ枯れ樹冠を物体検出アルゴリズムのYOLOv5で自動検出するという研究をやっています。

R6.3の森林学会@東京農大の発表では,データ数が876組(JPG+TXT)と少なく,過学習が発生したと思われ,検出精度も上がり切りませんでした。

その後がんばってデータ数を5,050組(JPG+TXT)に増やしました。
エクスプローラ画面の先頭と末尾です(5,050組×2=10,100ファイル)。
ファイルリスト_10100_先頭.png

ファイルリスト_10100_末尾.png

これら5,050組のデータを,訓練用,検証用,テスト用に分けてYOLOv5に掛けるつもりです。
学会発表時ではホールドアウト法でやったのですが,今回は5分割交差検証(クロスバリデーション)法でやりたいです。

イメージはこんな感じです↓。
5分割交差検証の概念2.png
前回の876組のときにはExcelを使って手動で訓練用と検証用を分けたのですが,データ数が増えたので,もう手作業はやりたくないです。

どなたか,フォルダ内のファイルの組(JPGとTXT)を,ランダムに特定の割合(今回は,10%,18%,18%,18%,18%,18%)(フォルダ名:test, fold1, fold2, fold3, fold4, fold5)に自動で分ける方法を教えてもらえないでしょうか。


よろしくお願いします。





posted by Dr.koba at 11:06| Comment(0) | TrackBack(0) | AI(人工知能) | このブログの読者になる | 更新情報をチェックする