細胞や臓器といった生物学の画像に特化したimage segmentationの技法.
FCNがfeature mapの縦横を急激に縮めたり引き伸ばすのに対して,U-Netでは縮めるのは1/2倍づつ,引き伸ばすのも2倍づつとしている. またfeature mapの縦横をa倍するたびにfeature mapの数を1/a倍している. fig.1から見て取れるように,U-Netを図示するとほとんど左右対称になっていて,左側の,特徴を抽出しつつ画像を圧縮していく部分をencoder,特徴量に対応したsegmentationを保持しながら画像を引き伸ばしていく部分をdecoderという. Encoderで得られた特徴量は縦横比が一致するように切り抜かれてから対応するfeature volumeと結合し,さらにupsamplingされていく. 引き伸ばしには”up-convolution”(おそらくFCNと同じヤツ)を使う.
生物学的画像の特徴として,かなりグニャグニャ歪めてもその実体(細胞・臓器)はクラスとして不変だから,そのようなdata augmentationを工夫している.
0 件のコメント:
コメントを投稿