We read every piece of feedback, and take your input very seriously.
To see all available qualifiers, see our documentation.
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
画像にTransformerを適用した時の精度が、モデル構造ではなく入力をパッチにすることに起因するとした研究。カーネルサイズ9、ストライド7というかなり大きい値でパッチ入力を模倣し、Depthwise/Pointwiseでパッチ間のMixを行うConvMixerを提案。同パラメータ数でViTより高精度。
https://openreview.net/forum?id=TVHS5Y4dNvM
?
2021/9/29
The text was updated successfully, but these errors were encountered:
No branches or pull requests
一言でいうと
画像にTransformerを適用した時の精度が、モデル構造ではなく入力をパッチにすることに起因するとした研究。カーネルサイズ9、ストライド7というかなり大きい値でパッチ入力を模倣し、Depthwise/Pointwiseでパッチ間のMixを行うConvMixerを提案。同パラメータ数でViTより高精度。
論文リンク
https://openreview.net/forum?id=TVHS5Y4dNvM
著者/所属機関
?
投稿日付(yyyy/MM/dd)
2021/9/29
概要
新規性・差分
手法
結果
コメント
The text was updated successfully, but these errors were encountered: