# 2023年底論文推薦 -- 影像匹配 作為碩士畢業的一年讀了比以前多一點論文,作為紀錄,寫一下幾個印象比較深刻的論文,雖然基本都是在畢業後才讀的: ## 1. LightGlue:Local Feature Matching at Light Speed https://github.com/cvg/LightGlue SuperPoint SuperGlue團隊續作,一篇第一次看覺得雞肋但越看越順眼的論文。 在原有的SuperGlue架構上進行改進,效能陸陸續續提高不少,有望重回巔峰。遺憾的是並沒有提出對SP的改動,只是增加了對DISK以及其他特徵萃取模型的支援。 雖然開出了源代碼以及訓練代碼,但是在SG提出的兩年後、ETE佔據CVPR大頭的情況下,沒有對描述子進行改進可能很難繼續維持巔峰 值得注意,在LG被提出後,SP的權重被更新了,實測更新過的權重在SG的訓練上可以取得更好的成果,因此如果在此之前套用舊版SP權重的模型,如:SGMNet,OpenGlue,直接進行比較可能會錯估模型效能。 ## 2. R2D2: Repeatable and Reliable Detector and Descriptor LINE公司提的一篇論文,沒有細看(因為用詞有點難讀),但被提及次數特別高,大部分用來佐證2階段訓練的合理性。 大概的意思是:detector跟descriptor要放在一起訓練才有辦法得到有鑑別度的特徵。 舉例:磁磚上的花紋雖然有可以被偵測,但因為出現的次數太多根本分不出來誰是誰,所以雖然是可以視為特徵但可信度不高,為了確保detector模型得到的特徵是有可靠性的,可以反映周邊訊息的descriptior是必須一起存在的。 ## 3. DISK: Learning local features with policy gradient 某個功能比較強的DETECTOR,主要看理論,但未來被取代機率高。 ## 4. HarrisZ: Harris Corner Selection for Next-Gen Image Matching Pipelines 喜文樂見的小波好朋友,在此重新證明descriptior訓練才是影像匹配跨不過的坎。 ## 5. D2-Net: A Trainable CNN for Joint Detection and Description of Local Features 是製作megaDepth訓練資料的方法。同時推薦MegaDepth與GL3d的論文,但這兩者主要貢獻是製作大規模的3D重建模型,目的是提供相關訓練製作training data,論文本身不是重點就只順帶提一下。 ## --- 放鴿分水嶺,接下來說一些沒有直接相關但是值得一說的部份 ## 6. NetVLAD: CNN architecture for weakly supervised place recognition 比較老牌的detector,在觀念上的意義大於數據。 ## 7. A COMPREHENSIVE REVIEW OF YOLO: FROM YOLOV1 AND BEYOND YOLO體系的概論,因為今年出了v7 v8,因此有可以看到有綜合討論性質的論文,雖然不是創新類的,但非常值得當作課本學習。
×
Sign in
Email
Password
Forgot password
or
By clicking below, you agree to our
terms of service
.
Sign in via Facebook
Sign in via Twitter
Sign in via GitHub
Sign in via Dropbox
Sign in with Wallet
Wallet (
)
Connect another wallet
New to HackMD?
Sign up