這些年來,我在許多不同的機器上積累了很多圖片。
我認為我主要將它們保存在yyyy / mm /目錄結構中,但是特別是在在一些較舊的圖片中,似乎有很多重複項。
識別重複項的最佳方法是什麼?有好的工具可以做到這一點,還是我必須自己寫點東西?
這些年來,我在許多不同的機器上積累了很多圖片。
我認為我主要將它們保存在yyyy / mm /目錄結構中,但是特別是在在一些較舊的圖片中,似乎有很多重複項。
識別重複項的最佳方法是什麼?有好的工具可以做到這一點,還是我必須自己寫點東西?
許多程序可以根據圖像內容查找重複項。一些資產管理應用程序會做到這一點,並且還有專門的程序。如果您Google“檢測到重複的圖像”,您會看到很多選擇。查看適用於您平台的文件。
另一種解決方案是使用“忽略重複選項”簡單地導入文件。免費的Picasa可以做到。
對於Linux,請嘗試 FSlint。有點慢,但是肯定會找到重複項。
dupeGuru圖片版是適用於Windows,Mac OS X和Linux的可自定義的重複圖像查找器。
dupeGuru有幾種版本(標準的音樂&圖片版本),圖片版本使您可以通過位圖塊比較算法以及其他方法(例如EXIF原始圖像時間戳或文件完全相同)來查找視覺上相似的圖像。
它還具有許多其他有用的功能功能,例如排除的文件夾,對iPhoto / Aperture庫的支持以及對如何檢測重複項以及如何處理重複項的自定義功能。
Picasa 具有重複的文件查找器,但是很難告訴您正在查看的內容。點擊工具
> 實驗
> 顯示重複文件
。它可以正常工作,但請注意刪除的內容。
另一個選項是免費“快速復製文件查找器”:
我對此很滿意,它可以讓您預覽圖片,然後再決定不要需要重複。
只要文件相同,效果很好,但是如果您要查找相似的照片(例如相同的照片,但已調整大小,旋轉或操作),您可能需要查看其升級版本:
我沒有使用過該程序,但是我使用了一個非常相似的程序(不再製作),發現它非常有用。他們有免費下載,因此值得一試。
digikam(Linux,Windows和Mac)有一個側邊欄,標題為版本
“版本”標籤顯示了照片的歷史記錄和保存的版本。使用右上角的三個按鈕,您可以在簡單的已保存版本列表,樹形視圖和組合列表之間進行選擇,該列表顯示版本以及對所選照片執行的操作。
和另一個標題為 search
快速搜索是搜索對話框頂部(左側邊欄)的自適應搜索框,它為您提供了一種簡單的方法使用單個查詢搜索digiKam數據庫。您可以在“搜索:”文本字段中輸入任何參數,它將用於確定結果。例如,您可以輸入字符串“ birthday”在整個數據庫中搜索所有元數據文本字段中單詞“ birthday”的出現,或輸入“ 05.png”以搜索特定的圖像文件名“ 05.png”(不需要像正則表達式中那樣轉義)。
(它還有一個高級設置,允許進行多個布爾搜索)
和另一個標題為 fuzzy
digiKam使用特殊技術(Haar算法)通過冗長的數字來表徵每個圖像,該技術可以通過比較此計算出的簽名來比較圖像。任何兩個圖像簽名之間的數值差異越小,它們彼此之間就越相似。此技術在digiKam中具有三種實現:...
儘管“簽名”的生成以及在大量圖像上對其進行交叉檢查可能是一個緩慢的過程。另請注意,有些人不喜歡它,因為它是一個KDE項目,並未與其他桌面環境完全集成,並且它嘗試通過圖像下載,目錄/關鍵字,RAW開發,圖像處理等方式成為一個完整的應用程序。包括在內。
類似.pictures是一個在線程序,用於查找附近和精確的重複項。
我之所以寫它是因為Picasa過去更喜歡找到精確副本。現在Picasa不見了。
我的兩分錢。我曾經使用過:
Pixiple github.com/saolaolsson/pixiple
VisiPics visipics.info
令人敬畏的Duplicate Photo Finder plicator-finder.com
要考慮的一件事是搜索的“模糊性”。有時,程序會找到相似的照片,例如,同一張照片的變體。刪除圖像時請別擔心。
請先備份圖像,然後再刪除任何內容。
Acdsee是具有此功能(工具->查找重複項)的簡單/常用照片瀏覽應用程序。
在Mac上,使用PhotoSweeper( http://overmacs.com/)取得了出色的成功。它可以直接通過文件系統或通過流行的攝影軟件(如Apple Photos和Adobe Lightroom)工作。它能夠找到完全相同的圖像或相似的圖像文件。而10美元的價格實在太便宜了。
我建議使用即將發布的 XYplorer(文件管理器)版本。它可以讓您按照視覺相似性對照片進行排序。
DeDup-Image是bash腳本,即使元數據不同,也可以自動查找和刪除相同的圖像/重複的照片。它始終保留最大的副本,該副本可能包含最多的元數據,並根據真實圖像信息的SHA256-HASH刪除所有其他找到的對象,而不包含任何元數據。由於該腳本需要處理每個圖像中沒有元數據的變體,因此與只能搜索完全相同的文件的程序或腳本相比,此腳本的速度和處理器處理速度都較慢。