“重複檔案搜尋器加強版”產品特色 - 比較檔案內容,結果 100% 準確

返回產品主頁 >>>

找出“重複”檔的方法有兩種:
1、最簡單但對檔案查重不太合適的方法:比較檔案名、最後修改時間或檔案大小,或者其任意組合。
2、更適合於檔案比較的方法:在二進位層面比較檔案是否相同,亦即比較檔案內容。不能理解電腦術語的使用者,可以理解為把兩個檔案用“記事本”打開,然後逐字元比較是否一致。我們的產品“重複檔案搜尋器加強版”正是採用此方法。

基於此,進一步分析:
方法 1 可能出現誤判,即便檔案名稱、大小及修改時間相同,也不能 100% 確定其“重複”;還可能出現漏查,比如將“原始檔.docx”拷貝一份,新檔名稱為“複製 – 原始檔.docx”,如果將檔名作為判定條件之一,那麼這兩個檔案將不被視為重複項。

對於一個專門搜尋重複檔案的軟體產品來說,這種方法可謂“簡單粗暴”,甚至可以算作未完全實現應有的功能。

再來看方法 2,由於只比較檔案內容,所以真正重複的檔案一定能被找出,而不管檔案名及修改時間是否一致。甚至副檔名不一致(考慮為了安全刻意修改副檔名的情況),只要檔案內容相同,也能被找出。

下圖是同一檔案製作的不同拷貝,均能被我們的產品精准地找出:
比較檔案內容
圖 A:比較檔案內容能精確找出重複檔。

注意:
1、方法 2 會從掃描源逐個讀取並比較檔案內容,所以速度遠遠不及方法 1。但我們為了向您提供更準確、全面的重複檔結果,仍然採用方法 2 作為核心比較演算法。
2、請注意以下選項(在主介面按<F7>進入):
大檔比較方法
圖 B:較大檔案的比較方法。

為了提高效率,我們預設對達到 16 MB 的檔案採用抽樣比較:首先確保大小完全一致,再每隔若干位元組比較一次。您可在此調節抽樣比較的閾值甚至直接設為“完整比較”。

Windows 版 立即體驗“重複檔案搜尋器加強版”!下載

返回產品主頁 >>>