Liên hệProfile
Danh mục

Mục Lục

    Hướng dẫn sử dụng fdupes Linux để tìm và xóa file trùng lặp nhanh chóng

    Nguyễn Hưng

    Ngày đăng:

    10/03/2026

    Cập nhật lần cuối:

    10/03/2026

    Lượt xem:
    Chia sẻ
    Đánh giá
    5/5 - (1 bình chọn)

    Nguyễn Hưng

    Lượt xem:
    Ngày đăng:

    10/03/2026

    Cập nhật lần cuối:

    10/03/2026

    Mục lục

    fdupes Linux là một giải pháp hữu ích và trực quan dành cho người dùng Linux khi cần kiểm soát dữ liệu trùng lặp trên ổ lưu trữ. Trong bài viết này, mình sẽ cùng bạn tìm hiểu rõ về lệnh fdupes, đồng thời tham khảo cách sử dụng fdupes để tìm và xóa các file bị trùng lặp hiệu quả, nhanh chóng nhất.

    Những điểm chính

    • Định nghĩa lệnh fdupes Linux: Hiểu rõ khái niệm và mục đích chính của fdupes trong việc quét và nhận diện các file trùng lặp để quản lý không gian lưu trữ.
    • Cách fdupes hoạt động: Nắm được cơ chế hoạt động của fdupes, từ việc lọc theo kích thước, so sánh hash đến kiểm tra byte-by-byte để đảm bảo độ chính xác.
    • Các tùy chọn phổ biến: Có được một bảng tra cứu nhanh các tùy chọn quan trọng, giúp bạn tùy chỉnh việc tìm kiếm và xử lý file trùng lặp.
    • Các tính năng chính: Biết được các khả năng cốt lõi của fdupes như tìm kiếm toàn diện, tùy biến thao tác xóa và hiệu suất tối ưu.
    • Cách cài đặt: Nắm vững các lệnh cài đặt fdupes trên các bản phân phối Linux phổ biến như Ubuntu và CentOS.
    • Cách sử dụng chi tiết: Thành thạo các ví dụ sử dụng thực tế, từ việc tìm kiếm, hiển thị kích thước đến xóa file trùng lặp một cách an toàn.
    • Lưu ý khi sử dụng: Nắm được các nguyên tắc quan trọng để sử dụng fdupes một cách an toàn, tránh mất dữ liệu không thể khôi phục.
    • Các công cụ thay thế: Biết đến các công cụ khác như Uniq hay FsLint để có thêm lựa chọn khi xử lý các dạng dữ liệu trùng lặp khác nhau.
    • Giải đáp thắc mắc (FAQ): Có được câu trả lời cho các vấn đề thực tế như mức độ an toàn, khả năng khôi phục và khi nào nên cân nhắc các giải pháp khác.

    fdupes Linux là gì?

    Fdupes là tiện ích dòng lệnh mã nguồn mở trên Linux, do Adrian Lopez phát triển và được phân phối theo giấy phép MIT. Công cụ này dùng để phát hiện và loại bỏ các file trùng lặp trong thư mục và thư mục con bằng cách so sánh kích thước, mã băm MD5 và nội dung từng byte. Nhờ đó, fdupes giúp người dùng dọn dẹp hệ thống, giải phóng dung lượng lưu trữ và quản lý dữ liệu hiệu quả hơn.

    Fdupes là một tiện ích dòng lệnh mã nguồn mở dành cho Linux
    Fdupes là một tiện ích dòng lệnh mã nguồn mở dành cho Linux

    Cách hoạt động của fdupes

    Công cụ này hoạt động theo các bước như sau:

    1. Lọc file theo kích thước để giảm số lượng file cần so sánh.
    2. Tính mã hash MD5 cho từng file để phát hiện file nghi ngờ trùng lặp.
    3. So sánh mã hash để xác định nhóm file trùng.
    4. So sánh từng byte để đảm bảo kết quả chính xác tuyệt đối.

    Ngoài ra, fdupes cũng hỗ trợ quét đệ quy thư mục con, hiển thị chính xác đường dẫn file trùng lặp và cho phép xóa file trùng lặp theo lựa chọn của người dùng. Đây là công cụ mạnh mẽ giúp quản lý, tổ chức lại dữ liệu và giải phóng không gian lưu trữ trên máy tính hoặc server một cách hiệu quả.

    fdupes giúp quản lý, tổ chức lại dữ liệu và giải phóng không gian lưu trữ
    fdupes giúp quản lý, tổ chức lại dữ liệu và giải phóng không gian lưu trữ

    Các tùy chọn phổ biến của fdupes trong Linux

    Tùy chọnTên đầy đủChức năng
    -r--recurseTìm kiếm đệ quy trong tất cả các thư mục con của mọi thư mục được cung cấp.
    -R--recurse:Tìm kiếm đệ quy chỉ trong các thư mục con được chỉ định ngay sau tùy chọn này.
    -s--symlinksTheo dõi và xem xét các liên kết tượng trưng trong quá trình quét.
    -H--hardlinksCoi các liên kết cứng trỏ đến cùng một file là các bản sao trùng lặp.
    -n--noemptyLoại trừ các file có kích thước bằng 0 khỏi kết quả.
    -A--nohiddenLoại các file ẩn khỏi quá trình xem xét.
    -f--omitfirstBỏ qua việc hiển thị file đầu tiên trong mỗi nhóm file trùng lặp.
    -1--samelineLiệt kê mỗi nhóm file trùng lặp trên một dòng duy nhất, phân tách bằng dấu cách.
    -S--sizeHiển thị kích thước của các file trùng lặp được tìm thấy.
    -m--summarizeCung cấp một báo cáo tóm tắt về tổng số file trùng lặp và dung lượng chúng chiếm dụng.
    -q--quietẨn chỉ báo tiến trình quét, chỉ hiển thị kết quả cuối cùng.
    -v--versionHiển thị thông tin phiên bản của fdupes đã được cài đặt.
    -h--helpHiển thị màn hình trợ giúp với danh sách đầy đủ các tùy chọn.

    Các tính năng chính của fdupes

    • Tìm kiếm toàn diện: Tự động phát hiện các file trùng lặp không chỉ trong thư mục chính mà còn bao gồm toàn bộ hệ thống thư mục con liên quan.
    • Tùy biến thao tác: Cung cấp nhiều lựa chọn như hiển thị danh sách file trùng lặp, tiến hành xóa hoặc thay thế chúng bằng liên kết cứng tùy theo nhu cầu quản trị.
    • Tối ưu hiệu suất: Công cụ nhẹ, tốc độ xử lý nhanh, được đánh giá cao về độ tin cậy và thường xuyên được sử dụng trên các hệ thống Linux, kể cả môi trường máy chủ chuyên nghiệp.
    Các tính năng chính của fdupes
    Các tính năng chính của fdupes

    Cách cài đặt fdupes 

    Trên Ubuntu/Debian:

    sudo apt update
    sudo apt install fdupes

    Trên Fedora/CentOS:

    sudo dnf install fdupes   # Fedora / CentOS 8+
    sudo yum install fdupes   # CentOS 7

    Kiểm tra phiên bản:

    fdupes --version

    Sau khi chạy lệnh kiểm tra, kết quả hiển thị phiên bản hiện tại đang là 2.3.0:

    Kết quả hiển thị phiên bản hiện tại đang là 2.3.0
    Kết quả hiển thị phiên bản hiện tại đang là 2.3.0

    1. Xem trợ giúp và tùy chọn có sẵn

    Để hiển thị danh sách đầy đủ các tham số và cú pháp hỗ trợ của chương trình, bạn thực thi lệnh sau:

    fdupes -h

    Kết quả hiển thị đầy đủ như sau:

    Xem trợ giúp và tùy chọn có sẵn
    Xem trợ giúp và tùy chọn có sẵn

    2. Tìm file trùng trong một thư mục

    Bạn thực thi lệnh bên dưới đây để quét và nhóm các file có nội dung giống nhau nằm trong một thư mục cụ thể:

    fdupes /duong/dan/thu_muc

    Ví dụ:

    fdupes ~/Downloads

    Lệnh sẽ liệt kê các nhóm file trùng nhau và trả về kết quả:

    Kết quả trả về các nhóm file trùng nhau
    Kết quả trả về các nhóm file trùng nhau

    3. Hiển thị toàn bộ đường dẫn file

    Tùy chọn -f sẽ yêu cầu hệ thống hiển thị đường dẫn đầy đủ từ thư mục gốc, giúp định vị chính xác vị trí file, đặc biệt khi quét trên diện rộng:

    fdupes -f /duong/dan/thu_muc

    Bạn có thể kết hợp -r -f để quét toàn bộ cây thư mục và xem chính xác từng file:

    fdupes -rf /home/user

    4. Quét đệ quy các thư mục con

    Bạn sử dụng tùy chọn -r để mở rộng phạm vi tìm kiếm vào tất cả các thư mục con nằm bên trong thư mục đích.

    fdupes -r /duong/dan/thu_muc

    5. Hiển thị kích thước của file trùng

    Lệnh dưới đây kết hợp tùy chọn -S (Size) để hiển thị kích thước của các file trùng, hỗ trợ quản trị viên đánh giá mức độ tiêu tốn dung lượng lưu trữ của các dữ liệu dư thừa.

    fdupes -Sr /duong/dan/thu_muc

    Trong đó:

    • -S: Hiển thị kích thước file.
    • -r: Quét đệ quy.

    Lệnh giúp bạn biết các nhóm file trùng đang chiếm bao nhiêu dung lượng:

    Hiển thị các nhóm file trùng đang chiếm bao nhiêu dung lượng
    Hiển thị các nhóm file trùng đang chiếm bao nhiêu dung lượng

    6. Xóa file trùng có xác nhận thủ công

    Bạn sử dụng tùy chọn -d để kích hoạt trình hướng dẫn xóa. Hệ thống sẽ liệt kê từng nhóm file trùng và yêu cầu người dùng xác nhận hành động cụ thể.

    fdupes -d /duong/dan/thu_muc

    Tại mỗi nhóm file, hệ thống sẽ đưa ra lời nhắc và bạn cần nhập số thứ tự của file muốn giữ lại:

    Bạn nhập số thứ tự của file muốn giữ lại
    Bạn nhập số thứ tự của file muốn giữ lại

    Bạn có thể nhập:

    • 1, 2: Giữ lại file tương ứng, xóa các file còn lại trong nhóm.
    • all: Giữ lại tất cả, không xóa file nào trong nhóm.
    • none: Bỏ qua nhóm hiện tại, không làm gì cả.

     Mỗi nhóm sẽ được xử lý riêng, lệnh sẽ lặp lại cho nhóm tiếp theo nếu có.

    iconLưu ý

    Khi bạn đã chọn file để giữ, các file còn lại trong nhóm sẽ bị xóa ngay và không có bước xác nhận lại. Vì vậy bạn hãy kiểm tra kỹ trước khi chọn, trong trường hợp bạn cần dừng tiến trình thì nhấn Ctrl + C.

    7. Xóa file trùng không cần xác nhận

    Bạn sử dụng tùy chọn -N kết hợp với -d để thực hiện xóa hàng loạt mà không cần hỏi lại người dùng.

    fdupes -dN /duong/dan/thu_muc

    Hệ thống sẽ tự động giữ lại file đầu tiên trong mỗi nhóm trùng lặp và xóa tất cả các file còn lại.

    iconLưu ý

    Chỉ sử dụng lệnh này khi bạn đã chắc chắn về cấu trúc dữ liệu hoặc đã có phương án sao lưu, vì dữ liệu bị xóa sẽ không thể khôi phục.

    Một số lưu ý khi sử dụng fdupes

    • Nguyên tắc an toàn dữ liệu: Bạn hãy chạy lệnh fdupes ở chế độ quét thông thường, không kèm tùy chọn -d để rà soát, đồng thời kiểm tra chính xác danh sách các file trùng lặp trước khi tiến hành xóa.
    • Cơ chế xác định trùng lặp: fdupes không so sánh theo tên file hay ngày tạo, mà dựa hoàn toàn vào nội dung.
    • Giới hạn về khả năng nhận diện: Phần mềm chỉ tìm kiếm các file giống nhau tuyệt đối và không hỗ trợ tính năng tìm kiếm gần giống, nếu có nhu cầu này, bạn nên tham khảo các công cụ thay thế như rdfind hoặc fslint.
    • Tính chất không thể khôi phục: Các thao tác xóa thực hiện bởi fdupes sẽ loại bỏ dữ liệu vĩnh viễn khỏi ổ cứng và không lưu vào thùng rác, vì vậy dữ liệu sẽ không thể khôi phục lại sau khi lệnh đã thực thi.

    Các công cụ hỗ trợ xử lý dữ liệu trùng lặp khác

    Linux cung cấp nhiều tiện ích khác có thể hỗ trợ bạn trong việc xử lý các dạng dữ liệu trùng lặp:

    • Uniq: Được sử dụng chuyên biệt để tìm và xóa các dòng trùng lặp liền kề trong các file văn bản.
    • Duperemove: Là công cụ xử lý dữ liệu trùng lặp được thiết kế để hoạt động ở cấp độ hệ thống file, đặc biệt hiệu quả với các hệ thống file hiện đại như btrfs và XFS.
    • FsLint: Công cụ này không chỉ tìm file trùng lặp mà còn có thể xác định các liên kết tượng trưng bị hỏng, thư mục trống, và các vấn đề khác liên quan đến hệ thống tệp.
    Công cụ Uniq
    Công cụ Uniq (nguồn: Internet)

    Câu hỏi thường gặp

    Vì sao sử dụng fdupes khi dọn dẹp file trùng lặp an toàn hơn so với việc xóa thủ công?

    Fdupes sử dụng thuật toán so sánh nội dung file qua hash MD5 và kiểm tra từng byte, đảm bảo chỉ phát hiện các file thực sự giống nhau, giảm nguy cơ xóa nhầm các file quan trọng chỉ cùng tên hoặc cùng kích thước nhưng khác nội dung.​

    Vì sao nên sử dụng tuỳ chọn -d khi dọn dẹp file bằng fdupes thay vì -dN?

    Tùy chọn -d kích hoạt xác nhận thủ công, giúp kiểm tra lại từng nhóm file trùng và chọn file giữ lại, đặc biệt hữu ích khi dữ liệu quan trọng hoặc bố cục thư mục phức tạp. Dùng -dN sẽ tự động xóa tất cả ngoại trừ file đầu, dễ gây mất dữ liệu nếu không kiểm tra kỹ.

    Sau khi sử dụng fdupes xóa file, có thể khôi phục lại không?

    Không, thao tác xóa bằng fdupes là vĩnh viễn – file bị xóa ngay, không chuyển vào thùng rác hay vùng tạm lưu, không thể phục hồi bằng công cụ thông thường. Vì vậy, luôn kiểm tra kỹ hoặc sao lưu dữ liệu quan trọng trước khi xóa.

    Trường hợp nào nên cân nhắc giải pháp khác ngoài fdupes?

    Nên cân nhắc các công cụ khác như rdfind, duperemove, hoặc FsLint nếu có nhu cầu tìm kiếm gần giống, kiểm tra liên kết tượng trưng bị hỏng, thư mục trống hoặc các vấn đề khác trong hệ thống tệp, vì fdupes chỉ chuyên về file trùng lặp tuyệt đối.

    fdupes là một giải pháp hữu ích và trực quan dành cho người dùng Linux khi cần kiểm soát dữ liệu trùng lặp trên ổ lưu trữ. Nhờ khả năng quét sâu toàn bộ hệ thống thư mục, tích hợp nhiều tùy chọn thao tác và đảm bảo hiệu suất xử lý, công cụ này giúp tối ưu không gian lưu trữ và tổ chức dữ liệu cá nhân hoặc hệ thống máy chủ một cách an toàn, chuyên nghiệp. Mời bạn theo dõi thêm các bài viết về chủ đề Linux bên dưới đây:

    5/5 - (1 bình chọn)
    Nguyễn Hưng
    Tôi là Nguyễn Hưng hay còn được biết đến với nickname là Bo, chuyên gia về hệ thống, mạng và bảo mật. Tôi là Co-Founder của Vietnix và Co-Founder của dự án Chống Lừa Đảo.
    0 0 đánh giá
    Đánh giá bài viết
    Theo dõi
    Thông báo của
    guest
    0 Góp ý
    Cũ nhất
    Mới nhất Được bỏ phiếu nhiều nhất
    Phản hồi nội tuyến
    Xem tất cả bình luận

    BÀI VIẾT LIÊN QUAN

    Hướng dẫn sử dụng lệnh pidstat trong Linux để giám sát tài nguyên các tiến trình sử dụng
    Hướng dẫn sử dụng lệnh pidstat trong Linux để giám sát tài nguyên các tiến trình sử dụng

    Lệnh pidstat là công cụ chuyên dụng trên hệ thống Linux, được sử dụng để giám sát tài nguyên mà các tiến trình đang sử dụng. Bài viết này được mình đúc kết từ quá trình trực tiếp xử lý hàng nghìn ticket tối ưu hệ thống cho khách hàng tại Vietnix, nơi mà mỗi…

    20/04/2026

    smartctl là gì? Cách sử dụng smartctl trong Linux để kiểm tra sức khỏe ổ cứng
    smartctl là gì? Cách sử dụng smartctl trong Linux để kiểm tra sức khỏe ổ cứng

    smartctl là một tiện ích dòng lệnh giúp quản lý và giám sát hệ thống S.M.A.R.T., từ đó theo dõi chi tiết sức khỏe ổ cứng HDD/SSD trong môi trường máy chủ lẫn máy trạm cá nhân. Trong bài viết này, bạn sẽ tìm hiểu cách cài đặt, sử dụng các lệnh smartctl quan trọng…

    14/04/2026

    cryptsetup là gì? Cách mã hóa phân vùng với cryptsetup (LUKS) trên Linux
    cryptsetup là gì? Cách mã hóa phân vùng với cryptsetup (LUKS) trên Linux

    cryptsetup là tiện ích dòng lệnh nguồn mở trong Linux dùng để quản lý mã hóa đĩa dựa trên dm-crypt và chuẩn LUKS, hỗ trợ tạo volume an toàn với nhiều khóa và tương thích cao. Bài viết này hướng dẫn toàn diện về cryptsetup từ cài đặt, quy trình mã hóa, quản lý key…

    14/04/2026

    Aureport là gì? Hướng dẫn sử dụng lệnh aureport trên Linux
    Aureport là gì? Hướng dẫn sử dụng lệnh aureport trên Linux

    Aureport là công cụ dòng lệnh mạnh mẽ trong hệ thống auditd Linux, chuyên tạo báo cáo thống kê tóm tắt từ các tệp nhật ký kiểm toán. Bài viết này sẽ hướng dẫn chi tiết cách sử dụng aureport để giám sát bảo mật và phân tích hoạt động hệ thống hiệu quả. Những…

    09/04/2026

    linux

    lenh

    text