본문 바로가기
데엔(Data-Engineering)/하둡(Hadoop)

HDFS 휴지통

by KwonSoonBin 2023. 4. 9.

💡 HDFS는 사용자의 실수에 의한 파일 삭제를 방지하기 위해서 휴지통 기능을 제공한다.

휴지통 기능이 설정되면 HDFS에서 삭제한 파일은 바로 삭제되지 않고, 각 사용자의 홈디렉토리 아래 휴지통 디렉토리(/user/유저명/.Trash)로 이동된다. 이때 휴지통 아래의 파일은 복구 가능하다.

휴지통 디렉토리는 지정한 간격으로 체크포인트가 생성되고, 유효 기간이 만료되면 체크포인트를 삭제합니다. 삭제 되면 해당 블록을 해제하고, 사용자에게 반환한다.

설정

설정값 비고

fs.trash.interval 체크포인트를 삭제하는 시간 간격(분). 0이면 휴지통 기능을 끔.
fs.trash.checkpoint.interval 체크포인트를 확인하는 간격(분). fs.trash.interval과 같거나 작아야 함. 체크포인터가 실행될 때마다 체크포인트를 생성하고, 유효기간이 지난 체크포인트는 삭제.

휴지통 설정값

core-site.xml

<property>
    <name>fs.trash.interval</name>
    <value>1440</value>
</property>
<property>
    <name>fs.trash.checkpoint.interval</name>
    <value>120</value>
</property>

휴지통 명령

# 휴지통을 비움.
$ hadoop fs -expunge

# 휴지통을 이용하지 않고 삭제
$ hadoop fs -rm -skipTrash /user/data/file

'데엔(Data-Engineering) > 하둡(Hadoop)' 카테고리의 다른 글

Failover controller란?  (0) 2023.04.09
네임노드 & 데이터노드  (0) 2023.04.08
Manager 전환 이슈  (0) 2023.04.08
HDFS 저장 용량 확보 과정  (1) 2023.04.08
Why Hadoop?  (0) 2022.11.08

댓글