본문 바로가기

분류 전체보기83

[CS] 1GB = 1000MB? or 1024MB? 온라인에서 256GB의 노트북을 구매했는데 실제 디스크의 용량을 보면 248GB와 같이 용량이 약간 모자른 것을 볼 수 있다. 결론 부터 말하면 이것은 제조사의 오류가 아닌 표기방식의 차이 때문이다. 제조사에서는 제품의 저장공간 용량을 표기할때 1000MB 기준으로 표기하는 반면, OS에서는 1024MB 단위로 계산한다. 왜 표현 방식이 다른가? 인간은 10진법을, 컴퓨터는 2진법을 사용한다. 컴퓨터가 2진법은 사용하는 이유는 2진수를 기반으로 컴퓨터 시스템이 운영될 때, 오류를 최소화하고 효율적인 시스템 구축이 가능하기 때문이다. 컴퓨터는 전기신호를 사용하여 트렌지스터를 ON/OFF하는 행위를 반복한다. 즉 2진수를 기반으로, 전기적 신호를 0과 1로만 처리한다. 하지만 3이상의 n진수을 사용하게 되면.. 2022. 11. 16.
[CS] 스토리지 종류 - DAS / NAS / SAN 스토리지는 저장한다라는 뜻으로 서버에서는 데이터를 저장하는 장소로 1차, 2차, 3차 스토리지로 나누어진다. 1차 스토리지는 램(RAM)과 같은 내부장치 2차 스토리지는 하드디스크와 테이프와 같은 외부장치 3차 스토리지는 클라우드 스토리지 1. D.A.S - Direct Attached Storage(직접 연결 스토리지) 외장하드의 서버 버젼 서버의 직접 연결하여 사용되는 방식입니다 우리가 사용하는 PC를 예로 들면 디스크에 용량이 부족할 경우 디스크를 추가로 구매하여 저장공간을 쉽게 확보할 수 있습니다. 쉬운 확장 유선 연결로 빠른 속도 D.A.S 장점 서버와 물리적으로 직접 연결하여 디스크 용량이 부족할때 쉽게 확장할 수 있으며, 서버와 전용 케이블로 직접 연결하기 때문에 속도가 빠릅니다. D.A.S.. 2022. 11. 13.
[CS] 스토리지 종류2 - object / block / file 파일 스토리지 가장 일반적인 저장소 유형 - 친숙, 표준화 계층 방식으로 색인 - '구조화' 데이터 양이 늘어남에 따라 성능 저하 문제- (파일과 폴더를 계속 추적해야 하기 때문, 비용 상승) NAS 방식 ex) 윈도우 맥 os 파일 저장 방식 - 로컬 파일 시스템 파일을 폴더와 하위 폴더의 계층 구조로 체계화하고, 폴더/파일 경로를 사용해 접근 가능한 방식이다. 이 방법으로 파일을 저장하면 생성 날짜, 수정 날짜 및 파일 크기 등의 첨부되는 메타데이터가 제한적이다. 이 간단한 조직 스키마는 데이터 양이 늘어나면서 문제를 일으킬 수 있다. 파일과 폴더를 계속 추적하기 위해 파일 시스템에 대한 자원 요구가 증가하기 때문에 성능이 떨어질 수 있습니다. 이러한 '구조적' 문제는 단순히 파일 시스템에서 사용할 .. 2022. 11. 13.
Why Hadoop? 저장소와 분석의 문제 💡 디스크의 용량에 비해 데이터를 읽는 속도는 그에 미치지 못했다. 단일 디스크의 데이터를 읽는 데 너무 많은 시간이 걸리고, 심지어 쓰는 것은 더 느리다. 이에 시간을 줄이기 위한 방법으로 여러 개의 디스크에서 동시에 데이터를 읽는 방식이 출현했다. 100개의 디스크에서 각 디스크 별로 100분의 1씩 데이터가 있으며 병렬적으로 작업 시 그 속도는 매우 빨라질 것이다. 디스크에 100분의 1만 활용, 사용하는 것은 물론 낭비이다. 하지만 1테라바이트의 데이터셋 100개를 디스크에 나눠 저장하고 서로 공유가 가능하다면 이야기가 달라진다. 이러한 병렬, 분산처리시스템은 사용자에게 매우 빠른 분석을 지원하고 고르게 분산되어 서로 큰 방해도 없을 것이다. 하둡(Hadoop)이란? 대용량의.. 2022. 11. 8.