하루 일지 요약

기상 / 숙면 시간

  • 어제는 11시 20분에 잠들었다.
  • 오늘은 6시 40분에 일어났다. 일어나서 뉴스를 틀었다.

업무 및 공부 ..

  • 데이터센터 네트워크 책 진행을 못했다.
  • 대신 대규모 데이터 센터에서 오픈스택 클러스터를 어떤 식으로 구성해야 하는지에 대해 고민했다.( gpt와 대화하면서 … 신뢰성은 모르겠다 )
    • 컨트롤러 / 네트워크 / 컴퓨트 / 스토리지 영역을 나누는 것은 기본이다.
    • 랙 4대에 각 서버 10개씩 넣는다고 가정했다.
    • 각 랙 상단에 2~3개의 리프 스위치를 둔다고 생각했다. 각각 퍼블릭, 관리, 스토리지 용도이며, 이더넷 망에서 VLAN 혹은 VRF로 나눌 수 있다. 다만, 실전 경험이 없기 때문에 정말 이런 식으로 구성해야 하는지는 잘 모르겠다.
    • 스파인 스위치와 리프 스위치 연결은 25G로 구성하고, 리프 스위치와 서버 연결은 10G로 구성한다. 스파인 스위치는 경계 스위치(Border Switch)와 또 연결되어 있으며, Border는 이중화된 라우터(R1/R2)와 연결된다.
    • 이중화된 라우터는 방화벽, 로드밸런서, 외부 BGP 피어 등을 바라보고 있으며, 결국 외부와의 통신 관점에서 네트워크 출입구 역할을 한다.
    • 컨트롤러 서버는 HA 구성을 위해 3대로 구성한다. 여기에는 API, 데이터베이스, 메시지 큐, 스케줄러, OVN-Northd 등을 배치할 수 있다.
    • 컴퓨트는 총 20대로 구성하고, 각각 듀얼 소켓 기반 CPU (56vCPU 수준)와 256~384GB RAM 정도를 가정했다. Overcommit 비율은 CPU 2:1, RAM 1.2:1 정도로 잡으면 c2m4 스펙(2vCPU / 4GB RAM) 기준으로 대당 약 50~60대 정도의 VM을 안정적으로 배포할 수 있다. 전체 Compute 용량 기준으로는 약 1,120대의 VM을 수용할 수 있다.
    • 스토리지는 Ceph를 가정했고, 10대의 OSD 서버에 12TB HDD 12개씩 구성했다. 이를 기준으로 총 raw 용량은 1,440TB이며, 3중 복제를 기준으로 usable 용량은 약 480TB 정도가 된다. 이를 기반으로 하면 VM당 평균 약 400GB 가량의 블록 스토리지(RBD)를 할당할 수 있고, 운영 시에는 스냅샷, 백업 등을 고려하여 300~350GB 수준으로 관리할 수 있을 것이다.
    • Ceph OSD 서버는 16~24코어, 128~192GB RAM을 가진 중급 이상의 스토리지 노드로 설정하며, 1 OSD당 약 1.0~1.5 vCPU, 4~6GB RAM이 필요하다는 Ceph 가이드라인을 참고했다. 따라서 서버당 12개 디스크 구성이라면 12 OSD 기준으로 16코어는 가능한 하한이며, 여유를 두고 설계한다면 24코어가 더 적절할 수 있다.
    • 나머지 7대는 네트워크/인프라 영역으로 분류되며, 모니터링, 로깅, 메트릭 수집, 배스천 서버, CI/CD 엔진, RadosGW, 백업 노드 등으로 활용할 수 있다. 실제 운영 시에는 이 노드들이 가볍게 보이지만, 지속적인 로깅, 리텐션, 메트릭 수집이 클러스터 전체 성능에 영향을 주기 때문에 독립 배치가 바람직하다.
    • OVN 사용을 기본으로 생각했고, NS 트래픽은 BGP/EVPN 등을 고려하고, EW 트래픽은 Geneve를 고려했다. EW 쪽에서 SR-IOV/DPDK 도 옵션이라 하는데, 조금 난이도가 있게 느껴진다.
    • 그래서 이런 구성에서 실제 스위치, 라우터 설정을 어떻게 해야하는 것일까 … 라는 어려운 숙제를 가지고 있다.
  • 내일은 KCD 2025에 참석하기 위해서 대강 8시 30분에 출발해야 한다.

이외의 생각

  • 더워진다. 저녁 먹을 때 너무 덥고 꿉꿉해서 선풍기를 꺼냈다. 아직 청소가 안 된거라 찝찝하긴 했는데 더운 건 참을 수 없었다.
  • 밥 먹을 때 보통 윈도우 컴퓨터로 유튜브를 보는데, 오늘은 무슨 날인지 컴퓨터가 갑자기 죽어버렸다. 허탈한 마음으로 본체 분리해서 전원선 뽑고 다른 곳 가서 잠시 기다렸다가 다시 연결하니 잘 켜졌다. 이게 뭘까 … 전원 공급이 불안정한건지, 아니면 다른 문제인지 모르겠다.
  • 컴퓨터 분리한 김에 청소도 하고, 구조도 바꿨다. 책상 위의 메인 컴퓨터를 옛날 맥북으로 바꿨다. 이제 좀 더 공부에 집중할 수 있는 환경이 되지 않았을까 …