대규모 사용자 디지털 환경 구현을 위한 인-메모리 인프라
[질문 1] 대용량을 위해 인메모리 db를 사용한다면 내부 CPU,GPU 의 상주 메모리인 RAM을 적극 활용한다고 생각하면 될까요?
[답변 1] 인메모리 데이터베이스의 핵심은 메모리내에 모든 데이터들을 상주 하게하여 CPU, GPU, FPGA등의 Requset에 대해 빠르게 Response 하는 개념입니다. 시스템내 파이프라인이 저장매체와 메모리간 통신버스 속도가 병목을 일으키기 때문에 인메모리에 데이터를 실시간으로 모두 연산한다기보다는Allocation 하여 연산자에 대한 즉각적인 반응을 구성하게됩니다.
[질문 2] 메타버스의 비용문제로 클라우드에 의존하는것아닌가요? 시스기어의 인메모리 컴퓨팅은 클라우드가 아닌건가요?
[답변 2] 시스얼라인의 DRAM 가상화 솔루션은 JEDEC 표준 설계 기반으로 구성되어있어 낸드플래쉬 제조공정에 영향을 받지 않습니다. 다만 인텔 옵테인의 메모리 플래쉬 기능 App mode 등(전원오프상태에서 DRAM메모리에 데이터 저장)을 운영할 수있도록 최적화 기능또한 제공합니다. 다시 정리드리자면 시스얼라인의 소프트웨어는 메모리 가상화를 할때 네트워크를 통해 다른 노드(서버)상의 메모리와 병합할때 , 그리고 시스템 내부버스상의 스토리지에 메모리 필드를 구성할때 특정 메모리 공정에 대한 제약사항이 없습니다.
[질문 3] 물리적 메모리 인프라의 확장 한계 문제를 효율적으로 해결할 수 있는 방법에 대해서 질문드립니다
[답변 3] 물리적 메모리 인프라의 확장 한계를 구성하기위해서 하드웨어 기준으로 설명드리자면 시스얼라인의 소프트웨어와 같은 SDM(소프트웨어 정의 메모리) 솔루션이 해답이라 생각합니다. 일반적인 고속 패블릭 네트워크로 연결된 다른 서버의 DRAM을 피지컬 메모리로 확장을 하거나 시스템 고속 저장매체 내부에 DRAM 테이블을 구성하여 DRAM화하는 것으로 진행되고 있으며 이것으로 시스템 메모리 슬롯의 한계를 극복할 수 있어. 제한없는 DRAM 메모리 자원을 구성할 수 있습니다. 또한 CXL 이라고 불려오는 차세대 DRAM 데이터 전송 파이프라인을 통해 시스템외부 통신을 통해 메모리를 확장하는 기술또한 강구되고 있습니다. 앞에서 논해드린 SDM 솔루션은 이러한 차세대 규격에서 사용자가 더욱 DRAM 메모리를 쉽게 사용할 수 있도록 인프라 도구로서 자리 잡고 있습니다.
[질문 4] Nvidia GPU의 활용성을 높여주는 MIG(multi-instance gpu) 같은 기능을 메모리단에서 지원해 주는 것으로 이해하면 되는 것인가요?
[답변 4] 넵 맞습니다 MIG 를 통해 물리적 Cuda 각 프로세서를 vGPU화 하여 필요한 인스턴스로 할당하는 기본 구조와 유사 합니다. DRAM 메모리 또한 세분화된 vMEM화 하여 이종시스템간 네트워크, 시스템 버스 간의 통신을 구성하는 기술로 입니다.
[질문 5] 시스템 내부의 고속 저장장치를 DRAM처럼 사용할 수 있는 원리와 방안에 대해서 문의드립니다
[답변 5] 시스템 내부의 고속저장 장치로 사용하는 원리는 다음과 같습니다. 시스얼라인의 경우 PCI-e 로 연결된 SSD에 파일시스템 테이블이 아닌 DRAM과유사한 메모리 테이블을 구성합니다. 그리고 데이터가 우선적으로 통신 파이프라인인 DRAM 으로 Allocate 되며 용량이 넘을 경우 지정한 저장매체로 데이터가 move 됩니다. 이때 시스얼라인의 경우에는 데이터티어링 기술을 적용하여 각 데이터의 우선순위를 지정하여 자주 사용하는 것은 DRAM의 메모리 필드로 자주 사용하지 않는 데이터는 저장매체의 메모리 필드로 저장하는 동작을 하게됩니다. 이 데이터티어링은 ms 단위로 계속 체크하여 메모리 사용성을 최대로 높히게됩니다. 시스얼라인의 소프트웨어는 리눅스에 원스클릭으로 설치되며 설치시 DRAM 으로 사용할 저장매체를 지정하면 설치후 피지컬 메모리로 인식이 됩니다.
[질문 6] 오 정말 획기적인 아이디어네요…앞으로 다양한 분야 특히 메타버스에서는 반드시 필요하겠네요..
[답변 6] 메타버스는 보다 가상의 넓은 영 역에서 많은 사용자가 사회, 경제, 정치 ,문화를 모두 담으며 단순 데이터 흐름이 아닌 AI/ML 모델, 빅데이터, NFT 등 복합 데이터 기술을 통한 콘텐츠를 사용할 수 있게 하는 플랫폼 카테고리입니다. 이때사용자가 느끼는 디지털 몰입도가 서비스의 핵심 요소로 지목되며 이 기준은 사용자가 가상 세계에서 자신을 대신하는 아바타 (캐릭터)에 대한 사용자의 입력에 대한 반응속도가 대표적이라 할 수 있습니다. 메타버스 내의 모든 기본 자료들은 결국 데이터의 집합체, 즉 데이터베이스에서 가져오게 되며 사용자의 액션과 행위 일체의 자료들은 데이터베이스에서 저장되며 관리됩니다. 즉 메타버스의 대용량 데이터가 담겨 있는 데이터베이스를 빠르게 처리하는 속도가 서비스 경쟁력의 확보로 직결되며 이런 대용량 데이터베이스를 빠르게 처리 하기 위해 인-메모리 컴퓨팅이 성장하였습니다. 하지만 이런 인-메모리 컴퓨팅을 동작하게 할 수 있는 인프라 시설(하드웨어, 클라우드 포함)은 기업에서는 막대한 비용을 구성해야 합니다. 기업과 데이터센터에서는 자체 하드웨어를 차세대 제품으로 업그레이드 또는 교체 하거나 클라우드 서비스를 통해 확장하며 대응하지만, 데이터 증가 속도에 따라가기 위해 지속적으로 큰 비용과 시간을 할애하게 됩니다. 이러한 해결책으로 소프트웨어 정의 (SDx) 라고 하는 기술 카테고리가 빠르게 성장하고 있습니다. 한국의 SYSALIGN 하이퍼 스케일 메모리 확장 도구는 소프트웨어는 인프라 구축을 위한 TCO를 절반 가까이 절감할 수 있으며 기존에 보유하고 있는 시스템을 재활용해 시대의 변화에 대응할 수 있습니다. 원-클릭으로 수 분 만에 서버를 구축하고 실시간으로 성능을 확인하고 사전 대응하기때문에 무 정지 인프라에 대한 우수성을 제공합니다.
[질문 7] 대용량 메모리 사용에 따른 메모리 관리는 어떻게 이루어지는 지요? 인메모리 모니터링을 통한 사용양 관리와 최적화에 따른 비용 절감 관련하여 어떻게 지원되는지요?
[답변 7] 시스얼라인의 소프트웨어는 Hopper (인프라 배포 도구) 를 함께 제공됩니다. 자체 CUI / GUI 환경을 제공하여 DevOps와 같이 인프라와 서비스 설계, 유지 보수에 대한 높은 기술 장벽 허들을 낮춤으로써 기술 인적 리소스 의존도를 낮추는 기능을 제공합니다. 또한 표준 RestAPI 와 클라우드 모니터링 표준 소프트웨어인 REDFISH또한 연동을 지원합니다. 각 모니터에는 시스템 노드/가상화그룹/컨테이너 단위로 시스템 리소스를 체크하고 모니터링 되게 됩니다. 베어메탈 기반인 하드웨어 및 프라이빗 클라우드 환경에서는 솔루션의 라이센스 키를 고객이 사용 목표 값을 지정하여 비용이 구성되며 퍼플릭 클라우드의 경우 사용자가 사용 목표 값 지정 또는 자동 과금 프로그램으로 통해 최적화할 수 있는 기능이 제공됩니다.
[질문 8] 예전부터 디스크를 메모리 처럼 사용하는 기술은 있었는데, 인메모리기슬로 대용량 nvme ssd를 인메모리영역으로 사용해서 빠른 처리는 좋은데 점점 증가하는대용량 영상데이터와 이미지, 빠른 AI 분석을 위해 nvme ssd 이상에 장치가 개발 되는것보다 아예 차세대 nvme ssd 장치에 메모리를 별도로 추가 하든지, 인메모리 용 별도 신 HW 를 추가하는 방안이 논의되는지 궁금하네요
[답변 8] 현재 인텔의 표준 고속 DRAM 통신 규격인 CXL 이 출시를 앞두고 있습니다. 이미 뉴스에 알려진 것과 같이 삼성전자, SK하이닉스에서 CXL기반을 통해 PCI-e 5.0 통신으로 외부 메모리 모듈 장치가 상용화 준비 되고 있습니다. 시스얼라인 솔루션은 이러한 신규 시스템과 기존 시스템과의 메모리 공유를 통해 기존 시스템 라이프싸이클을 연장하고 이러한 CXL 기반의 메모리를 사용성을 높이는 기술로 발전되고 있습니다. 현재 CXL의 SDK는 외부 저장DRAM 용량을 올리기위해서는 개발자가 각 프로세스와 외부 메모리간의 맵핑을 해야 합니다.
One reply on “[코리아 그래픽스 2022] 질문 응답 / 시스기어 엄상호 대표”
[…] 시스기어 엄상호 대표 […]
좋아요좋아요