C++,CUDA (4) 썸네일형 리스트형 [CUDA] 병렬 프로그래밍을 가능하게 하는 것: 비동기, Pinned Memory, 그리고 Stream 해당 포스팅은 AI와 NVIDIA에서 공식적으로 게시하는 문서인 CUDA Programming Guide 문헌을 기반으로 만들어졌음을 알립니다. 개인적으로 최대한 엄밀하게 검증을 거쳤으며 혹여나 잘못된 내용이 있다라고 판단되면 적극 피드백 부탁드립니다. 이번 포스팅에서는 CUDA 프로그래밍에서 실질적인 병렬성 프로그래밍을 구현하기 위해 필요한 것들에 대해서 알아보도록 하자. 실습 코드는 지난 포스팅에서 배운 두 벡터를 덧셈하는 커널을 이용해본다. 앞으로 우리가 배울 개념들은 크게 비동기, Pinned Memory, Multi-Stream이다.*앞으로, CPU 장치를 호스트 장치로, GPU 장치를 디바이스 장치로 부르도록 하겠다.1. 호스트 장치는 디바이스 장치에게 비동기로 명령하라!비동기라는 단어는 사실.. [CUDA] 두 1차원 벡터 덧셈 연산을 CUDA로 프로그래밍 해보자! 해당 포스팅은 AI와 NVIDIA에서 공식적으로 게시하는 문서인 CUDA Programming Guide 문헌을 기반으로 만들어졌음을 알립니다. 개인적으로 최대한 엄밀하게 검증을 거쳤으며 혹여나 잘못된 내용이 있다라고 판단되면 적극 피드백 부탁드립니다. *앞으로, CPU 장치를 호스트 장치로, GPU 장치를 디바이스 장치로 부르도록 하겠다.이번 포스팅에서는 본격적으로 CUDA 프로그래밍을 통해서 벡터 연산을 수행하는 코드를 직접 작성해보고 실행해보도록 하자. 이 과정을 수행하면서 우리는 호스트 장치에서 디바이스 장치에서의 연산을 어떻게 실행하고 결과를 받아볼 수 있는지 그 매커니즘에 대해서도 이해해보도록 하자.1. Kernel 작성하기디바이스 장치에서 연산을 실행하기 위해서 어떤 연산을 실행할지 가장 먼.. [CUDA] GPU를 구성하는 여러가지 단위: Kernel, Grid, Block, Thread, Warp, 그리고 첫 프로그램 Hello.cu! 이번 포스팅에서는 GPU를 구성하는 여러가지 단위에 대해서 이론적으로 이해해보고 실제로 이 단위를 코드 레벨에서 확인해보는 첫 프로그램인 Hello.cu 소스코드도 작성해보고 실행해보려 한다. 참고로 해당 포스팅은 AI와 NVIDIA에서 공식적으로 게시하는 문서인 CUDA Programming Guide 문헌을 기반으로 만들어졌음을 알립니다. 개인적으로 최대한 엄밀하게 검증을 거쳤으며 혹여나 잘못된 내용이 있다라고 판단되면 적극 피드백 부탁드립니다. 1. GPU 장치에서 실행되는 함수: Kernel우리에게 익숙하고 그동안 잘 이용해왔던 컴퓨터에서 IDE를 켜고 아무 프로그래밍 언어 하나를 선택해서 Hello World! 라는 문자열을 출력시키는 함수를 만들고 실행한다고 해보자. 이 때, Hello Wor.. [CUDA] CLion + Lightening.ai 로 무료 CUDA 프로그래밍 환경 세팅 이전에 인프런의 널널한 개발자 강사님 강의로 C++ 기초를 입문했다. 이전에 C 강의도 듣긴했었는데 C언어에서 객체지향 패러다임이 추가된 C++인 점, 그리고 ML 플랫폼 엔지니어로서 계속 보편적으로 이용되고 있는 하드웨어인 GPU에 대한 지식을 쌓기 위해서 GPU에서의 로직을 프로그래밍하는 CUDA가 C/C++ 기반인 점을 고려해서 최근부터 CUDA 프로그래밍을 공부하기 시작했다. 앞으로의 포스팅 시리즈에서 C/C++언어에 대한 기초 문법이나 이런 것들을 당연히 알고 있다는 전제하에 진행한다. 사실 언어에 대한 문법 및 사용법들은 AI가 훨씬 잘 대답해주기 때문에 여기서는 길게 설명하지 않는다. 우리가 앞으로 집중할 내용은 CUDA 프로그래밍을 수행하면서 GPU 하드웨어가 어떤 구조로 구성되어 있고.. 이전 1 다음