엔비디아의 Geforce RTX 4060 3종 톺아보기
엔비디아의 4시리즈 성능 과연 어떨까
무려 1,600달러라는 가격표를 달고 나온 지포스 RTX 4090와 함께 새로운 엔비디아 RTX 40 시리즈 그래픽 카드가 데뷔한 지 7개월 만에, 새로운 에이다 러브레이스(Ada Lovelace) 아키텍처가 공개됐다. 엔비디아는 1개도 2개도 아닌, 3개의 지포스 RTX 4060 라인업을 공개했다. 첫 모델인 RTX 4060 Ti(399달러)는 5월 24일 출시된다. 16GB 메모리를 탑재한 499달러짜리 RTX 4060 Ti 버전과 299달러짜리 일반형 지포스 RTX 4060은 7월 출시될 예정이다.
엔비디아는 최근 그래픽 카드와 관련한 논란을 의식한 듯하다. 첫째, RTX 4060 Ti가 이전 모델과 동일한 가격을 유지하면서 RTX 40 시리즈의 터무니없이 높은 가격 급등세가 일단 멈췄다. 둘째, 8GB VRAM으로는 PC 게임에 더 이상 충분하지 않다는 우려를 불식시키기 위한 16GB 모델이 추가됐다. 단, 이 GPU의 기술 스펙을 고려할 때 그 정도의 웃돈을 주고 살 가치는 없을 수도 있다.
엔비디아 지포스 RTX 4060 Ti
두 버전의 지포스 RTX 4060 Ti는 메모리 용량을 제외하면 나머지는 동일하다. 앞서 엔비디아가 RTX 4080 12GB 버전 출시를 시도했다가 중단한 이후 환영할 만한 변화다. 이번 4060 Ti와 달리, 4080은 메모리에 따라 GPU도 달랐다. 즉, 4080 12GB가 그대로 출시됐다면 서로 다른 2개의 GPU가 RTX 4080이라는 이름을 함께 사용할 뻔했다. 이 카드는 결국 RTX 4070 Ti로 모델명이 바뀌어 출시됐다.
엔비디아에 따르면 RTX 4060 Ti는 탁월한 1,080p 게임 성능을 목표로 한다. 스팀(Steam)의 하드웨어는 xx60급 그래픽 카드가 압도적으로 많고, 대부분 사용자가 1,080p 디스플레이를 사용하기 때문이다. 새로운 에이다 러브레이스 GPU를 기반으로 구축된 RTX 4060 Ti는 에이다의 놀라운 성능을 자랑하는 DLSS 3 기술, 최첨단 AV1 인코딩을 갖춘 NVENC, 뛰어난 전력 효율성을 메인스트림 가격대에 제공한다. 엔비디아가 공개한 초기 성능 결과는 레이 트레이싱과 DLSS를 지원하는 게임을 위주로, 최근 지포스가 초점을 맞추고 있는 AI를 부각한다. 훌륭하고 멋지긴 하지만, 아쉽게도 이전 모델 대비 GPU 성능 향상이 어느 정도인지는 가늠하기 어렵다.
엔비디아는 레이 트레이싱, DLSS 성능, 에너지 효율성을 강조하는 RTX 4060 Ti의 일부 사양도 공개했지만 차트에는 다양한 GPU 하드웨어 코어의 순수 테라플롭 성능만 나와 있을 뿐 쉐이더, RT, 텐서 코어의 명확한 수치는 없었다. 초기 유출된 정보에 의하면 RTX 4060 Ti의 CUDA 코어 수는 4,352개로, RTX 3060 Ti의 4,864개에 비해 적은데, 사실이라면 이것이 엔비디아가 구체적인 수치를 공개하지 않은 이유일 수 있다. 하지만 에이다 러브레이스 코어는 RTX 30 시리즈의 암페어 코어보다 성능이 높다.
한 가지는 확실한 것은 4060 Ti의 메모리 버스 대역폭은 RTX 3060 Ti의 256비트에서 128비트로 줄어들었다는 점이다. 교통 혼잡에 빗대어 생각해 보자. 메모리 요청이 자동차라면 버스 대역폭은 도로의 크기다. 100대의 차량은 1차선 비포장도로보다 4차선 고속도로에서 훨씬 더 빠르게 달릴 수 있다. 카드의 전반적인 메모리 대역폭이 이 같은 속도를 좌우한다고 보면 된다. 표면적으로 지포스 RTX 4060 Ti의 전체 메모리 대역폭은 초당 288GB로, 3060Ti의 초당 448GB에 비해 현격히 낮다.
하지만 그렇게 간단한 문제는 아니다.
엔비디아는 RTX 40 시리즈에서 AMD 인피니티 캐시(Infinity Cache) 기술의 한 부분을 슬쩍 가져와 GPU 자체에 대형 온다이 캐시를 올렸다. RTX 4060 제품군도 예외는 아니다. 물리적으로 가까울수록 캐시의 속도가 더 빨라질 뿐만 아니라 GPU 주변에 배치된 메모리 칩으로 많은 요청을 보낼 필요도 줄어든다(위 슬라이드 참조). AMD의 인피니티 캐시는 L3 캐시를 사용하는 반면, 엔비디아는 32MB의 L2 캐시를 선택했다(3060 Ti의 경우 2MB에 불과). 엔비디아는 L2 캐시가 특히 레이 트레이싱과 DLSS 성능을 개선하는 데 도움이 되며, 기술 사양에 표시된 ‘효과적인’ 메모리 대역폭을 제공한다고 말했다.
문제는 다음과 같다. 32MB의 인피니티 캐시와 128비트 버스를 탑재한 지난 세대 라데온 RX 6600 XT를 다룬 리뷰에서 확인된 바와 같이, 대용량 온라이 캐시와 쪼그라든 버스 대역폭의 조합은 GPU가 목표로 하는 디스플레이 해상도에서 성능과 전력 2가지 모두 우수한 결과를 제공하지만, 더 높은 해상도에서는 예상보다 기대 이하의 결과를 보여준다. 해상도가 높아질수록 더 많은 메모리가 필요하고, 따라서 온라이 캐시의 적중 횟수가 줄어든다. 이렇게 되면 메모리 요청이 일반 메모리로 전달돼 RTX 4060 Ti의 훨씬 더 작은 128비트 버스로는 힘겨운 상황이 될 수 있다.
이 문제가 RTX 4060 Ti에도 해당되는지는 리뷰가 나올 때까지 기다려야 한다(1,440p 게임에 맞춰 조정된 유사한 기술을 쓰는 RTX 4070의 경우는 이 같은 결과가 발생했다). 만약 그렇다면 실망스러울 것이다. RTX 3060 Ti는 준수한 1,440p 성능과 탁월한 1,080p 게임 성능을 제공했기 때문에 지난 세대에서 최고의 지포스 카드 중 하나였다. 참고로 지포스 제품 관리자 저스틴 워커는 RTX 4060 Ti가 1,440p에서도 게임을 구동할 수 있지만, 일부 게임에서 일부 설정을 조정해야 할 수 있으며, DLSS를 지원하는 게임은 성능 향상 효과를 얻을 수 있다고 언급했다.
RTX 4060 Ti가 1,080p 게임에 가장 적합하다면 다양한 메모리 옵션은 별 의미가 없을 수 있다. 일부 최신 게임은 1,080p 해상도에서 이미 8GB를 초과해 그래픽 설정을 조정하지 않으면 화면 끊김 현상이 발생할 수 있지만, 대다수 게임은 그렇지 않다. 확실한 결과는 5월 24일(8GB)과 7월 중(16GB)에 카드를 입수해서 테스트를 해봐야 알 수 있을 것이다.
두 모델 모두 전력 효율성은 매우 뛰어난 것으로 보인다. 8GB 모델의 정격 소비전력은 160W, 16GB 모델은 165W로, 5W의 미미한 차이만 있다.
지포스 RTX 4060
이게 전부가 아니다! 엔비디아는 299달러짜리 지포스 RTX 4060의 기술 사양과 초기 성능 테스트 결과도 공개했다.
여기서 4060 Ti에 관해 언급한 모든 내용은 4060에도 당연히 적용된다. 4060은 4060 Ti와는 다른 코어 GPU를 사용하며, 엔비디아가 제공한 사양을 보면 Ti 모델과의 성능 차이는 체감될 수준이 될 것으로 보인다. 하지만 DLSS 3, AV1 인코딩, 매우 뛰어난 전력 효율성을 비롯한 에이다 러브레이스의 모든 이점은 똑같이 제공된다. 엔비디아가 제공한 초기 성능 정보를 보면 DLSS를 지원하는 게임에서 이전 모델을 확실히 앞선다.
이 모델에서도 메모리 서브시스템에 대해 2가지 짚고 넘어갈 부분이 있다. 첫째, 온다이 L2 캐시가 Ti의 32MB보다 적은 24MB다. 둘째, RTX 4060 역시 RAM 용량은 8GB로, 이전 RTX 3060의 12GB보다 줄어들어 아쉬움을 준다. 다만 RTX 3060의 출시가격은 329달러였고, 더 발전된 제조 공정으로 만들어지는 RTX 4060은 299달러다.
엔비디아는 메모리에 관한 우려를 불식시키고자 이전 모델과 대비해 RTX 4060의 1% 하위 성능 결과까지 공개했다. 게임에서 GPU VRAM이 부족하면 훨씬 더 느린 메인 시스템 메모리를 사용하게 되고, 이에 따라 심한 끊김 현상이 발생하게 된다. 엔비디아가 선택한 게임에서 이런 현상이 발생했다면 위의 차트에서 결과로 나타났을 것이다. 단, 레이 트레이싱과 DLSS를 활성화하면 기술 요구사항도 바뀌고, 해당 차트의 모든 게임은 가능한 경우 DLSS과 레이 트레이싱을 활성화한 상태였다. 이런 기능을 활성화하지 않은 게임에서는 현저한 차이가 나타날 수 있다. 다시 한번 말하지만, 정확한 결과는 7월 RTX 4060이 출시된 후 독립적인 테스트를 해봐야 얻을 수 있을 것이다.
저가형 GPU의 부흥?
팬데믹과 암호화폐로 인해 거의 5년 동안 외면받았던 저예산 PC 게이머를 사이에 두고 갑자기 치열한 전쟁이 일어나고 있다. 299달러의 4060은 인텔의 대폭 향상된 아크 A750(250달러)과 아크 A770(350달러에 16GB 메모리 제공), 그리고 할인 판매되는 지난 세대 AMD와 경쟁한다. 아울러 AMD가 새로운 보급형 라데온 RX 7600을 곧 출시한다는 이야기도 돌고 있다. 모든 결과는 최종 벤치마크에서 드러나겠지만, 어쨌든 보급형 PC 게임이 다시 시장의 관심을 받고 있다. 드디어 때가 왔다.
함께 읽어보면 좋을 글