엔비디아 아성에 균열을 낸다 — 퓨리오사AI 'RNGD' 양산, 무엇이 달라지는가 > TECH

TECH

엔비디아 아성에 균열을 낸다 — 퓨리오사AI 'RNGD' 양산, 무엇이 달라지는가

팔레트

03-05 672 회 0

🚀 엔비디아 아성에 균열을 낸다 — 퓨리오사AI 'RNGD' 양산, 무엇이 달라지는가

AI 데이터센터 담당자라면 요즘 이런 고민을 한 번쯤 해봤을 거예요. "엔비디아 H100 한 장에 억 단위 예산을 써야 하는 게 맞는 건가?" 추론 워크로드가 폭증하면서 GPU 전력 요금이 서버 운용 비용의 절반을 넘기 시작했고, 많은 엔지니어들이 슬슬 대안을 찾기 시작했어요. 바로 그 시점에, 2026년 1월 퓨리오사AI가 조용하지만 굵직한 소식을 터뜨렸습니다.

퓨리오사AI가 2세대 칩 '레니게이드(RNGD)'의 양산을 공식 시작했으며, TSMC가 제조한 RNGD 4,000장을 인도받았다고 1월 28일 밝혔어요. 스타트업이 '칩 설계 완료'를 발표하는 것과 '실제 양산'을 발표하는 건 완전히 다른 차원의 이야기예요. 후자는 공급망, 파운드리 협력, 패키징, 소프트웨어 스택까지 모든 퍼즐이 맞아떨어졌다는 신호니까요.

🧠 RNGD는 왜 'GPU가 아닌 NPU'로 설계되었나

여기서 잠깐, 설계 철학부터 짚어봐야 해요. 엔비디아 GPU는 원래 그래픽 렌더링용으로 태어났고, AI 훈련(Training)에 특화된 방향으로 진화해 왔어요. 수천 개의 CUDA 코어가 병렬로 돌아가며 거대한 행렬 연산을 처리하는 구조죠. 그런데 지금 데이터센터에서 실제로 가장 많이 돌아가는 건 '훈련'이 아니라 '추론(Inference)'이에요. 이미 학습된 모델에 사용자 쿼리를 집어넣고 결과를 뽑아내는 과정이요.

퓨리오사AI는 바로 이 지점에서 다른 선택을 했어요. 추론 전용 NPU(Neural Processing Unit)로 설계하되, 범용성 대신 효율을 극한으로 끌어올리는 방향이요. 마치 F1 레이서와 SUV를 비교하는 것처럼, "모든 걸 잘하는 차"보다 "이 트랙에서만큼은 압도적인 차"를 만들겠다는 철학이 담겨 있어요.

2024년 스탠퍼드 핫칩스 컨퍼런스에서 백준호 대표는 RNGD가 메타의 Llama 대형 언어모델을 엔비디아 최상위 칩 대비 2배 이상의 전력 효율로 구동할 수 있다는 데이터를 발표했어요. 같은 연산을 절반의 전기로 해낸다는 의미예요. 데이터센터 입장에서 이건 단순한 스펙 수치가 아니라, 연간 수십억 원 단위의 전기료 차이로 직결되는 얘기예요.

이 기술의 배경을 깊이 이해하고 싶다면 HBM 고대역폭메모리 원리

나 NPU vs GPU 아키텍처 비교

글도 함께 보시면 좋아요.

💡 하드웨어 스펙보다 중요한 것 — 소프트웨어 스택과 생태계

AI 반도체 스타트업들이 자주 빠지는 함정이 있어요. "칩 성능은 좋은데 쓸 수 있는 소프트웨어가 없다"는 문제예요. 엔비디아가 수십 년간 CUDA 생태계를 구축해온 이유가 바로 여기에 있죠. 아무리 빠른 칩이라도 PyTorch나 TensorFlow와 연동되지 않으면 개발자들이 쓸 수가 없으니까요.

퓨리오사AI는 이 부분을 상당히 현실적으로 접근했어요. Furiosa SDK를 풀스택으로 공개하고, YOLO 같은 인기 모델들을 미리 최적화해 제공하는 Model Zoo, PyTorch와의 호환성을 유지하면서도 메모리 관리와 연산 효율을 극대화하는 컴파일러까지 직접 개발했어요. 개발자가 기존 코드를 대규모로 수정하지 않아도 레니게이드 위에서 돌아갈 수 있는 환경을 만든 거예요.

실제 검증 결과도 주목할 만해요.

🔹 LG AI연구원 — 실제 구동 환경에서 RNGD의 성능이 매우 우수하다고 평가

🔹 오픈AI — 서울 행사에서 RNGD를 활용한 데모 직접 시연

🔹 LG 엑사원(EXAONE) — LLM 서비스에 RNGD 정식 도입 확정

🔹 아카마이 — 엣지 컴퓨팅 인프라 적용 논의 진행 중

빅테크가 먼저 알아봤다는 건 의미심장한 신호예요. 투자자를 설득하는 데모가 아니라, 실제 프로덕션 환경에서 통한다는 걸 증명한 거니까요.

💻 양산 구조 해부 — TSMC·SK하이닉스·ASUS가 맞물린 공급망

레니게이드 한 장이 세상에 나오기까지 거치는 과정이 흥미로워요. 퓨리오사AI는 팹리스(Fabless) 회사예요. 설계만 하고 제조는 외부에 맡기는 구조죠.

RNGD는 TSMC 5나노 공정으로 제조되며, 에이수스(ASUS) 카드 제조 공정을 거쳐 출고돼요. PCIe 카드 형태는 180W TDP의 저전력 설계를 적용해 기존 서버에 바로 장착 가능한 AI 가속기로 제공되고, NXT RNGD 서버는 RNGD 카드 8장을 탑재한 4U 랙마운트 서버로 시스템 전체 소비 전력이 3kW에 불과해요.

여기에 메모리는 SK하이닉스 HBM3를 탑재하고 있어요. 한국 팹리스 + 세계 최고 파운드리 + 세계 최고 메모리라는 조합이 완성되는 거죠. 연내 출시 예정인 업그레이드 버전 '레니게이드+'는 HBM3E 2개로 메모리 용량을 기존 48GB에서 72GB 수준으로 끌어올릴 계획이고, '레니게이드+ 맥스'는 HBM3E 4개를 장착해 총 144GB의 메모리 용량을 구현할 것으로 알려졌어요.

이 로드맵을 보면 퓨리오사AI가 단순히 "일단 양산"에 만족하지 않고, 모델 크기가 점점 커지는 LLM 시장의 메모리 수요를 따라가겠다는 의지를 확인할 수 있어요. 현재 GPT-4급 모델을 풀 정밀도로 올리려면 수백 GB의 메모리가 필요한데, 144GB까지 늘리면 중간 규모 LLM 추론 서버로도 충분히 경쟁할 수 있어요.

🚀 메타 인수 제안을 거절하고 선택한 길

퓨리오사AI의 여정에서 빼놓을 수 없는 드라마가 있어요. 퓨리오사AI는 2025년 3월 메타로부터 약 8억 달러(약 1조 1,536억 원) 규모의 인수 제안을 받았으나 독립 경영을 선택했어요. 직원들은 평생 일하지 않아도 될 돈을 거절한 대표를 두고 반신반의했을 거예요.

이 결정 이후 오히려 분위기가 바뀌었어요. 메타 인수설이 퓨리오사AI의 기술력을 전 세계에 공짜로 광고해준 셈이 됐고, 이후 투자 유치가 물꼬를 텄어요. 2025년 7월 시리즈C 브릿지 라운드에서 총 1,700억 원 규모의 투자를 유치하며 기업가치 1조 원을 돌파, 유니콘 반열에 올라섰어요. 40여 개 기관이 참여했고, 일반적으로 초기 기업에 투자하지 않는 사모펀드(PE)까지 총 400억 원 규모로 참여했다는 사실이 눈길을 끌어요. 이건 단순한 테크 베팅이 아니라 '성장 단계 기업'으로 인정받았다는 신호거든요.

AI 반도체 팹리스 스타트업 생태계

에 관심 있으신 분들은 국내 경쟁사들의 방향성도 함께 비교해보시면 더 입체적으로 볼 수 있어요.

💡 산업적 파급 — 엔비디아 의존도를 낮출 수 있을까

현실적으로 단기간 내 엔비디아를 대체한다는 건 무리한 이야기예요. CUDA 생태계는 20년에 걸쳐 쌓인 해자(Moat)예요. 하지만 시장이 퓨리오사AI 같은 플레이어를 원하는 이유는 분명해요. 추론 시장의 구조가 훈련 시장과 본질적으로 다르기 때문이에요.

AI 훈련은 소수의 대형 클러스터에서 이루어지지만, 추론은 수십만 개의 서버에 분산돼 24시간 돌아가야 해요. 이 경우 전력 효율이 2배라는 건 운영 비용이 절반이 된다는 뜻이에요. 데이터센터 입장에선 칩 구매 비용보다 오히려 운영 전기료가 더 큰 변수가 되고 있거든요. 백준호 대표는 "앞으로는 중앙형 데이터센터뿐 아니라 엣지 단계에서 추론 수요도 빠르게 증가할 것"이라고 밝혔어요. 엣지 환경에서는 전력과 공간 제약이 더 극심하기 때문에, 고효율 NPU의 경쟁력은 오히려 더 강해질 수 있어요.

퓨리오사AI가 목표로 하는 올해 양산 물량은 2만 장 수준이며, 초기 물량은 국내 고객사 비중이 크겠지만 연간 기준으로는 해외 거래선 비중이 과반 이상을 차지할 것으로 전망하고 있어요. 미국, 중동, 인도 시장이 주요 타깃이에요. 나스닥 상장 가능성도 거론되는 이유가 여기에 있어요.

🧠 이 칩이 가져올 미래의 의미

한국은 메모리 반도체 분야에서 세계 1위였지만, 시스템 반도체에서는 항상 "설계는 미국, 제조는 TSMC"라는 공식 앞에 한 발 물러서 있었어요. 퓨리오사AI의 RNGD 양산은 단순히 한 스타트업의 성과를 넘어, 한국이 AI 칩 설계 역량을 실제 시장에서 증명하는 첫 번째 본게임이에요.

✅ TSMC 5나노 + SK하이닉스 HBM3 + 퓨리오사AI 설계 = 한국발 AI 반도체 공급망 완성

✅ 엔비디아 대비 2배 이상의 전력 효율로 추론 전용 NPU 시장에서 실질적 경쟁력 확보

✅ LG AI연구원·오픈AI 등 글로벌 레퍼런스 확보로 '기술 스펙'에서 '실사용 검증' 단계로 진입

그렇다면 한 가지 질문이 남아요. AI가 전기를 얼마나 쓰느냐는 단순한 비용 문제가 아닐 수 있어요. 지구 전체의 전력망이 AI 추론 수요를 감당할 수 있을지, 그 지속 가능성을 고민하는 시대에 '효율'이라는 가치는 단순한 스펙을 넘어 윤리적 선택의 문제가 되어가고 있어요. 퓨리오사AI가 만든 칩 한 장이 그 질문에 어떤 답이 될 수 있을지, 여러분은 어떻게 생각하세요?

추론용 AI 칩 시장의 변화, 혹은 직접 RNGD를 도입할 계획이 있으신 분들이라면 댓글로 생각을 나눠주세요 😊

#퓨리오사AI #RNGD레니게이드 #AI반도체 #NPU추론칩 #국산AI칩