반도체 설계에서 양자까지, 40주년 디지털 만능기판 ‘FPGA’ [권용만의 긱랩]

IT조선|권용만 기자|2025.10.29

오늘날 우리가 자연스럽게 쓰는 최첨단 ‘칩’의 뒷면에는 여러 가지 생각지 못했던 어려움이 있다.

반도체 칩은 설계와 제조 비용 모두에서 ‘소량 생산’을 생각하기 어렵다. 자본 측면에서 작은 회사는 진입하기 어렵다. 한 번 회로를 만들면 수정도 어렵다. 수정을 위해서는 제조 공정 과정 전반을 고쳐야 하고 제품도 교체해야 한다. 이는 큰 비용 손실로 이어진다. AI 시대에 분명 주문형 반도체가 유리함에도 범용 GPU가 많이 사용되는 중요한 이유 중 하나도 여기 있다.

프로그래밍 가능한 하드웨어로 표현되는 FPGA(Field-Programmable Gate Array)는 소프트웨어로 하드웨어의 설계를 정의할 수 있는 점이 특징이다. 달리 말하면, 이 FPGA는 디지털 칩 구현에 있어서의 ‘만능 기판’ 같은 존재다. 이 FPGA의 등장은 반도체 설계의 진입 장벽을 낮춰 현재 각광받는 ‘팹리스(Fabless)’ 비즈니스 시장을 개척하게 된 계기로도 꼽힌다. 가전과 IoT부터 자동차, 항공우주, 양자 컴퓨팅에 이르기까지 다양한 용도의 ‘특수 회로’ 구현에 가장 합리적인 방법으로도 사용된다.

올해는 자일링스(Xilinx)가 세계 최초의 상업용 FPGA를 출시한 지 40년째 되는 해다. 현재 이 FPGA 시장은 대략 AMD, 인텔이 인수했다. 하지만 현재는 분사한 알테라(Altera)의 양강 체제가 오랫동안 이어지고 있다. 인텔의 알테라 인수와 AMD의 자일링스 인수 모두 당시에는 대규모 인수 사례로 손에 꼽힐 정도였다. FPGA는 현재 10억달러(약 1조4300억원) 규모 이상의 시장을 만들었고, 자일링스는 AMD에 인수된 뒤에도 지금까지 전 세계 7000개 이상 고객사에 30억개 이상의 FPGA와 적응형 시스템온칩(SoC)을 출하한 바 있다.

AMD 버설 적응형 SoC 기반 개발 보드 / AMD
AMD 버설 적응형 SoC 기반 개발 보드 / AMD

‘수정 가능한’ 논리 회로 하드웨어로 등장한 FPGA

FPGA 이전에도 수정 가능한 회로를 위한 다양한 구현 방법이 존재했다. 여러 개의 로직 소자를 엮어서 입출력 구성을 바꿀 수 있는 PAL(Programmable Array Logic)이나 PLD(Programmable Logic Device)가 있었고, 이러한 디바이스들이 발전하면서 ‘FPGA’가 등장했다. FPGA와 이전 PLD와의 핵심적인 차이는 프로그래밍 용이성이었다. PLD가 한 번 쓰면 읽기만 되는 ROM(Read-only Memory)을 사용했다면, FPGA는 재기록 가능한 메모리를 사용할 수 있었다.

최초의 FPGA는 1984년 발표된 알테라의 EP300으로 알려졌지만, 최초의 ‘상업용’ FPGA는 1985년 자일링스가 선보인 XC2064다. 자일링스의 XC2064는 트랜지스터 8만5000개에 설정 가능한 로직 블록 64개, 입출력(I/O) 블록 58개 구성을 갖추고 있었다. 이후 FPGA는 규모를 키우는 것 뿐만 아니라 시스템 차원의 성능을 높이기 위해 점차 ‘시스템’ 형태로 발전해 왔다. 프로그래밍 로직 외부에 DSP와 메모리, 고성능 프로세서와 입출력 인터페이스를 탑재한 것이 대표적이다. 이 분야에서 주목할 만한 제품이 AMD의 ‘버설(Versal) 적응형 SoC’다.

FPGA는 ‘디지털 만능 기판’이란 표현처럼 반도체 설계로 구현할 수 있는 모든 것들을 구현해볼 수 있다. 극단적으로는 이 FPGA 안에 프로세서와 메모리, 인터페이스까지 모두 자체 설계해 올릴 수도 있다. 이러한 형태의 구현을 흔히 ‘소프트 코어’나 ‘소프트 블록’이라 한다. FPGA 초창기에는 이러한 형태의 구현도 제법 있었지만 최근에는 이러한 방법을 잘 쓰지 않는다. 이유는 성능 문제도 있지만, 고가의 제한된 자원인 로직 블록을 이런 데 쓰는 것이 그리 효율적이지도 않기 때문이다.

자일링스의 버텍스 제품군에서는 이미 2011년에 CoWoS 패키징을 썼다. / AMD
자일링스의 버텍스 제품군에서는 이미 2011년에 CoWoS 패키징을 썼다. / AMD

FPGA의 로직 블록은 유연하지만 주변 자원과의 연결과 전체 동작 속도에서 유연함과 맞바꾼 비효율 측면에서 한계가 있다. 이에 FPGA에 구현된 설계를 ASIC으로 만들면 이러한 문제가 사라지면서 칩의 동작 속도와 성능이 제법 크게 오르고, 칩 자체의 크기도 작아진다. 이에 주요 FPGA 제조 업체들은 고객들에 FPGA 기반 설계를 ASIC으로 양산할 수 있게 돕는 서비스도 제공했던 적이 있다. 이러한 비즈니스 모델의 존재는 반도체 설계를 중심으로 하는 ‘팹리스’ 모델로도 연결됐다.

IT 기술의 성능이 높아지면서 FPGA 또한 구성들이 바뀌기 시작했다. 프로그래밍 가능한 블록만 있는 것이 아니라, 프로그래밍 가능한 블록 주변에 범용으로 사용할 수 있는 프로세서나 DSP, 인터페이스 등 여러 가지 고정 구성 ‘하드 블록’이 조합된 시스템 형태가 자리잡게 된 것이다. IP 블록 단위에서는 ASIC같은 특성을 가지는 범용 ‘하드 블록’을 사용하면 시스템의 기본 구성에서 프로그래밍 가능한 블록을 아끼고 성능과 효율을 더 높일 수 있다. 흔히 쓰는 ‘바퀴를 다시 발명하지 마라’는 말과도 이어질 수 있을 부분이다.

FPGA에 ‘하드 블록’을 적용한 사례는 1990년대부터 나오기 시작했고, 2010년대에는 FPGA와 범용 프로세서를 조합한 ‘시스템’ 구성이 등장하기 시작했다. 자일링스는 2012년 ‘징크(Zynq)’ 제품군에서 Arm 프로세서와 프로그래머블 로직을 결합한 적응형 SoC 구성을 선보였고, 알테라 역시 2010년대 중반에 인텔 아톰 프로세서와 프로그래머블 로직을 결합한 구성을 선보였던 바 있다. 이 컨셉이 좀 더 고도화된 것이 자일링스가 2019년 선보인 ‘버설 적응형 SoC’인데, 이 제품에 이르러서는 FPGA가 구성 요소 중 하나인 ‘시스템’이 됐다.

한 때는 FPGA 제품이 최신 반도체 제조 공정의 수요를 이끌던 시절도 있었다. 2010년 초반 자일링스의 주요 FPGA 제품들은 당시 TSMC의 최신 공정을 가장 빨리 사용하는 제품 중 하나로 꼽혔다. 또한 2011년 선보인 ‘버텍스-7 2000T’ 모델은 당시 28nm 공정 기반 다이를 TSMC의 CoWoS(Chip-on-Wafer-on-Substrate) 패키징 기술로 결합해 구현하기도 했다. 이런 흐름은 2019년 7nm 공정을 ‘버설 적응형 SoC’에 적용할 때까지도 이어졌지만 현재는 최신 공정의 생산 비용 대비 얻을 수 있는 이득 등의 문제로 공정 전환이 잠시 멈춘 모습이다.

스트라드비젼이 CES 2025서 선보인 AMD 버설 AI 엣지 기반 차량용 주행보조시스템 데모 / 권용만 기자
스트라드비젼이 CES 2025서 선보인 AMD 버설 AI 엣지 기반 차량용 주행보조시스템 데모 / 권용만 기자

유연성에서 오는 경제성, 산업에서 금융, 양자까지 다양한 활용

FPGA의 유용성과 경제성은 전통적인 범용 프로세서와 전용 ASIC 간의 간극을 메우는 지점에서 나온다. 전통적인 범용 프로세서에 포함되지 않은 완전히 새로운 기능을 위한 회로가 필요하지만, ASIC을 만들기에는 ‘규모’가 나오지 않는 경우가 FPGA의 주요 시장이다. 대표적으로는 ASIC 설계 단계에서의 프로토타이핑은 물론, TV등 가전 제품들의 시대 전환에서 범용 컨트롤러가 등장하기 전에 FPGA를 활용해 구현하는 경우가 있다. 이 경우 디바이스의 단가는 높지만, 수량이 적고 로직 설계까지 종종 바뀌는 상황에서는 합리적인 선택이다.

프로그래머블 로직과 하드 블록이 조합된 ‘적응형 SoC’에서는 범용 하드 블록을 주로 사용하면서 프로그래머블 로직을 커스텀 인터페이스 구현과 가속기에 활용하는 경우도 많다. 산업용이나 자동차용에서 다양한 센서 데이터를 실시간 처리하는 시스템을 구현하는 데 이런 접근법이 많이 활용된다. 또한 방송용 카메라에서도 독자적인 최신 코덱의 가속 처리를 FPGA를 통해 구현하는 사례가 있었다. 데이터센터를 위한 최신 고속 네트워크 어댑터에서도 프로그래머블 로직을 내장해 커스텀 가속 구현을 가능하게 한 사례가 있다.

FPGA의 활용 사례 중에는 의외로 흥미로운 점들도 있다. 먼저, 금융에서는 실시간 자동 초고속 트레이드 시스템을 위한 가속기를 FPGA로 구현, 활용한 사례가 있다. 또한 최근 IBM은 양자 컴퓨터의 오류 수정 처리를 위한 회로를 FPGA로 구현해 뛰어난 성능을 얻었다고 발표했다. FPGA는 AI 시대에도 엣지에서 데이터센터에 이르기까지 다양한 위치에서 가속기로 활용되고 있으며, 우주에서도 AMD의 버텍스 FPGA가 나사(NASA)의 화성 로버에 탑재돼 활용되고 있다.

인텔에 인수됐다 지금은 독립한 알테라의 ‘스트라틱스 10’ FPGA 시스템 개발 보드 / 인텔
인텔에 인수됐다 지금은 독립한 알테라의 ‘스트라틱스 10’ FPGA 시스템 개발 보드 / 인텔

FPGA가 이렇게 다양하게 활용될 수 있었던 데는 하드웨어의 유연성과 시대의 변화에도 이유가 있지만 설계를 위한 소프트웨어 도구의 발전도 큰 몫을 했다. 예전에는 칩 설계는 물론 FPGA를 다루는 데도 기본적으로는 하드웨어 기반의 설계로 접근해야 했다. 하지만 지금은 이러한 기조가 제법 바뀐 상태다. 특히 개발 환경이 고도로 추상화된 ‘HLS(High-level synthesis)’ 시대로 진입하면서, 회로 설계를 ‘C’ 계열 등 상대적으로 익숙한 언어로 다룰 수 있게 된 것이 컸다. 지금은 AI의 지원과 함께 이러한 부분이 더욱 정교해진 상태다.

현재 컴퓨팅 시장은 인텔과 AMD라는 양대 산맥이 있다. FPGA 또한 얼마 전까지는 딱 이 구도였다. 인텔은 지난 2015년 당시 업계 2위 위치에 있던 ‘알테라’를 167억달러(약 23조9377억원)에 인수했고, AMD는 2020년 업계 1위 ‘자일링스’를 약 490억달러(약 70조2268억원)에 인수한 바 있다. 2010년 중반대 양 사의 시장 점유율은 90%에 달했다. 이후 인텔은 알테라의 조직을 ‘PSG(Programmable Solutions Group)’ 조직으로, AMD는 자일링스를 ‘AMD AECG(Adaptive and Embedded Computing Group)’로 편제해 어느 정도는 독립적으로 운영했다.

하지만 지금 FPGA 시장은 더 이상 인텔과 AMD의 경쟁이 아니게 됐다. 지난 2024년 인텔은 ‘PSG’ 조직을 다시 ‘알테라’ 브랜드로 운영하기로 했고, 올해 4월 지분 51%를 사모펀드 ‘실버 레이크’에 매각했기 때문이다. AMD는 현재 이 AECG 인수를 통해 임베디드에서 데이터센터 시장에 이르기까지 다양한 제품군과의 조합을 통한 시너지를 누리고 있는 모양새다. 반면, 인텔에 인수됐던 알테라는 신제품 출시 등에서 다소 시기를 놓치면서 시장에서 영향력이 줄어든 상황을 맞았다.

권용만 기자

yongman.kwon@chosunbiz.com

    본 서비스는 패스트뷰에서 제공합니다.