티스토리 뷰

특수 하드웨어없이 딥 러닝을 가능하게하는 스타트 업

GPU는 오랫동안 AI 작업을 수행하는 데 가장 적합한 칩이었습니다. 신경 마법은 그것을 바꾸고 싶어합니다. Nir Shavit이 회사를 시작하게 한 발견은 대부분의 발견 방식과 관련이있었습니다. MIT 교수는 마우스의 뇌지도를 재구성하는 프로젝트를 진행하고 있었고 딥 러닝의 도움이 필요했습니다. 딥 러닝 모델에 가장 일반적으로 사용되는 그래픽 카드 또는 GPU를 프로그래밍하는 방법을 모르는 대신 일반 처리 장치에서 가장 일반적인 컴퓨터 칩인 중앙 처리 장치 또는 CPU를 선택했습니다. 샤빗은 다음과 같이 회상합니다.“올바른 방식으로 프로그래밍 된 경우 CPU가 GPU의 기능을 수행 할 수 있다는 것을 깨달았습니다. 이 통찰력은 오늘날 그의 첫 번째 제품군을 출시 한 그의 신생 회사 인 뉴럴 매직의 기초입니다. 아이디어는 모든 회사가 특수 하드웨어없이 딥 러닝 모델을 배포 할 수 있도록하는 것입니다. 이는 딥 러닝 비용을 절감 할뿐만 아니라 AI의 접근성을 높이는데도 도움이됩니다. 신경 마법에 관여하지 않는 MIT의 컴퓨터 과학 및 인공 지능 연구소의 연구 과학자 인 닐 톰슨은 “이것은 더 많은 기계와 더 많은 기존 기계에서 신경망을 사용할 수 있다는 것을 의미합니다 . "특별한 것으로 업그레이드 할 필요가 없습니다."GPU는 대부분 우연의 일치로 딥 러닝에 적합한 하드웨어가되었습니다. 이 칩은 처음에는 비디오 게임과 같은 응용 프로그램에서 그래픽을 빠르게 렌더링하도록 설계되었습니다. 다양한 계산을 수행하기 위해 4 ~ 8 개의 복잡한 코어가있는 CPU와 달리 GPU에는 특정 작업 만 수행 할 수있는 수백 개의 간단한 코어가 있지만 코어는 시간을 단축하면서 동시에 작업을 처리 할 수 ​​있습니다. 집중적 인 계산을 완료하는 데 필요합니다. AI 연구 커뮤니티가이 대규모 병렬화로 인해 GPU가 딥 러닝에 적합하다는 것을 깨닫는 데 오랜 시간이 걸리지 않았습니다. 그래픽 렌더링과 마찬가지로 딥 러닝에는 수십만 번 수행되는 간단한 수학 계산이 포함됩니다. 2011 년 칩 제조업체 엔비디아와 협력, 구글은 발견 이 2000 CPU에서 훈련을했던 컴퓨터 비전 모델은 12 GPU에서 훈련을 할 때 사람들로부터 고양이 같은 성능을 달성 할 수 구별 할 수있다. GPU는 모델 훈련 및 추론을위한 사실상의 칩이되었습니다. 훈련 된 모델이 훈련 된 작업에 사용될 때 발생하는 계산 과정입니다. 그러나 GPU는 딥 러닝에도 완벽하지 않습니다. 우선, 독립형 칩으로 기능 할 수 없습니다. 수행 할 수있는 작업 유형이 제한되어 있기 때문에 다른 모든 것을 처리하려면 CPU에 연결해야합니다. GPU는 또한 칩 프로세서에 가장 가까운 데이터 저장 영역 인 캐시 메모리의 양이 제한되어 있습니다. 이는 대량의 데이터가 칩 외부에 저장되며 처리 할 때 검색해야 함을 의미합니다. 앞뒤 데이터 흐름은 계산에 병목 현상이되어 GPU가 딥 러닝 알고리즘을 실행할 수있는 속도를 제한합니다. 최근 수십 개의 회사 가 이러한 문제를 우회하는 AI 칩을 설계하기 위해 성장했습니다. 문제는 하드웨어가 더 전문화 될수록 더 비싸다는 것입니다. 따라서 뉴럴 매직은 이러한 추세를 극복하려고합니다. 회사는 하드웨어를 조작하는 대신 소프트웨어를 수정했습니다. 칩의 대용량 메모리와 복잡한 코어를 활용하여 CPU에서보다 효율적으로 실행되도록 딥 러닝 알고리즘을 재 설계했습니다. 이 접근 방식은 GPU의 병렬화를 통해 달성되는 속도를 잃는 반면 칩에 데이터를주고받을 필요가 없어 거의 같은 시간을 되돌릴 수 있다고합니다. 이 회사의 알고리즘은 CPU에서 "GPU 속도로"실행될 수 있지만 비용은 아주 저렴하다. 톰슨은“이것은 사람들이 이전에는하지 않은 방식으로 CPU의 메모리를 활용할 수있는 방법으로 파악 된 것 같습니다. Neural Magic은 아무도 이전에이 방법을 사용하지 않은 몇 가지 이유가있을 수 있다고 생각합니다. 첫째, 그것은 직관적이지 않습니다. 딥 러닝에는 특수 하드웨어가 필요하다는 아이디어가 너무나 강력 해 다른 접근 방식을 쉽게 간과 할 수 있습니다. 둘째, 산업에 AI를 적용하는 것은 여전히 ​​비교적 새로운 일이며, 기업들은 딥 러닝 알고리즘을보다 쉽게 ​​배포 할 수있는 방법을 찾고 있습니다. 그러나 뉴럴 매직이 이륙하기에 충분한 수요가 있는지는 아직 확실하지 않습니다. 이 회사는 약 10 개 회사에서 자사 제품을 베타 테스트하고 있으며 더 광범위한 AI 산업의 경우 더 낫습니다. "신경망뿐만 아니라 전체 컴퓨팅을 향상시키고 싶습니다." Neural Magic은 현재 컴퓨터 비전에서 작업을 추론하는 기술을 제공합니다. 클라이언트는 여전히 특수 하드웨어에서 모델을 교육해야하지만 Neural Magic의 소프트웨어를 사용하여 교육 된 모델을 CPU 호환 형식으로 변환 할 수 있습니다. 대형 현미경 장비 제조업체 인 한 클라이언트가 현재 장치 AI 기능을 현미경에 추가하기위한이 접근법을 시험하고 있다고 Shavit은 말합니다. 현미경에는 이미 CPU가 포함되어 있으므로 추가 하드웨어가 필요하지 않습니다. 반대로 GPU 기반 딥 러닝 모델을 사용하려면 장비의 부피가 커지고 전력이 많이 필요합니다. 다른 클라이언트는 뉴럴 매직을 사용하여 보안 카메라 영상을 처리하려고합니다. 이를 통해 현장에서 이미 사용 가능한 컴퓨터를 사용하여 건물 안팎의 트래픽을 모니터링 할 수 있습니다. 그렇지 않으면 영상을 클라우드로 보내야 할 수 있으며, 이로 인해 개인 정보 보호 문제가 발생하거나 모니터링하는 모든 건물에 대한 특수 하드웨어를 얻을 수 있습니다. 샤빗은 추론도 시작일 뿐이라고 말합니다. 뉴럴 매직은 향후 회사 가 AI 모델을 CPU에서 교육 할 수 있도록 서비스를 확장 할 계획 입니다. "우리는 10 년에서 20 년 후에 CPU가 머신 러닝 알고리즘을 실행하기위한 실제 패브릭이 될 것이라고 믿습니다."라고 그는 말합니다.

댓글