AI 양자화 (1) 썸네일형 리스트형 AI 양자화(AI Quantization) 왜 양자화가 필요한가? AI 양자화는 기존의 학습된 모델을 엣지 디바이스(Edge Device)나 저전력 추론 장치(Low-Battery Inference Device)같은 곳에서 높은 정확도를 위해 깊게(Deep-Learning) 학습된 High-Memory Model을 Low-Memory Model로 bit변환(floating-inteager)하여 작은 에너지로 유사한 정확도를 내고, 빠른 속도로 연산을 하기 위한 AI의 추론의 효율성을 높이는 방법이다. 어디에서 필요할까? 주로 제조업에서 엣지 디바이스를 활용하여, 전력을 지속적으로 끌어다 쓸 수 없는 환경이나, 스마트폰을 이용한 인공지능 Model의 추론에 활용된다. 이것의 특징은 '저전력', '고속', '정확도', '저용량'을 모두 원하기 때문이.. 이전 1 다음