DataRobot

 

 (문의: 031-739-8608/ 온라인 문의하기)


DataRobot이 제공하는 엔터프라이즈 AI

DataRobot은 데이터 사이언스를 대중화하고 인공지능 및 머신러닝의 대규모 구축, 배포, 유지보수를 위한

엔드투엔드 프로세스를 자동화하는 고급엔터프라이즈 AI 플랫폼을 제공합니다.

머신러닝 자동화가 필요한 이유

머신러닝 자동화는 인간과 컴퓨터의 장점을 모두 활용합니다.
인간은 의사 소통, 참여, 맥락 및 일반 지식뿐만 아니라 창의력과 공감 능력도 탁월합니다.
컴퓨터와 소프트웨어 시스템은 반복적인 작업, 수학, 데이터 조작 및 병렬 처리에 이상적이며 복잡한 솔루션을 마스터할 수 있는 힘과 속도를 제공합니다.


머신러닝 자동화는 특정 알고리즘의 적용 시기와 방법을 코딩하거나 배우지 않고도 고급 머신러닝 모델을 생성할 수 있도록 도와줍니다.

 

※ 머신러닝 자동화의 10가지 단계.
머신러닝 자동화는 전통적인 데이터 사이언스 프로세스에 필요한 수많은 수작업을 대체합니다. 하지만 완전한 머신러닝 자동화 솔루션으로 인정 받으려면 플랫폼이 이러한 모든 주요 요구 사항을 충족해야합니다. DataRobot은 머신러닝 모델의 구축과 배포를 효과적으로 자동화하는데 필요한 10단계를 모두 해결한 최초이자 유일한 머신러닝 플랫폼입니다.

Step1: 데이터 식별 – 데이터는 AI로 대규모 혁신을 주도하는 연료입니다. 아이러니하게도 많은 조직은 사용 가능한 데이터 소스의 수가 압도적이며 가장 신뢰할 수 있는 데이터 소스를 식별 할 수 있는 명확한 방법이 없기 때문에 데이터를 효과적으로 사용하는데 어려움을 겪고 있습니다. DataRobot의 AI 카탈로그는 데이터 엔지니어, 데이터 과학자 및 분석가가 관리되는 AI플랫폼에서 프로젝트에 필요한 데이터를 쉽게 찾고, 이해하고 사용할 수 있도록 도와줍니다.

Step2: 데이터 준비 – 머신러닝 알고리즘은 저마다 다르게 작동하며 데이터의 요건도 서로 다릅니다. 예를들어, 어떤 알고리즘은 정규화에 수치형 특징이 필요하지만 일부 알고리즘은 그렇지 않습니다. DataRobot은 원시 데이터를 각 알고리즘이 최적의 성능을 위해 필요로 하는 특정 형식으로 변환한 다음 데이터 분할 모범 사례를 따릅니다.

Step3: 피처 엔지니어링 (Feature Engineering) – 기계 학습 알고리즘이 더 잘 작동하도록 데이터를 수정하는 프로세스이며 종종 시간과 비용이 많이듭니다. DataRobot은 기존 숫자, 범주 및 텍스트 기능에서 새로운 기능을 개발합니다. 추가 피처 엔지니어링의 혜택을 받는 알고리즘과 데이터 특성을 고려할 때 의미있는 기능을 생성하는 알고리즘만 알고 있습니다.

Step4: 알고리즘의 다양성 (Algorithm Diversity) – 모든 데이터 세트에는 비즈니스의 개별 특성을 반영하는 고유한 정보가 포함되어 있습니다. 다양한 상황과 조건으로 인해 하나의 알고리즘으로 모든 가능한 비즈니스 문제 또는 데이터 세트를 성공적으로 해결할 수 없습니다. 일부 기계 학습과 자동화 플랫폼은 사용자에게 몇 가지 유형의 알고리즘에 대한 액세스만 제공하지만 DataRobot을 사용하면 수백가지의 다양한 알고리즘에 즉시 액세스 할 수 있으며 적절한 사전 처리를 통해 데이터에 대해 테스트하여 가장 적합한 알고리즘을 찾을 수 있습니다.

Step5: 알고리즘 선택 (Algorithm Selection) – 수백개의 알고리즘을 사용하는 것은 좋지만 대부분의 경우 사용자는 데이터에 대해 각각의 모든 알고리즘을 시도 할 시간이 없습니다. 일부 알고리즘은 데이터에 적합하지 않고 일부는 데이터 크기에 적합하지 않으며 일부는 데이터에서 작동하지 않을 가능성이 매우 낮습니다. DataRobot은 데이터에 적합한 알고리즈만 실행 합니다.

Step6: 훈련과 조정 (Training and Tuning) – 데이터에서 모델을 학습시키는 것은 자동화된 기계 학습 소프트웨어의 표준입니다. DataRobot은 무차별 대입이 아닌 스마트 하이퍼 파라미터 튜닝을 사용하여 각 알고리즘에 대해 가장 중요한 하이퍼 파라미터를 튜닝 함으로써 이를 한 단계 더 발전 시킵니다. 플랫폼은 또한 여러 알고리즘의 강점을 결합하고 다른 알고리즘의 약점을 균형있게 조정하는 앙상블 모델(“블렌더”라고도 함)을 만들 수 있습니다. 앙상블 모델은 일반적으로 다양성으로 인해 개별 알고리즘보다 성능이 뛰어납니다. DataRobot은 함께 혼합 할 최적의 알고리즘을 찾고 각 블렌더 모델 내에서 알고리즘의 가중치를 조정합니다.

Step7: 일대일 모델 경쟁 (Head-to-Head Model Competitions) – 어떤 알고리즘이 가장 잘 수행되는지 미리 알 수 없으므로 어떤 프로그래밍 언너 또는 머신 러닝 라이브러리에서 왔는지에 관계없이 데이터에서 다양한 알고리즘의 정확성과 속도를 비교해야 합니다. 최고의 모델이 이기는 모델 간 경쟁으로 생각할 수 있습니다. DataRobot은 AI 머신 러닝 자동화를 위한 수십개의 모델을 구축 및 훈련하고, 결과를 비교하고, 정확도, 속도 및 둘의 가장 효율적인 조합을 기준으로 모델 순위를 매깁니다.

Step8: 인간 친화적 통찰력 (Human-Friendly Insights) -DataRobot은 사람이 해석 할 수 있는 방식으로 모델 결정을 설명하여 각 모델의 정확성에 가장 큰 영향을 미치는 기능과 각 기능에 맞는 패턴을 보여줍니다. 또한 특정 예측이 이루어진 이유를 설명하기 위해서 예측 설명을 제공할 수 있습니다.

Step9: 쉬운 배포 (Easy Deployment) – 모든 DataRobot 모델은 프로덕션 준비가 되어있으며 표준 시스템 하드웨어에 여러가지 방법으로 배포할 수 있습니다.

Step10: 모델 모니터링 및 관리 (Model Monitoring and Management) – DataRobot MLOps는 모델 생성에 사용된 데이터 과학 언어 또는 소프트웨어 도구에 관계없이 모델 배포, 모니터링 및 거버넌스를 위한 공통 프레임워크를 제공합니다.

[as-is]

[to-be]

### DataRobot에 대한 추가 정보 문의

담당자: 윤광연 이사 (031-739-8608 kyyun@bitek.co.kr)

 

시계열 모델링

시계열 모델링의 목표는 휴가 시즌 동안의 판매 예측, 다음 주에 필요한 직원 수 예측, 재고과 과잉 재고 없이

제조 수요를 충족하도록하는 것과 같은 과거 행동으로부터 미래 성과를 예측하는 것입니다.

 

불행히도 기존의 시계열 모델링은 많은 과거 사건이 현재 예측에 영향을 미칠 수 있고

가장 영향력있는 신호를 찾기가 어렵기 때문에 복잡하고 힘든 프로세스가 될 수 있습니다.

또한 제품을 소개하거나 경쟁사가 새로운 매장을 오픈 한 후와 같이 환경이 변화함에 따라

이러한 모델을 수동으로 재 구축해야했습니다.

[자동시계열]

자동 시계열: 추이를 기반으로 데이터 시리즈의 미리 가치를 예측하는 정교한 시계열 모델 개발을 자동화 합니다. 기업 규모의 크고 작음에 관계 없이 판매량, SKU에 따른 수요, 인력 , 재고 및 다양한 재무 애플리케이션 호스팅에 대한 예측을 향상 시킵니다.

 

◆ 시계열 자동화 

데이터 로봇은 시계열 기능 엔지니어링을 자동화 하여 예측 신호를 발견하는 등 시계열 모델링의 모범 사례를 통합합니다. 또한 정상 성, 계절성을 자동으로 감지하고 대상을 변환하고 가능한 최고의 정확도를 달성하기 위해 백 테스팅을 구현합니다.

 

◆ 높은 정밀도 

ARIMA 및 Facebook Prophet과 같은 필수적이고 입증 된 시계열 방법 외에도 DataRobot에는 더 높은 예측 정확도를 달성하는 데 도움이되는 고급 시계열 모델이 포함되어 있습니다.

 

 

◆ 가치 얻기 

시계열 모델의 목표는 이해를 추출하고 미래 결과를 예측하는 것이므로 DataRobot은 시간 경과에 따른 통찰력을 시각화하고 모델을 프로덕션에 배포하는 다양한 방법을 제공합니다. 여기에는 모델링을 비즈니스 프로세스 및 애플리케이션에 통합하기위한 전체 API 지원이 포함됩니다.

MLOps

※ Machine Learning Operations (MLOps) ※

붙여 넣은 이미지 0 3
프로덕션 AI를 위한 CoE (Center of Excellence) 센터: DataRobot MLOps는 프로덕션 AI를 위한 CoE(우수성 센터)를 제공합니다. 이를 통해 생성 방법이나 배포시기 및 위치에 관계없이 프로덕션의 모든 모델을 배포, 모니터링, 관리 및 제어 할 수 있는 단일 위치를 제공합니다. MLOps는 고급 자동화 머신 러닝 상태 모니터링을 사용하여 모델의 전반적인 품질을 개선하고 지속적인 자동화 모델 경쟁을 통해 변화하는 조건을 수용합니다. 또한 모든 중앙 집중식 프로덕션 머신 러닝 프로세스가 조직 전반에 걸쳐 강력한 거버넌스 프레임 워크에서 작동하도록 보장하여 프로덕션 모델 관리의 부담을 활용하고 이미 배치 된 팀과 공유합니다.

 


어디서나 모델 구축 및 실행: MLOps를 사용하면 원하는 프로덕션 환경에 모든 모델을 배포 할 수 있습니다. 이는 모든 클라우드 플랫폼, 온 프레미스 데이터 센터 또는 하이브리드 환경이 될 수 있습니다. MLOps 모니터링 에이전트를 계측하면 이미 배포 된 기존 프로덕션 모델에 모니터링을 추가 할 수 있습니다.
MLOps는 Tableau (태블로)와 같은 시스템에 통합하여 사용 할 수 있습니다.

• 자동화된 모델 상태 모니터링 및 수명주기 관리: MLOps는 기존 모델의 성능을 개선하기 위해 지속적인 모니터링 및 생산 진단을 제공합니다. 자동화된 모범 사례를 통해 서비스 상태, 정확성 및 데이터 드리프트를 추적하여 모델이 저하되는 이유를 설명 할 수 있습니다.
자신민의 챌린저 모델을 구축하거나 업계 최고의 자동화 기계 학습 제품을 사용하여 구축하고 현재 챔피언 모델과 비교하여 테스트 할 수 있습니다.

• 내재된 거버넌스, 공정성 관리:

MLOps는 조직 전체에서 AI프로젝트에 대한 규율을 유지하고 제어 할 수 있는 프레임 워크를 설정합니다. MLOps Humble AI 기능을 사용하면 실시간 가드레일을 제공하는 규칙을 정의하여 모든 예측이 합리적이고 정상적인 기대 범위내에 있는지 확인할 수 있습니다. 또한 MLOps는 예측 활동 및 모델 업데이트의 전체 기록을 보존하여 사용자 지정 가능한 거버넌스 정책과 검토 및 승인 워크플로를 통해 규정 준수를 설정하고 위험을 줄입니다. 즉, 어떤 모델이 생성되었는지, 어떻게 사용되었는지, 언제 업데이트되었는지 항상 알 수 있습니다.