덤

다크 팩토리: 기계는 불 켜줄 필요 없잖아. 자동화를 완성해서 인간을 제거하고 불 끈 공장 말하는 거임.
- 점점 인간이 할 일이 사라져요. 근데 이미 뽑은 사람을 자르긴 쉽지 않지. 그럼 무슨 말이에요? 신입을 안 뽑아. 님들이 그런 시대를 살고 있어요. 빨리 취업하세요^^
AI가 인간의 암묵지를 배울 수 있다면 지금보다는 좀 더 유도리있고 눈치가 생기지 않을까? 일단 유도리나 눈치나 다 암묵지임,,

제조 지능화 기본 개념

피지컬 AI: 물리적 몸에 챗지피티가 import됨.
공장에서 제일 큰 비용 중 하나는 인건비. 그래서 자동화를 했고 지능화 자율화를 시도하고 있다.
스마트 팩토리: 제품의 기획, 설계, 생산, 유통, 판매 등 전 과정을 IT 기술로 통합하여 최소 비용과 시간으로 고객 맞춤형 제품을 생산하는 미래형 공장으로, IIoT, CPS를 기반으로 제조의 모든 단계가 자동화, 정보화(디지털화) 되어 가치사슬 전체가 하나로 실시간으로 연동
- PCF 이슈로 공장 하나만 디지털화하는 게 아니라 가치사슬에 연계된 모든 공장이 디지털화되어야 진짜 스마트 팩토리가 된다.

스마트 팩토리를 이해하려면 스마트와 팩토리를 각각 이해해야 해.

팩토리

공장이 뭐야? 제품(material)이 들어가서(input) 제품(material)이 나오는(output) 곳이야.
공장에는 뭐가 있어? 인간(man), 기계(machine), 공정(method).
그럼 공장은 뭐야? 4개의 M으로 구성된 곳이야. Man, Material, Method, Machine.
사실 PPR이라고 할 수도 있음. Product, Process, Resource.
좀 더 덧붙이면 4M2E, P3R도 있어 → 4M + Env, Energy / PPR + Plant(공장 자체)

스마트

지능화: [모니터링(이해) > 문제 찾기 > 원인 찾기 > 해결 방법 찾기 > 적용하기 > 피드백 > 다시 모니터링]의 과정이 누군가의 간섭 없이 스스로 지속되는 것. 이걸 공장이 한다는 게 스마트 팩토리.

제조 데이터의 이해

DIKW 피라미드: 데이터 > 정보 > 지식 > 지혜(통찰) 순으로 이어지는 해당 네 요소의 클래스 구조. 정보처리기사 내용에 있음.
데이터
- 별다른 의미를 부여하지 않은 정보 자체(원물)
- 비교 분석 이전의 순수한 상태를 수치나 기호로 기록함
- 이후 의사결정에 활용할 목적으로 관찰/수집/측정됨
- 아직 중요한지 아닌지는 모름
정보
- 데이터를 적절히 가공/처리해서 다른 데이터와 비교할 수 있도록 한 것
- 특정 목적을 위헤 의미있고, 가치있고, 유용하고, 관련성을 갖도록 데이터를 정리하고 구조화한 것
- 수치와 기호로 표현되긴 하지만 테이블이나 그래프 등 특정 문제의 해결을 위한 근거자료로써의 형식을 갖춤
지식
- 문제를 해결하고 의사결정을 수행하는 일종의 업무수행 수단 → 서로 연결된 정보의 패턴을 활용해서 예측한 결과물
- 암묵지: 경험과 시행착오를 통해 개인이 습득한 노하우 → 타인에게 전달 어려움
- 형식지: 그 암묵지를 객관적인 매체에 저장, 가공, 분석한 결과물로써 유형의 지식 → 전달 및 공유 가능
- 덤: 각종 암묵지를 형식지로 바꾸려는 연구들이 있는데, 그 암묵지를 가진 개인의 ‘암묵지 독점욕’으로 인해 쉽지 않음 ← 나만 할 줄 알면 부르는 게 값이거든
지혜
- 지식을 활용해서 창의적인 아이디어를 이끌어내는 것
- 창의적인 것 ≠ 새로운 것
- 지식과 경험을 체계화하여 업무활용 수준을 높이고 타업무 분야로 확장하여 적용하는 것을 의미

제조 데이터의 이해 - 데이터 개념

데이터: (보통은) 데이터 객체(obj)와 그 속성(attribute)에 대한 집합
객체: 속성의 집합. record, instance, point, case, sample, entity 등
속성: 객체의 특성 혹은 특징. variable, feature, field, characteristic, dimension 등
속성값: 특정 객체의 속성에 할당된 숫자나 기호
- 동일 속성이 다른 속성값에 매핑될 수 있음. 예: 키를 표현하는 단위의 차이로 서로 다른 숫자로 표현됨
- 서로 다른 속성이 같은 속성값의 집합에 매핑될 수 있음. 예: ID와 나이 모두 숫자로 표현 가능
- but properties of attribute can be different than the properties of the values used to represent the attribute
속성의 유형
- 이산/범주형: 셀 수 없고, 무한한 속성값의 집합만 가짐. 보통 정수로 인코딩함. 이진 속성은 이산 속성의 특수 유형으로 간주함.
  - 명목형: 그저 구분하기 위한 이름인 것. 그 어떤 우열도 가릴 수 없음.
  - 순서형: 순번은 있지만, 그 기준이나 상대적인 관계성이 numeric하지 않음. 10등이 1등보다 10배 못했냐?
- 연속/수치형: 실수 형태의 속성값. 유한한 숫자로만 측정 및 표현될 수 있음. 보통 부동 소수점으로 표현됨.
  - 범위형: 날짜, 섭씨/화씨 온도.
    - 덧: 섭씨와 화씨 온도는 물리적으로 ‘상대적인’ 온도를 나타낸 것이기 때문에 곱셉/나눗셈이 유효하지 않다.
  - 비율형: 켈빈 온도(절대온도), 길이, 무게, 경과 시간
    - 절대적인 값으로써 그 자체로 온전한 의미를 담는 것. ‘2배’라는 식으로 표현 가능
속성의 유형 - 연산 활용 방식이 달라짐
- 명목형: 구분
- 순서형: 구분, 순서
- 범위형: 구분, 순서, 차이
- 비율형: 구분, 순서, 차이, 비율
데이터의 주요 특징
- 차원성: 고차원 데이터는 그 양/가치만큼 성능이 안나옴. 오히려 떨어지기도 하고, 그걸 돌리는 리소스도 낭비임. → 차원의 저주
- 희소성: 존재하는 데이터만을 고려함. 생각을 해보세요. 공장에서 불량이 50% 나오면 그게 공장입니까? 쓰레기장이지. 불량 데이터는 희소할 수밖에 없음.
- 해상도: 데이터가 얼마나 자세한지에 따라 결과/패턴이 달라질 수 있음
  - 덧: 이거 저번에 해봤죠 일일 평균 데이터에서는 이상치가 없었는데 개별 데이터에서는 이상치 있었잖아.
  - 근데 무조건 자세히 한다고 좋은 건 아니고 목적에 따라 필요한 만큼만 하면 됨. 그거 다 낭비고 노이즈도 들어간다.
- 크기: 데이터의 크기에 따라 분석 기법이 달라질 수 있음
데이터의 유형
- 정형: 틀이 딱딱 맞아
- 비정형: 자유로운 데이터를 봐 자유로워
- 반정형: 딱 맞는 틀은 아닌데 나름 자기들만의 규칙이 있음
정형 데이터
- 파일이나 레코드 내의 고정(미리 정해둠) 필드에 저장된 데이터
- 보통 관계형 DB(RDBMS)에 저장되고, 데이터는 사람이나 기계가 생성함
- SQL 사용함
- 구조 변경이 아주 불편함
비정형 데이터
- 각자 구조가 있긴 한데(jpg, pdf, mp4 등등), DB처럼 구조화되지 않았음
반정형 데이터
- RDBMS만큼은 아닌데 나름 구조가 있음
- 키-값 쌍의 집합으로 구성됨
- 정형 데이터에 비하면 비교적 수정 할만함

빅데이터 내용은 이미 설명했으니 넘어갈게요

제조 데이터의 이해

제조 데이터 수급처
1. 설비: 보통 센서 기반이긴 함
2. 시스템
3. 센서
센서 데이터 - 온습도
- 공장 환경 전체의 온습도와 공정 자체의 온습도로 나뉨
- 공장 환경: 아두이노 정도 수준의 센서만 써도 됨. 싸고 쓰기 쉽다.
- 공정 자체(예: 금형): 제품의 품질과 직결되는 데이터이면서도, 아무데나 센서를 달 수 없기 때문에 센서를 위한 자리를 따로 만들어서 넣어야 한다. 설치, 구매, 데이터 전송 모두 비싸다.
센서 데이터 - 압력
센서 데이터 - 진동
- 시계열 관점 분석과 주파수 관점 분석이 가능함
- 시계열: 삼각함수 그래프랑 같은 구조임. 피크-피크 간격이나 진폭 등 특징을 뽑아서 분석함
- 주파수: 윗줄 쓰다가 똑바로 못들음
센서 데이터 - 비전(이미지)
- 선이나 색의 경계를 명확하게 만드는 전처리 기법
- 관심 영역만 크롭하기
센서데이터 - 전류, 전압, 전력
- 전류와 전압을 알면 전력을 계산할 수 있음 → 센서를 2개만 써서 계산하거나, 센서를 3개 써도 됨
- 전류도 주파수처럼 시간/주파수 영역 분석 가능
- 센서가 싸고 쓰기 쉬운 편, 설비 자체도 기본적으로 제공하는 경우가 많음.
센서 데이터 - PLC & CNC
- PLC: programmable logic controler
- CNC: computerized numerical control
- 기업이나 장비마다 둘 중에 하나 이상 제공함 → 인터페이스를 하나하나 만들어야 한다
  - 이걸 하나의 표준으로 통합하는 것도 사업으로 진행되고 있음
- 간혹 이 데이터들이 잘못 들어오는 경우가 있는데, 제조사도 문제를 모른다. 블랙박스임. 그렇기 때문에 raw 데이터를 다 주는 데가 다루기 좋다.
- 설비 데이터에서 받아온 게 설정값인지, 측정값인지, 대표값인지 등을 고려해야 한다
센서 데이터 - I/O 센서
- 일부 기업은 설비 데이터를 자신들이 제공하는 유료 미들웨어를 통해서만 얻을 수 있도록 함. 쩔 수 없음 돈 주고 사서 봐야 함.
시스템 데이터 - ERP
- ERP: enterprise resourse planning. 조직이 회계, 조달, 프로젝트 관리, 위험 관리 및 규정 준수, 공급망 운영과 같은 일반적인 비즈니스 활동을 관리하기 위해 사용하는 소프트웨어
- 비즈니스 관련 데이터를 얻을 수 있음
- 공정에 사용되는 재료가 무엇인지 알 수 있고, 이는 제품의 품질과 매우 관련이 있음.
- 보통 SAP이나 오라클 ERP 많이 씀
시스템 데이터 - PLM
- PLM: product lifecycle management. 제품의 전체 수명 주기를 아이디어 단계부터 엔지니어링 설계 및 제조를 거쳐 제조된 제품의 서비스와 폐기 단계까지 관리하는 프로세스를 의미함. PLM 소프트웨어는 제품의 초기 아이디어부터 제조를 거쳐 제품 서비스에 이르기까지 모든 제품 관련 프로세스를 지원함. 여러 기업의 것을 섞어 쓰긴 어려워서 보통 주로 쓰는 계열 중심으로 씀.
- BOM, 3D 모델 등 제품 관련 데이터 획득 가능
시스템 데이터 - MES
- MES: manufacturing execution systems. 원자재에서 완제품이 만들어지는 과정을 추적하고 문서화하는 데 사용되는 제조용 컴퓨터 시스템. 의사결정권자가 생산성을 개선하기 위해 제조공장의 현재 조건을 최적화하는 방법을 이해하는 데 활용될 수 있는 정보를 제공함. 생산 공정의 여러 요소(인력, 설비 및 지원 서비스)를 제어할 수 있도록 실시간 운영됨.
- 생산 마스터 데이터, 품질/검사 등 제조 관련 데이터 획득 가능

데이터 분석

인공지능 > 머신러닝 > 딥러닝 포함관계 정도는 알고 사세요. 인공지능은 꼭 “학습”하지 않아도 됨. 머신러닝부터 학습이 포함된다. 그게 좀 더 딥해지면 딥러닝이 되는 거임.

기계학습: 비지도학습, 지도학습, 강화학습.
지도학습: 레이블이 있는 학습. 분류 or 회귀. 회귀는 연속적인 값을 예측함. 분류 전용 모델, 회귀 전용 모델 이런 식으로 구분되지는 않고, 해결하고자 하는 문제, 찾아야 하는 y가 어떤 것인지가 기준이다.
비지도학습: 레이블 없이 학습. 클러스터링을 함. 그냥 하는 것도 어렵고 성능 파악도 어려움.
데이터 분석 종류. 뒤로 갈수록 어렵고 가치가 큼.
- 설명적: 무슨 일이 있었는지
- 진단적: 왜 그런 일이 있었는지
- 예측적: 앞으로 무슨 일이 있을건지
- 처방적: 앞으로 뭘 하면 될지
데이터 분석 과정
- 데이터 획득, 전처리: 여기서 좋은 데이터를 만들어야 뒤가 잘풀린다. 여기에 전체 작업 기간의 60-70%(많으면 80-90%)를 할애함. 도메인 지식이 아주 매우 중요함.
- 모델링: 설명/진단/예측/처방 모델 생성. 상황에 맞게 만들기.
- 시각화: 결과를 눈으로 보이게 만들기. 모델링 결과 설명에도 쓰이지만 데이터 탐색+전처리 과정에도 유용하게 잘 쓰임. 수치만으로 티가 안 나는 부분을 보기에 좋다.
- 테스트 및 배포: 해보고 맘에 안들면 다시 만들어야 함(피드백). 보통 많은 업장에서 이 파트가 잘 안돼서 모델을 일회용으로 썼음.
제조 데이터 분석 프로세스 (교수님 수제 다이어그램, 실화 기반)
- 문제 정의
  - 분석 대상 이해: 데이터 수집 HW/SW 인프라
  - 데이터 점검: 대상 설비 및 공정 데이터 확인
  - 분석 요구사항 분석: 제조공정 도메인 전문가
  - 활용 전략 수립: 제조공정 지능화 범위, 적용 분야, 최종산출물 정의
- 데이터 수집
  현장 모니터링 (엣지 디바이스)
  - 검사 공정: 수동 & 자동검사, 시스템 인터페이스, 불량유형/개수
  - 가공 공정: Fanuc CNC, 설비 인터페이스, 가공조건
  - 주조 공정: Toyo 350 Ton, 센서, 주조온도/압력
- 데이터 처리/저장
  - 서버/클라우드
    - 자체 서버/클라우드
    - 데이터 전처리 (데이터 식별, 통합)
    - 주요 특성 추출 (KPI)
    - 데이터 분산 처리/저장 (하둡시스템)
    - 대용량 제조 데이터 (주조+불량 데이터)
  - 레거시 시스템
    - MES/POP
    - 생산기준정보
- 모니터링/탐색
  - 실시간 모니터링
    - 주요 KPI 데이터 현황 관리
    - 실시간 이상 알람
  - 데이터 탐색/활용
    - 기초통계, 확률적 분석
    - 데이터 요약 및 가시화: 연구자들이야 숫자만 써도 오~ 해주지만 님이 직원이면 그래프 그리고 똑바로 설명하셔야 합니다. 현장 실무자는 숫자도 AI도 모른다. 실무 전문가일 뿐이니 실무 전문가의 시선에 맞춰서 분석하고 보고해야 한다. 요구사항도 상당히 구체적이라고 하심.
      데이터를 통해 나오는 그래프는 결과임. 사람이 해야 할 것은 왜 그 결과가 나왔는지 설명하고, 해결하려면 어떻게 해야 하는지 제시하는 것임.
    - 통계적 공정품질관리 (SPC/SQC)
- 데이터 분석
  - 대용량 제조 데이터 분석 (학습)
  - 데이터마이닝, 인공지능 (AI) 기법
  - 예: 불량판정 알고리즘 (AdaboostC2)
- 활용 (공정 지능화)
  - 품질 고도화
    - 제품 양품/불량 판정
    - 불량 원인 진단 (추적)
    - 예: 불량 진단/원인 파악 → 설비 및 공정조건 변경
  - 설비 지능화
    - 설비 상태/고장 진단
    - 설비/공구 수명 사전 예측
    - 예: 가공설비 공구 마모 예측 → 공구교체/품질 확보
  - 공정 최적화
    - 이상/병목 공정 진단
    - 생산전략/공정조건 최적화
    - 예: 에너지 사용량 절감 필요 → 생산전략/조건 변경

제조 지능화 사례 - 다이캐스팅 공정 지능화

다이캐스팅이 뭐야?

녹인 금속을 틀에 넣어 찍어내는 것
필요한 주조 형상에 완전히 일치하도록 정확하게 기계 가공된 금형에 용융 금속을 주입하여 금형과 똑같은 주물을 얻는 정밀주조법

문제 정의

대상 산업: 다이캐스팅 산업은 영세 기업의 비중이 높고 ICT 기반 정보화 및 스마트화에 대한 열악한 인식으로 인해 경쟁력 강화를 위한 변화 필요
대상 기업: 스마트공장 중간1 수준 달성이 필요한 곳
진짜 문제였던 점: 이 기업은 본인은 스마트화가 어느정도 되었다 주장했으나, 전부 가비지였음. 전부 갈아엎고 새로 해야돼.

데이터 수집

님들은 인터넷부터 다시 하셔야 합니다 → 와이파이 통신망 구축, 네트워크 구축 완료보고서 작성 후 기업이 스스로 관리할 수 있도록 만듦
MES가 일부분만 깔려 있어서 기업에게 통합서버 완전 재구축을 제안했음 → 싫대 → 대신 지금 있는 구조에서 인터페이스를 추가해서 데이터만 새 통합서버로 끌어오기로 함. 나머지는 바로 새 통합서버로 들어감.
- 문제가 뭐야? 실시간성은 벌써 죽었어.
각 설비마다 엣지 디바이스 부착하여 데이터 수집 체계 구축.

데이터 처리/저장

NMS 서버: 이 기업이 원래 갖고있던 서버
주조 엣지: 불량 판정 후 결과만 전송
가공 엣지, 품질 등
통합 서버에는 분석용 DB, 전처리 모듈, 분석 모듈 등이 포함됨
- 불량 판정 & 원인 진단

모니터링/탐색 & 데이터 분석

기존에 기업이 갖고 있던 그 어중간한 MES와 새로 구축한 통합 서버 간 불일치하는 정보를 싱크하고 그 외 등등 전처리 진행
- 기존 MES에만 lot 번호가 따로 부여돼서 꼬인 거 처리하느라 엄청 골때렸다고 함.

이 사례가 전체적으로 교수님 실패썰인데 너무 재밌어서 듣느라 필기를 안했음

간략하게 요약하자면 어떤 기업에 불량 판정 자동화 시스템을 구축하러 갔는데, 그 기업의 기술 적용 상태는 완전 가비지고, 그 기업은 그럼에도 기존 시스템을 최대한 유지하고 싶어 했으며, 그 안에서 자동 불량 판정 시스템까지는 만들어놨더니 대표가 보고를 듣고 분석은 잘하셨는데 쓸모가 없네요. 한거임. (blame까지는 아니었고 대표도 왜 그렇게 나왔는지 그럭저럭 이해 가능했음)

왜 쓸모가 없었냐? 거기 생산 단위가 한 로트당 100개 정도였는데, 그 로트라는 결과에 대해 불량 판정을 하는 시스템이었기 때문. 그 로트에 불량이 몇 개 있는지 알면 뭐함? 이미 생산은 끝났는데. 근본적인 불량 방지가 안 되는 거임. 대표가 말한 쓸모없다는 말은 그런 이유였던 거임.

그래서 그대로 끝냈는가? 그건 아님. 다시 제품별 트래킹을 시도해서 데이터를 다시 수집함.

주조 과정은 [주조 > 공냉 > 사상 > 쇼트 > (가공) > 최종검사]로 이루어짐. 공냉은 주조물이 배출된 후 좀 더 식히는 과정이고(스치면 불량임 절대 노터치), 사상, 쇼트가 붕어빵 테두리 잘라내는 것처럼 주조물 테두리에 붙은 가생이를 다듬는 것임. 이 과정 전체에 대해 제품별 트래킹을 시도함.

각 제품에 ID를 부여해서 공정별 출입 시간과 최종 검사 결과까지 수집함. 몇 천 개 수집했다 함.

새 데이터로 다시 분석하고, 데이터 증강하고, 그때 당시 잘 나온 모델 활용해서 불량 탐지 96% 달성.

주조공정에는 예열타라는 게 있는데, 설비가 충분히 예열되었는지 확인하기 위해 테스트 주조물을 몇 개 찍어보는 거임. 이때 나온 예열 덜 된 주조물은 그대로 다시 재료로 돌아감. → 문제는 앞서 만든 불량 탐지 시스템은 이걸 불량으로 카운트하는데 작업자들은 애초에 카운트를 안하는 거임. → 예열타 감지 시스템을 만들어서 불량 탐지 시스템이 알아서 제외하도록 하자 하고 추가로 만들었다 함.

이후 3D 모델링으로 가시화하고 대시보드 만들어서 공장 내에서 실시간 화면으로 확인할 수 있게 만들어 모두가 만족하고 마무리했다고 함.

제조 지능화 사례 - 사출성형 공정 지능화

이번 기업은 아주 작은 플라스틱 부품을 만드는 곳이었음. 부품 하나 당 단가가 아주 작기 때문에 현장에서는 사출 시 불량을 따로 검사하지 않고 보수적으로 ‘불량일 가능성이 높아지는 조건’에서 나오는 모든 생산품을 폐기하고 있었음.

그러나 이 일을 시작할 때에는 그러한 사실을 알지 못했고, 이전 다이캐스팅 사례와 비슷하게 보고 비슷한 작업을 진행했음. 현존하는 데이터와 필요한 데이터를 계획하고 데이터를 갖추어서 사출 불량 검사 모델을 완성하고 실무자들과 하나하나 결과 보고를 진행함. 근데 이번엔 품질검사팀에서 이게 필요가 없다는 거임. 이유가 뭐냐? 앞서 먼저 썼지만 당시엔 몰랐던 이유인 ‘사출 불량은 따로 검사하지 않는다’ 때문. 품질검사팀에서는 그거 일일이 검사하는 것보다 그냥 버리는 게 편하다고, 돈 더 들어봐야 얼마냐 들겠냐면서 사출 불량은 탐지할 필요가 없다는 거임.

이제 문제 정의가 잘못되었음을 확인하고 다시 문제부터 찾음. 그렇게 해서 찾은 문제: 사출 시에는 공차가 허용 범위였으나, 그 허용 범위 내 공차의 조합들로 인해 조립 공정에서 ‘통과한 불량’이 되는 경우가 생기는 거임. 단순히 한 칸과 그 다음 칸 사이의 공차는 허용 범위였지만, 그것이 여러 칸이 이어져 결국엔 조립이 안될 정도로 뒤틀리게 된 불량이 있었음(플라스틱이다 보니 사출 직후 다음 공정으로 이동하는 과정에서 모양이 틀어져서(수축) 구부러지게 된 거임. 사출은 ㄹㅇ 정상이었음). 이제 진짜 해결해야 할 문제는 이러한 조립 불량을 걸러내는 것. → 비전 정보가 아주 중요해짐.

이제 걸러내야 할 예비 불량품들이 사출에서는 정상인 상황이기 때문에, 양/불량 구분이 아니라 양품 중 등급 나누기로 문제를 바꿨음. 완벽한 A급 양품, 완벽하지는 않지만 괜찮은 B급 양품, 간당간당한 C급 양품으로 구분.

원래 원했던 목표는 사출된 제품을 운반하는 직교로봇과 예비 불량 탐지 로직을 연결해서 운반 여부를 결정하게 하는 것이었으나, 기존의 직교로봇 시스템을 바꾸고 싶지 않았던 기업으로 인해 그냥 결과를 표시해주는 경광등으로 대체했음.

그리고 또 추가 목표는 불량이 발생했을 때, 사출 기계에서 어떤 변수 때문에 불량이 발생했는지 찾고 그 해결까지 하도록 만드는 것이었는데, 이 경우 데이터가 부족해서 유의미한 결과를 내지 못하고 끝났음. 기업에게 실험이라도 해달라고 했으나, 해줬음에도 불구하고 데이터가 부족했다고 함.

제조 지능화 사례 - KOSMO, KAMP

참고 사이트

스마트공장 사업관리시스템: 스마트 팩토리에 대한 개념, 구현 사례 등에 대한 양질의 자료 제공
KAMP 인공지능 제조 플랫폼: 유/무료 제조 데이터셋 제공, 제조AI체험/분석개발 및 추론 서비스 제공 등 이것저것 놀이터가 많음.
- 여기서 무료 데이터셋을 제공하는데, 가이드가 정말 정말 자세하고 코드 예시+설명도 있다. 대부분 데이터셋이 실제 사례 기반이기 때문에 정말 도움이 될 것이다.
- 제일 큰 장점: 딱 AI만 만들면 되게 가공해서 나온 캐글과 달리 진짜 울퉁불퉁한 실제 데이터를 써볼 수 있다는 점
- 매년 경진대회도 한다. 참가 자격 제한이 없기 때문에 그냥 하면 된다.

제조 지능화의 이슈와 제언

데이터 사이언티스트라는 것은

CS/IT 구현 역량
수학 및 통계학
도메인/비즈니스 지식

세 가지가 모두 갖추어져야 한다. 자기가 아는 것 잘하는 것부터 시작해서 셋 다 공부하면 된다.

데이터 수집

제조 데이터 사일로 해결 중요
- 데이터 사일로: 조직의 한 부분에 존재하는 데이터가 다른 부분에서 찾아 활용하거나 액세스할 수 없도록 분리된 상태
- 이슈사항: 비즈니스 관리자와 데이터 분석가가 각자의 전문 영역을 뛰어넘는 전체적이고 전략적인 시야를 얻지 못하는 원인이 됨
- 발생 원인: 다양한 데이터 소스와 이기종의 시스템 활용
- 해결: 통합 & interoperability
데이터 부족, garbage in garbage out
- 다 끌어모은다고 빅데이터가 아니고 쓸모가 있는 right good 데이터가 중요하다
- 수집하고 나서도 품질 관리 필요
- 데이터를 많이 수집해도 “정답” 레이블이 있는 데이터 확보는 어렵다. 데이터 불균형 발생.
- right 데이터를 찾으려면 목적이 확실해야 하고, 그 목적에 어떤 데이터가 right한지 아는 것은 많이 다루고 경험해봐야 한다.
데이터 분석 모델과 엔지니어링 업무와의 연계 필수
- 데이터 분석 결과가 현장 및 업무와 연계되어 피드백, 제어까지 수행되어야 한다
- 제조 현장 인프라, 시스템과 연계되어 실행 필요
- 혼자 일하지 마세요
데이터 분석 모델 초기 개발(구축) 이후에 대한 전략 필요
- 한번 개발된 AI는 소비기한이 있다. 공정이 바뀌면 프리티 가비지가 됨. 모든 데이터에 대해 분석할 수도 없음.
- 데이터 분석 모델의 일반성, 확장성 확보 필요
- 특히 전사적 도입 시 데이터 분석 전문가와 전략적 접근 필요 ← 이걸 안해서 예쁜 쓰레기 만드는 기업이 정말 많다
관리자와 현장 작업자를 위한 지능화, 데이터 분석 교육 필요
- 코딩은 님같이 하던 사람들이나 친숙한 거지, 보통은 개발 환경만 봐도 긴장한다.
- 그래서 요즘 노코딩 플랫폼들이 사용되고 있음
“데이터 분석” 키워드로 전문인력 확보는 어렵고 실패 확률이 큼
- 대기업도 안목이 영 안되는 경우가 많음
- 도메인을 기준으로 데이터 분석 구현 능력이 있는 인재가 필요한 거다
제조 현장은 실험실이 아니기 때문에 연구 개발과 현장 적용의 차이를 확실히 알아야 한다
- 최신 트렌드를 너무 엠지하게 적용하는 건 좀 위험 ← 그거 거기에 쓰는 게 확실하게 맞나요? 확인이 되었나요?
  - 진짜 좀 할 줄 아는 기업들은 외부에 공개 자체를 안한다. 굳이 외부 인력 없어도 다 할 수 있거든.
  - 그리고 인공지능은 블랙박스가 있다. 현업은 항상 설명 가능해야 하는데, 블랙박스가 있으면 누가 설명하고 누가 책임질 거임?
- 제조 지능화의 기본은 데이터에 대한 이해
- 통계만 해도 문제가 다 밝혀지는 사례가 정말 많다. 머신러닝은 필요할 때 필요한 만큼만 쓰세요.
- 데이터 분석 결과에 대해 이해할 수 있는 결과 표현/가시화를 전문가에게 요구해야 한다. 일반적인 전문가들은 결과를 내놓는 것을 자신의 업무의 엔딩으로 간주하기 때문에 과정은 요구하지 않으면 말도 안 하는 경우가 많음. 하기 싫어서 (X) 필요한 줄 몰라서 (O)
- 데이터 분석 결과에 대해 설명 가능한 모델 구성을 전문가에게 요구해야 함. 누군가는 이유를 설명할 수 있어야 함. 돈을 더 요구하는 경우도 있긴 하지만,, 그래도 요구해야 함.
- 데이터 분석 모델의 실행까지 고려해야 함. 학습을 시킬 때에는 GPU 빵빵한 연구실에서 느긋하게 해도 되지. 근데 실제로 동작할 때에는 GPU가 없을 수도 있고, 제한시간이 짧을 수도 있음. 이 경우 모델을 경량화해야 할 수 있음.
  - 경량화는 어떻게 하나? 파라미터만 좀 바꿔줘도 의외로 괜찮을 수 있다. 원래는 속성을 10개 썼는데, 그걸 5개로 줄여도 성능이 유지된다면 5개 쓰면 되지.

디지털 트윈과 제조 지능화 (2)

덤

제조 지능화 기본 개념

팩토리

스마트

제조 데이터의 이해

제조 데이터의 이해 - 데이터 개념

제조 데이터의 이해

데이터 분석

제조 지능화 사례 - 다이캐스팅 공정 지능화

다이캐스팅이 뭐야?

문제 정의

데이터 수집

데이터 처리/저장

모니터링/탐색 & 데이터 분석

제조 지능화 사례 - 사출성형 공정 지능화

제조 지능화 사례 - KOSMO, KAMP

제조 지능화의 이슈와 제언

데이터 사이언티스트라는 것은

데이터 수집

관련된 글

디지털 트윈과 제조 지능화 (1)

C# 프로그래밍 (2)

C# 프로그래밍 (3)