상세 컨텐츠

본문 제목

빅데이터 기반의 플라즈마 진단에 관한 생각

프로그래밍/Data&ML

by 척척석사 민준 2023. 3. 4. 15:24

본문

728x90

빅데이터 기반의 플라즈마 진단에 관한 생각

측정하고 계산하는 건 무엇을 위해서 일까?

플라즈마 진단, 꼭 정확하게 해야 할까?

전자온도, 전자밀도, 라디칼 농도 등의 플라즈마 파라미터를 측정하고 계산하는 것은 비싸고 복잡한 장비(레이저, 분광기, 증폭기, 고전압측정기, 높은 해상도의 B dot 전류프로브, 고해상도 오실로스코프, 가스질량분석기 등등..)와 측정이 가능한 형태의 안정적으로 발생하는 플라즈마가 필요하다.

플라즈마 진단은 비싸다

고전압 프로브로 흔히 사용되는 Tektronix의 P6015A의 경우 500만 원 정도이며 OES로 사용되는 Ocean Optics사의 USB 2000 모델의 경우 1000만 원 정도 한다. 하지만 이건 실험기구치고 저렴한 편이다.. LIF(Laser-Induced-Flourescence)는 플라즈마의 밀도, 온도, 그리고 라디칼의 조성을 정량적으로 계산하기 위해 사용되는 실험장비이다. 이름에서 알 수 있듯 레이저를 이용하는데, 플라즈마를 여기시키기 위해 고출력 레이저(Nd:YAG, Excimer, Ti:Sapphire 등)을 이용하며 기본적으로 수천만원대이다. 물론 세팅하기 위한 무진동 테이블과 셋팅할 수 있는 박사급의 인재는 있다는 가정하에 겨우 수천만원정도로 실험장비를 갖출 수 있다. 플라즈마를 진단하고 측정하는 장비를 갖추는건 일반적인 연구실에서는 쉽지 않다.

플라즈마 진단은 어렵다

게다가 연구단계의 플라즈마 소스는 불안정한 경우가 많다. 소스가 안정적이더라도 가스나 유량의 미세한 변화로 방전특성이 변할 수 있다. 특히 대기압 플라즈마 소스의 경우는 습도에 민감하기 때문에 오랜 시간 방전특성을 평가하기가 어렵다(1000시간을 방전한다고 해도 중간에 비가 올 수도 있고 건조할 수도 있는데 진공상태가 아니기 때문에 이를 제어하기란 쉽지 않다) 자칫 아크가 튀거나 하면 값비싼 장비에 데미지를 줄 수도 있다.

게다가 이러한 진단방법은 실시간으로 진단할 수가 없다. 플라즈마를 연속적으로 발생시키면서 동시에 측정을 한다고 하면.. 레이저를 이용하는 경우엔 아예 불가능하다. 레이저를 안정시키고 분광기를 Back ground light에 오프셋을 맞춰놓은 다음 플라즈마를 발생시키고 거기에 레이저를 쏴서 생기는 분광데이터를 측정하는데, 이 경우 스펙트럼 라인이 중요하기 때문에 CCD나 CMOS로 한 번에 얻는 게 아니라, 분광기의 grating을 조금씩 조정하면서 스펙트럼 라인을 얻는다. 즉 측정시간 동안 플라스마는 동일한 상태라는 것을 전제로 한 측정이 되는 것이다. 만약 100시간을 방전시키면서 생겨나는 라디칼의 조성변화나 플라즈마의 밀도변화를 측정한다고 하자. 이걸 레이저로? 현실적으로 불가능하다.

정확한 값이 아닌 추세를 파악하는 건 어떨까?

정량적인 데이터를 포기하고 약간의 차이가 있더라도 근사치를 실시간으로 추적하는 게 플라즈마 기기를 개발하고 작동 프로세스를 진단하는 데에 더 유리할 것이다. 과학적인 연구는 정량적인 값을 얻는 게 중요하다. 하지만 공학적인 관점에서 플라즈마를 어떻게 응용하고 어떻게 사용하는가에 있어서는 오차범위 내에서 rough 한 데이터를 계산하고 이를 공정과 연관시키는 것이 더 실용적이다.

정확하게 계산할 수 있다고 해도.. 계산에 드는 시간은?

불확실한 데이터라도 어느 정도 경향성만 맞다면 머신러닝/딥러닝을 이용해 예측 정확도를 높일 수 있다. 플라즈마를 응용할 때 실제로 중요한게 뭘까? 과학적인 관점에선 전자밀도의 분포나 화학종이 생겨나는 매커니즘이 중요하겠지만.. 이를 응용해서 표면처리를 하거나 기판 세정을 한다면.. 정확한 값을 알아도 정확한 파라미터가 표면과 상호작용하는 매커니즘이라던가 표면의 상태변화를 일으키는 프로세스 등을 또 연구해야 한다. 제한된 시간에서 성과(공정최적화 등)를 내야한다면 모든 매커니즘을 밝히는 것보다 플라즈마 변수의 경향성과 그로 인한 공정 프로세스의 결과를 연관 지어 생각하는 것이 더 경쟁력이 있다.

측정을 통해 어떤 물리적 변수를 계산하는 과정은 두 가지가 담보되어야 한다

  1. 노이즈와 신호를 구분할 수 있을 만큼 측정 정확도(해상도)가 충분히 높아야 한다
  2. 계산 과정에 필요한 물리량이 모두 측정가능하거나 계산가능해야 한다

측정해서 얻고 싶은 물리량 A가 있다고 하자.
A를 직접 구하는 경우는 거의 없다. A가 포함된 기본 물리법칙에 포함된 다른 물리변수들을 모두 구할 수 있을 때 이를 이용해 A를 역으로 계산해야 한다.
전자밀도를 옴의 법칙을 이용해 계산한다고 하자.
전류를 측정하는 건 비교적 쉬우니까 별일 아니라고 생각할 것이다.
하지만 전류에서 전류밀도를 계산하려면 전자가 흐르는 면적을 알아야 한다.
전류밀도에서 전자밀도를 알려면 매질 속에서 전자의 속도와 전자의 전하량을 알아야 한다.
이런 값들을 모두 얻으면 전류데이터에서 전자밀도를 계산할 수 있다.
심지어 이렇게 얻은 전자밀도도 옴의 법칙이 적용되는 환경에서의 가정된 값이고 환경이 달라진다면(전자가 빛의 속도에 가깝게 가속한다던가, 자기장 등의 영향을 받아서 경로가 달라진다던가 하는..?) 다른 모델을 가정해서 계산해야 한다.

계산시간으로 인해 모니터링에 지연시간이 생겨난다

물론 물리량을 계산하는 것은 중요하다. 하지만 비슷한 값을 계산하기 위해(작동조건은 비슷하게 유지될 것이기 때문에 계산값도 비슷할 것) 복잡한 계산과정을 거치는 것은 계산에 드는 비용이 높아질 뿐 아니라 계산에 들어가는 물리적인 시간으로 인해 실시간으로 모니터링할 수 없게 된다. 계산에 1분이 소요된다고 하면, 모니터링되는 플라즈마는 1분 전의 플라즈마일 것이다. 만약 스파크 등이 발생해서 방전환경이 바뀐다고 해도 문제를 발견하는데 최소한 1분이 걸리게 되고 이게 반도체공정이었다면.. 되돌릴 수 없는 에칭공정이라면.. 단 1분 때문에 웨이퍼 전체를 버려야 한다.

ML/DL 모델을 배포하면 누구나 쉽게 플라즈마를 진단할 수 있다

ML/DL모델을 이용해 플라즈마를 진단하면 실시간 진단, 이상치 탐색, 저 해상도 데이터 분석이 가능해진다.
플라즈마를 진단하고 분석하는 것은 앞서 설명한 대로 비싼 장비를 들여서 섬세하게 측정하고 많은 계산비용을 들여가며 분석을 해야 물리량을 얻을 수 있다.
머신러닝이나 딥러닝을 이용해 이 과정을 컴퓨터에게 학습시킨다면 어떨까?

머신러닝을 이용한 Data Driven 플라즈마 진단과정

OES를 통해 특정분자의 온도와 밀도를 계산한다고 하자.
플라즈마가 안정적이고 광량이 충분하다면 OES를 이용한 측정은 전통적인 분석방법으로도 상당히 쉽고 간편하게 측정이 가능하다.
OES를 측정하면 스펙트럼 라인별로 Intensity가 측정된다.
전통적인 분석방법은 스펙트럼 라인이 의미하는 분자의 intensity 비율을 이용해 해당 분자의 온도, 밀도 등을 계산한다.
머신러닝을 응용할 때에도 시작점은 같다.

  1. OES를 측정한다(단 ML모델은 데이터가 많을수록 정확도가 높아지므로 최대한 많이 측정한다)
  2. 측정된 데이터 중 일부 OES 데이터를 이용해(이 OES데이터는 학습데이터가 될 것이다) 온도와 밀도를 계산한다. -> 여기까지는 동일하다
  3. 2를 통해 계산한 값은 학습데이터(3에서 계산한 OES 데이터)와 Regression label(온도와 밀도)이 된다.
  4. 학습데이터를 다시 모델학습데이터(train data)와 모델테스트 데이터(test data)로 나눈다.
  5. Train data와 Test data를 적절한 ML모델로 학습시킨다.
  6. OES 데이터를 학습된 ML모델에 넣어 온도와 밀도를 예측한다.

머신러닝 모델을 이용한 플라즈마 진단의 장점

  • 이미 학습된 모델을 이용해 예측하는 것이므로 계산이 빠르다.
    대부분의 지도학습 ML/DL 모델은 계산 속도가 매우 빠르다
  • 학습 데이터가 많을수록 예측 정확도가 높아진다.
    시간이 지날 수록 모델을 개선할 수 있다. 물리모델/시뮬레이션의 경우 시간이 아무리 지나도.. 계산식은 동일하기에 새로운 가정을 해야지만 예측 정확도가 높아진다
  • 플라즈마 진단 연구와 플라즈마 응용 연구를 분리할 수 있다.
    플라즈마 진단 연구는 머신러닝 모델만 업데이트 하면 되고, 플라즈마 응용 연구에선 제공된 머신러닝 모델에 측정한 데이터를 넣기만 하면 분석값이 나오므로 연구영역을 분리할 수 있다
  • 머신러닝 모델은 블랙박스이기에 외부에 공개할 수 있다.
    계산식의 경우 계산과정이 공개될 수 있고 이는 사업화하는 데 있어서 분리하다. 학습한 머신러닝 모델은 배포해도 제삼자가 이를 해체할 수가 없다. 가중치만 가지고는 학습에 사용된 데이터를 얻을 수 없기 때문이다.

머신러닝 모델을 이용한 플라즈마 진단의 단점

  • 플라즈마 방전의 메커니즘이나 라디칼 발생과정을 알기가 힘들다.
    어떤 변수가 원인이 되어서 밀도나 온도를 변화시켰는지 알기가 힘들기 때문에 머신러닝 모델을 가지고는 실험을 할 수가 없다.
  • 명확한 상관관계가 있는지 없는지 모호한 경우가 있다.
    데이터와 진단결과를 가지고 학습을 하기 때문에 해당 데이터를 측정할 때의 여러 조건들 간의 상관관계가 모호하다(전류펄스의 길이와 플라즈마 방전 횟수를 변수로 넣는다고 해서 이 둘이 어떤 상관관계가 있는지는 모호하다)
  • 일반화된 법칙을 만들기가 힘들다
    메커니즘과 상관관계를 알기 힘들기 때문에 기존의 물리법칙들처럼 어떤 매개변수를 통해 법칙을 일반화하기가 힘들다
  • 많은 양의 측정데이터가 필요하다
    측정데이터가 많아야만 정확한 분석이 가능하다. 데이터를 많이 만들 수 없는 경우(예를 들면 쉽게 사라지는 활성종 분석)는 학습데이터의 부족으로 ML모델을 만들기가 어렵다.
728x90

관련글 더보기