Nowa metoda modelowania półprzewodników z wykorzystaniem kwantowego uczenia maszynowego

Australijscy naukowcy opracowali technikę łączącą sztuczną inteligencję z obliczeniami kwantowymi, która pozwala skuteczniej modelować wybrane etapy produkcji mikrochipów. Zastosowanie tzw. regresji opartej na kwantowym jądrze (QKAR) umożliwiło dokładniejsze przewidywanie oporności styków omowych w tranzystorach GaN HEMT — parametr ten ma kluczowe znaczenie dla wydajności układów scalonych. Co istotne, model został przetestowany na rzeczywistych danych i przewyższył pod względem skuteczności siedem porównywanych modeli klasycznych.

Opublikowane pod koniec czerwca na łamach czasopisma Advanced Science wyniki badań pokazują, że algorytmy kwantowego uczenia maszynowego (QML) mogą znacząco usprawnić jeden z trudniejszych etapów projektowania mikrochipów: modelowanie rezystancji styku omowego między warstwami metalu i półprzewodnika.

Kwantowe podejście do produkcji chipów

Kwantowe uczenie maszynowe (QML) to podejście hybrydowe, które łączy klasyczne dane z technikami obliczeń kwantowych. W komputerach klasycznych dane są przechowywane w bitach przyjmujących wartość 0 lub 1. Komputery kwantowe wykorzystują kubity — ich kwantowe odpowiedniki — które dzięki zjawiskom superpozycji i splątania mogą jednocześnie reprezentować wiele stanów. Na przykład dwa kubity mogą istnieć równocześnie we wszystkich kombinacjach 00, 01, 10 i 11.

Dzięki temu systemy kwantowe mogą przetwarzać złożone zależności matematyczne znacznie szybciej niż klasyczne — szczególnie w przypadku problemów, w których liczba możliwych kombinacji rośnie wykładniczo. Kwantowe uczenie maszynowe polega na zakodowaniu klasycznych danych w stanach kwantowych. Komputer kwantowy analizuje je, identyfikując wzorce trudne do wykrycia dla systemów tradycyjnych. Następnie klasyczny komputer interpretuje i wykorzystuje uzyskane wyniki.

Kubity, Superpozycja i Splątanie

Kubity (qubits):
Podstawowe jednostki informacji w komputerze kwantowym. W odróżnieniu od bitów, które mogą przyjmować tylko wartość 0 lub 1, kubit może znajdować się w stanie 0, 1 lub w superpozycji tych dwóch — czyli w stanie pośrednim, reprezentującym oba jednocześnie.

Superpozycja:
Zjawisko pozwalające kubitowi reprezentować wiele możliwych wartości jednocześnie. Dopiero pomiar „wymusza” wybór jednego z tych stanów — 0 lub 1.

Splątanie (entanglement):
Stan, w którym dwa (lub więcej) kubity są ze sobą powiązane w taki sposób, że zmiana stanu jednego automatycznie wpływa na stan drugiego, niezależnie od odległości. To właśnie splątanie umożliwia komputeryzacji złożonych problemów w sposób niedostępny dla tradycyjnych systemów.

Wnętrze procesu produkcji chipów: wyzwanie rezystancji styku omowego

Produkcja półprzewodników to skomplikowany, wieloetapowy proces wymagający mikroskopijnej precyzji. Obejmuje on nakładanie i kształtowanie często setek cienkich warstw na waflu krzemowym — cienkim, okrągłym dysku z czystego krzemu, który stanowi podstawę mikrochipu.

Kluczowe etapy tego procesu to:

  • Depozycja: Proces nanoszenia cienkich warstw materiałów (takich jak metale, półprzewodniki czy izolatory) na powierzchnię wafla. Stosuje się tu różne metody, w tym osadzanie chemiczne z fazy gazowej (CVD) lub fizyczne (PVD), zależnie od właściwości i przeznaczenia warstwy.
  • Powlekanie fotorezystem: Pokrywanie wafla cienką warstwą materiału światłoczułego (fotorezystu), który reaguje na światło w procesie litografii. Wzór naniesiony światłem na fotorezyst decyduje o tym, które obszary będą później usunięte lub zachowane w procesie trawienia.
  • Litografia: Przenoszenie wzorów obwodów na powierzchnię wafla przy użyciu światła. Kluczowym parametrem jest tutaj minimalna szerokość linii, jaką można odwzorować — mierzona w nanometrach. Właśnie ten wymiar, np. 7 nm czy 3 nm, bywa często podawany jako charakterystyka technologii litograficznej w opisach architektur procesorów.
  • Trawienie: Usuwanie wybranych fragmentów warstw materiału zgodnie z wzorami utworzonymi wcześniej w litografii. Może być realizowane za pomocą reakcji chemicznych (trawienie mokre) lub plazmy (trawienie suche). Trawienie tworzy fizyczne struktury w mikro- i nanoskali.
  • Implantacja jonów: Proces bombardowania powierzchni wafla jonami — naładowanymi cząstkami — w celu zmiany właściwości elektrycznych danego obszaru. Pozwala to precyzyjnie dostosować charakterystyki półprzewodnika (np. zmienić typ przewodnictwa z N na P), co jest kluczowe dla działania tranzystorów.
  • Pakowanie: Końcowy etap produkcji mikrochipu, obejmujący jego hermetyzację i podłączenie do zewnętrznych pinów, kontaktów lub interfejsów. Ma to na celu zarówno ochronę samego chipa, jak i umożliwienie jego integracji z płytką drukowaną lub gotowym urządzeniem.

Na późniejszym etapie, już po uformowaniu struktur, kluczowe znaczenie zaczyna mieć rezystancja styku omowego — czyli opór napotykany przez prąd na granicy między metalem a półprzewodnikiem. Im niższa ta wartość, tym sprawniej chip przewodzi sygnały elektryczne i tym mniejsze są straty energii.

Modelowanie tej właściwości od dawna stanowiło wyzwanie. Inżynierowie korzystali z klasycznych metod uczenia maszynowego (ang. classical machine learning), które analizują dane, aby przewidywać parametry procesowe. Jednak skuteczność tych algorytmów spada, gdy dostępne dane są nieliczne, zaszumione i pełne złożonych, nieliniowych zależności.

– Chociaż klasyczne modele były szeroko badane pod kątem modelowania charakterystyk urządzeń i procesów produkcyjnych, ich skuteczność w małych, wielowymiarowych zbiorach danych jest ograniczona. Często prowadzi to do przeuczenia i słabej generalizacji – piszą autorzy badania.

Aby przezwyciężyć te ograniczenia, naukowcy sięgnęli po techniki kwantowego uczenia maszynowego.

Rezystancja styku omowego

o opór, jaki napotyka prąd elektryczny, przepływając między dwoma różnymi materiałami — np. metalem a półprzewodnikiem. W idealnym styku prąd przepływa swobodnie, bez znaczących strat. W rzeczywistości jednak nieidealne właściwości materiałów mogą powodować lokalne bariery, które zwiększają oporność. Niska rezystancja kontaktowa jest kluczowa dla szybkiego i energooszczędnego działania mikroprocesorów i innych układów scalonych.

QKAR: Kwantowy algorytm do modelowania oporności styku

Zespół badaczy wykorzystał dane z 159 eksperymentalnych próbek tranzystorów GaN HEMT (High-Electron-Mobility Transistors) — zaawansowanych elementów półprzewodnikowych znanych z wysokiej wydajności i szeroko stosowanych w elektronice mocy oraz technologii 5G. Ich celem było stworzenie narzędzia umożliwiającego trafne prognozowanie oporności styku omowego.

Najpierw naukowcy zidentyfikowali zmienne produkcyjne mające największy wpływ na ten parametr, zawężając zbiór danych do najistotniejszych cech wejściowych. Następnie zaprojektowali nowy algorytm hybrydowy — Quantum Kernel-Aligned Regressor (QKAR) — łączący techniki obliczeń kwantowych z klasycznym uczeniem maszynowym.

QKAR działa poprzez konwersję danych klasycznych do postaci stanów kwantowych, co pozwala komputerowi kwantowemu analizować ukryte, złożone zależności. Na podstawie tej analizy system klasyczny uczy się tworzyć model predykcyjny, który może posłużyć do optymalizacji parametrów produkcji chipów.

– QML może wykorzystywać jądra kwantowe, które naturalnie wychwytują złożone interakcje cech i oferują doskonałą generalizację dla małych zbiorów danych. Te właściwości sprawiają, że QML oparte na jądrach jest atrakcyjnym kandydatem do modelowania półprzewodników, gdzie dane są często rzadkie, a parametry procesowe silnie wzajemnie zależne – podkreślają autorzy.

Architektura QKAR opiera się na tzw. mapie cech Pauli-Z, która koduje dane w obwodach kwantowych, oraz warstwie Quantum Kernel Alignment (QKA) — opcjonalnym komponencie umożliwiającym dodatkowe dostrajanie jądra kwantowego. Po zakodowaniu danych i ocenie podobieństw między ich reprezentacjami kwantowymi, wyniki są przetwarzane przez klasyczny regresor wektorów wsparcia (SVR), odpowiadający za właściwe prognozowanie.

QKAR, jądra kwantowe, Pauli-Z, QKA, SVR

Quantum Kernel-Aligned Regressor (QKAR):
Hybrydowy algorytm kwantowego uczenia maszynowego, zaprojektowany z myślą o dokładnym modelowaniu złożonych zjawisk technologicznych, takich jak oporność styku w półprzewodnikach. Łączy obliczenia kwantowe z klasycznym modelem regresyjnym.

Jądra kwantowe (quantum kernels):
Funkcje mierzące podobieństwo między danymi po ich przekształceniu do przestrzeni kwantowej. Dzięki tym jądrom możliwe jest wykrywanie nieliniowych, trudnych do wychwycenia wzorców w danych — szczególnie przy małych zbiorach.

Mapa cech Pauli-Z:
Typ obwodu kwantowego używany do kodowania danych klasycznych w stany kwantowe. Opiera się na bramkach Hadamarda oraz rotacjach wokół osi Z, które przygotowują kubity do późniejszego przetwarzania.

Quantum Kernel Alignment (QKA):
Dodatkowa warstwa w architekturze QKAR zawierająca trenowalne parametry. Pozwala dostosować właściwości jądra kwantowego do konkretnego problemu regresyjnego, zwiększając precyzję modelu.

Regresor wektorów wsparcia (SVR):
Klasyczny algorytm uczenia maszynowego wykorzystywany w końcowej fazie działania QKAR. Otrzymuje macierz podobieństw wygenerowaną przez obliczenia kwantowe i na jej podstawie przewiduje wartości docelowe.

Zaskakująca skuteczność i przewaga nad klasycznymi modelami

Zespół naukowców przetestował model QKAR na pięciu nowych próbkach tranzystorów GaN HEMT nigdy wcześniej nieużywanych do trenowania modelu. Wyniki porównano z siedmioma czołowymi klasycznymi algorytmami — w tym metodami głębokiego uczenia i wzmacniania gradientowego (gradient boosting). We wszystkich analizowanych metrykach QKAR wykazał się lepszą dokładnością.

Model uzyskał średni błąd bezwzględny (MAE) na poziomie 0,338 Ω·mm, co oznacza zauważalną poprawę względem klasycznych rozwiązań.

– Wyniki te wskazują na potencjał QML w efektywnym radzeniu sobie z zadaniami regresji o wysokiej wymiarowości i małej liczbie próbek w dziedzinie półprzewodników – napisali naukowcy w raporcie z badań. – Metoda ta może wkrótce zostać zastosowana w rzeczywistej produkcji chipów, szczególnie w miarę ciągłego rozwoju sprzętu kwantowego.

W analizie statystycznej model QKAR uzyskał:

  • co najmniej 15,2% poprawy w MAE,
  • 20,1% poprawy w MSE (średnim błędzie kwadratowym),
  • oraz 8,8% w RMSE (pierwiastku średniego błędu kwadratowego)

— w porównaniu do najlepszego klasycznego modelu referencyjnego. Pokazuje to, że jądra kwantowe mogą przynieść rzeczywiste korzyści predykcyjne, szczególnie w warunkach ograniczonych zasobów danych.

Jednocześnie badacze zachowują ostrożność w ocenie.

– Podczas gdy QKAR sprawdził się korzystnie w tym konkretnym kontekście, modele klasyczne potencjalnie mogłyby osiągnąć lepsze wyniki dzięki bardziej rozbudowanemu dostrojeniu hiperparametrów lub alternatywnym architekturom.

Mimo to, to właśnie QKAR najlepiej radził sobie z danymi charakteryzującymi się wyraźnymi trendami liniowymi z osadzonymi złożonościami nieliniowymi — typowymi dla układów półprzewodnikowych.

MAE, MSE, RMSE,

MAE (Mean Absolute Error – Średni błąd bezwzględny):
Średnia wartość bezwzględna różnic między przewidywanymi a rzeczywistymi wartościami. Nie rozróżnia, czy prognoza była za wysoka, czy za niska — liczy się tylko wielkość błędu. Im niższe MAE, tym lepszy model.

MSE (Mean Squared Error – Średni błąd kwadratowy):
Średnia z kwadratów błędów. Bardziej wrażliwa na duże odchylenia, ponieważ duże błędy są silnie karane przez podniesienie do kwadratu.

RMSE (Root Mean Squared Error – Pierwiastek z MSE):
Miernik zbliżony do MSE, ale wynik podawany jest w tych samych jednostkach co zmienna wyjściowa (np. Ω·mm), co ułatwia interpretację w kontekście fizycznym.

Odporność na szumy i perspektywy zastosowania

Zespół badawczy ocenił również, jak model QKAR radzi sobie w warunkach realistycznych — czyli w obecności szumów kwantowych, które są nieuniknione w dzisiejszych komputerach kwantowych. W eksperymencie zastosowano najlepiej działającą architekturę QKAR z mapą cech Pauli-Z i warstwą wyrównania jądra (QKA), a następnie wprowadzono do obwodu zarówno szumy jednokubitowe, jak i dwukubitowe szumy depolaryzujące — czyli losowe zakłócenia symulujące niedoskonałości działania sprzętu.

Wprowadzenie 1% szumu depolaryzującego na pojedynczy kubit spowodowało wyraźny, ale umiarkowany spadek wydajności QKAR. Choć dokładność modelu (mierzona MAE) uległa pogorszeniu w porównaniu z wynikami dla idealnych, „czystych” kubitów, nadal mieściła się w zakresie osiąganym przez klasyczne modele. Nawet przy pogorszeniu wyników RMSE i R², model zachował zdolność do wiarygodnej predykcji, co sugeruje, że może być użyteczny również w warunkach rzeczywistego szumu sprzętowego.

To istotna informacja, ponieważ większość obecnych komputerów kwantowych działa w tzw. reżimie NISQ (Noisy Intermediate-Scale Quantum), gdzie szumy stanowią duże wyzwanie dla stabilności obliczeń. Najnowocześniejsze platformy NISQ mają jednak wskaźniki depolaryzacji niższe niż 0,5%, czyli mniej niż użyto w testach QKAR.

Autorzy zaznaczają, że choć szumy mogą pochodzić z różnych źródeł (nie tylko depolaryzacji), wiele z nich da się częściowo kompensować lub eliminować za pomocą zaawansowanych strategii takich jak:

  • tłumienie szumu na poziomie obwodu,
  • inteligentna kompilacja kwantowa,
  • korekcja błędów kwantowych.

Wraz z dalszym rozwojem tych technologii oraz zwiększaniem tzw. wierności obwodów kwantowych, można oczekiwać, że w przyszłości modele takie jak QKAR będą jeszcze bardziej precyzyjne i niezawodne.

Szum depolaryzujący, NISQ, wierność

Szum depolaryzujący:
Rodzaj zakłócenia, które powoduje, że stan kubitu zostaje przypadkowo „przemieszany” z innymi możliwymi stanami. To jedna z najczęstszych form błędu w systemach NISQ.

NISQ (Noisy Intermediate-Scale Quantum):
Termin określający aktualną generację komputerów kwantowych, które mają ograniczoną liczbę kubitów i nie są jeszcze odporne na błędy. Ich możliwości są większe niż w klasycznych systemach, ale wciąż zbyt ograniczone do pełnej korekcji błędów kwantowych.

Wierność (fidelity):
Miara dokładności odwzorowania oczekiwanego stanu kwantowego po operacji. Wysoka wierność oznacza, że działanie układu kwantowego przebiega blisko idealnego scenariusza bez błędów.

Weryfikacja na rzeczywistych danych i międzynarodowy charakter badań

Aby sprawdzić, jak dobrze model QKAR radzi sobie w praktyce, naukowcy przeprowadzili dodatkowe testy na rzeczywistych danych. Eksperymenty wykonano na dwóch różnych waflach półprzewodnikowych, zbudowanych z materiałów powszechnie stosowanych w nowoczesnych tranzystorach GaN HEMT. Różnice w składzie miały na celu ocenę, jak algorytm poradzi sobie z różnymi warunkami produkcyjnymi.

Wyniki potwierdziły skuteczność modelu: przewidywania QKAR były bardzo zbliżone do rzeczywistych pomiarów we wszystkich testowanych próbkach. Średni błąd bezwzględny (MAE) wyniósł 0,338 mm – tyle samo, co w poprzednich testach porównawczych – co pokazuje, że model potrafi zachować wysoką dokładność także poza fazą treningową.

Warto podkreślić, że badania były efektem szeroko zakrojonej współpracy międzynarodowej. Dane eksperymentalne dotyczące procesów produkcyjnych dostarczyły zespoły z Uniwersytetu Pekińskiego, Songshan Lake Materials Laboratory oraz City University of Hong Kong. Na ich podstawie zespół naukowców z australijskiej organizacji CSIRO (Commonwealth Scientific and Industrial Research Organisation) opracował i wytrenował modele kwantowego uczenia maszynowego.

CSIRO to wiodąca narodowa agencja naukowa Australii, z siedzibą główną w Canberze, działająca od 1916 roku. Od ponad stulecia odpowiada za wiele znaczących odkryć i innowacji technologicznych, w tym rozwój pierwszych wersji technologii Wi-Fi oraz szeregu rozwiązań dla przemysłu, rolnictwa i ochrony środowiska. Jej rola w badaniach nad QKAR pokazuje, jak aktywnie angażuje się w rozwój nowoczesnych rozwiązań obliczeniowych, w tym także w badania nad praktycznym wykorzystaniem komputerów kwantowych w przemyśle mikroelektronicznym. Dzięki intensywnej współpracy z ośrodkami badawczymi w regionie Azji i Pacyfiku, CSIRO odgrywa dziś kluczową rolę w międzynarodowych projektach technologicznych i badawczych.

Podsumowanie i perspektywy rozwoju technologii QML

Połączenie kwantowego uczenia maszynowego z modelowaniem procesów produkcji chipów może w niedalekiej przyszłości zmienić sposób, w jaki projektuje się i wytwarza półprzewodniki. Badania pokazują, że algorytmy takie jak QKAR potrafią skutecznie poradzić sobie z typowymi wyzwaniami tego środowiska – na przykład z niewielką ilością danych i ich wysokim poziomem zakłóceń. Stała przewaga nad klasycznymi modelami oraz odporność na umiarkowany poziom szumów czynią QKAR szczególnie interesującym rozwiązaniem dla branży.

– Chociaż niniejsze badanie zostało przeprowadzone na symulatorach kwantowych, użyte obwody kwantowe są kompatybilne z obecnym sprzętem NISQ. W miarę poprawy wierności i skali procesorów kwantowych, wdrażanie modeli QML w rzeczywistych procesach produkcji półprzewodników może stawać się coraz bardziej opłacalne – podsumowują autorzy badania.

Można porównać QKAR do nowej generacji diagnostyki przemysłowej — tak jak rezonans magnetyczny pozwala zajrzeć do wnętrza ludzkiego ciała i dostrzec to, co niedostępne dla klasycznych metod obrazowania, tak QKAR umożliwia zaglądanie w wewnętrzne, trudne do uchwycenia relacje rządzące procesem produkcji mikrochipów. I co najważniejsze — potrafi z tej wiedzy skutecznie korzystać.

Rozwijająca się technologia procesorów kwantowych, w połączeniu z udoskonaleniami w zakresie ograniczania szumów i lepszym odwzorowaniem danych, może sprawić, że narzędzia takie jak QKAR znajdą zastosowanie w przemysłowych procesach produkcyjnych. To z kolei może przełożyć się na szybsze, bardziej energooszczędne i bardziej przewidywalne w produkcji układy scalone — technologię, od której zależy przyszłość elektroniki.

źródła: csiro.au, hpcwire.com, cosmosmagazine.com, livescience.com

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *