Strategia układania przetrwania oparta na ścieżce
Załóżmy, że dane dotyczące przeżycia są ocenzurowane N Tematy składają się z trójek {(yI, δI,SI)},l I= 1, 2, …, N. Wskazuje obserwowany czas przeżyciayI= minuta( RI, CI), Gdzie RI ICI to odpowiednio czas zdarzenia i czas cenzury. δI= I ( RI<CI) wskazuje na wystąpienie zdarzeń. Celem jest oszacowanie funkcji przeżycia zmiennej losowej w czasie zdarzeniaY To zależy SWspółzmienne Skażdy S( y|S) = S(Y > y |S). W tym badaniu naszym celem jest przewidzenie przeżycia pacjentów chorych na raka na podstawie danych genomicznych.
Proponowana metoda układania przetrwania to dwuwarstwowa architektura uczenia się składająca się z wielu podstawowych uczniów (podmodeli) i odrębnego ucznia (metamodel). Zobacz rysunek 1, aby zapoznać się z przepływem klatek.
Najpierw przekształcamy dane genomu wCDane cząstkowe zawierające geny w każdym szlaku. Następnie w pierwszej warstwie podmodele są trenowane niezależnie dla każdego poddanych. Powstałe podmodele reprezentują moc predykcyjną trajektorii. Aby złagodzić nadmierne dopasowanie, obliczamy zweryfikowane krzyżowo predyktory przeżycia w oparciu o podmodele. W szczególności w każdym przebiegu oryginalne próbki danych są losowo dzielone KPodzbiory (fałdy) o równej (przybliżonej) wielkości. the Ky Zgięcie służy jako dane do walidacji, Piąty(K), podczas gdy pozostałe zagięcia to dane treningowe,T(-K),K= 1, 2, …, K . W danych szkoleniowych można zastosować model kar Coxa w celu dopasowania podmodelu i leżących u jego podstaw ryzykH0– K( y–K) można oszacować metodą Breslowa. Następnie predyktor liniowy (lpK) w danych walidacyjnych są szacowane za pomocą dopasowanego podmodelu. Szacowane prawdopodobieństwo przeżycia \({\kapelusz {S}}^k\lewo({y}^k|\boldsymbol{x}\prawo)\) WPiąty ( K ) można obliczyć za pomocąlpK IH0–K( y– K), że to
$$ {\kapelusz {S}}^k\lewo({y}^k|\boldsymbol{x}\prawo)={e}^{-{H}^{-k}\lewo({y}^ {-k}\right)}$$
(1)
Gdzie \({H}^{-k}\left({y}^{-k}\right)={H}_0^{-k}\left({y}^{-k}\right)\times {e}^{l^k}\), \({H}_0^{-k}\lewo({y}^{-k}\prawo)\) Jest to skumulowane ryzyko bazowe, czyli integralna część H0– K( y– K). Proces jest powtarzany dla wszystkich K fałduje, dając przewidywane prawdopodobieństwa przeżycia CV we wszystkich przypadkach. Do C Podmodele, które możemy uzyskać C Prognozy \({{\hat{S}}_j}^{CV}\left(y|\boldsymbol{x}\right)=\sum_{k=1}^K{{\hat{S}}_j}^ k\left({y}^k|\boldsymbol {x}\right),\kern0.5em j=1,2,\dots, J\). Druga warstwa wykorzystuje odrębnego ucznia, aby dopasować go do oczekiwań dotyczących przetrwania CV C Podmodele w zestawie punktów czasowych. Otrzymane współczynniki są szacunkowymi wagami \({\kapelusz{w}}_j\) DoCPodmodele. Predykcyjna funkcja przeżycia \(\kapelusz {S}\lewo(y|\boldsymbol {x}\prawo)\) Można to oszacować, łącząc predyktory CPodmodele \({\hat{S}}_j\left(y|\boldsymbol{x}\right)\) (Odnów oryginalne dane) za pomocą wag \({\kapelusz{w}}_j\).
Metoda szacowania wag \({\kapelusz{w}}_j\)
Podejście oparte na kombinacji liniowej
Zazwyczaj funkcja przeżycia ma charakter predykcyjny \(\kapelusz {S}\lewo(y|\boldsymbol {x}\prawo)\) Jest to liniowa kombinacja predyktorów C Podmodele kandydujące podane jako,
$$\kapelusz {S}\left(y|\boldsymbol{x}\right)=\sum_{j=1}^J{\hat{w}}_j{\hat{S}}_j\left(y |\boldsymbol{x}\right)$$
(2)
Udoskonalamy ciężary \(\kapelusz{w}\) Ograniczając zanik zespołu jelita drażliwego. Odpowiednią alternatywą powinna być inna funkcja straty, taka jak strata oparta na AUC [22]. IBS mierzy kwadrat odległości między prawdopodobieństwami a zaobserwowanymi zdarzeniami w określonym czasiey1,…,yS [23]które można zapisać jako,
$$\textrm{IBS}=\sum_{r=1}^s\sum_{i\in R\left({y}_r\right)}{\left\{{Z}_i\left({y} _r\right)-\sum_{j=1}^J{\hat{w}}_j{{\hat{S}}_j}^{(CV)}\left({y}_r|{\boldsymbol{ x}}_i\right)\right\}}^2$$
(3)
Gdzie R( yS) oznacza pacjentów, którzy w tym czasie nadal są zagrożeni yS, GI(yS) = I( yI> yS). Możemy oszacować \(\kapelusz{w}\) Zmniejszając częstość występowania zespołu jelita drażliwego. Ogólnie szacunkowe wagi \({\kapelusz{w}}_j\) Ograniczone przez nieujemność dla mniejszej wariancji i lepszego przewidywania. To ograniczenie można osiągnąć stosując algorytm optymalizacji nieliniowej oparty na rozszerzonej metodzie Lagrange’a, który można zaimplementować w funkcji R. sonp [24]. Odnośnie wyboru bloków czasowych y1,…, ySużywamy dziewięciu równomiernie rozmieszczonych wielkości do rozkładu obserwowanych zdarzeń, jak to nazywa Andrew Way [19].
Metoda kombinacji bayesowskiej
Oprócz rozwiązań IBS, jeśli potraktujemy predyktory przeżycia podmodelu jako współzmienne i potraktujemy przypadek zależny od czasu GI( yS(0) dla martwych i 1 dla żywych w każdym punkcie czasowym yS) Jako wynik binarny oczekiwane przeżycie można wyrazić jako:
$$E\pozostało[\hat{S}\left(y|\boldsymbol{x}\right)\right]={h}^{-1}\lewo[{w}_0+\sum_{j=1}^J{\hat{w}}_j{\hat{S}}_j\left(y|\boldsymbol{x}\right)\right]$$
(4)
Jest to uogólniony model liniowy (GLM).H Jest to funkcja korelacji, taka jak funkcja sigmoidalna, zapewniająca, że oczekiwane prawdopodobieństwo przeżycia wynosi 0-1.
Lasso nieujemne (nLasso)
Postęp wzoru (4) polega na tym, że możemy dodać Do 1 termin karny w powyższym GLM, rozszerzając w ten sposób zastosowanie stosu przetrwania, na przykład radzenie sobie z wieloma podmodelami (w scenariuszu wielowymiarowym), co jest niepraktyczne w przypadku solnp.
Wiadomo, że Lasso jest odpowiednikiem Bayesowskiego modelu hierarchicznego, w którym DE poprzedza współczynniki [25]przy współczynnikach uznawanych w tym badaniu za nieujemne,
$${w}_j\mid s\sim DE\left({w}_j|0,s\right)=\frac{1}{2s}\mathit{\exp}\left(-\frac{w_j} {s}\right),\kern0.5em {w}_j\ge 0$$
(5)
Gdzie jest skala,S Kontroluje stopień skurczu. Mniejszy rozmiar prowadzi do silniejszego skurczu, co prowadzi do niedoszacowań CzY W kierunku zera. Ciężary wyposażone w nLasso są podane przez,
$$\hat {\boldsymbol {w}}=\mathit {\arg}\underset{\boldsymbol {w},{w}_j\ge 0}{\max}\left\{\mathit{\log}\ Lewo(l\lewo(\boldsymbol {w}\prawo)\prawo)-\sum_{j=1}^J\frac{{\hat{w}}_j}{s}\right\}$$
(6)
Powyższe wagi można oszacować za pomocą algorytmu okresowego współczynnika współrzędnych com Pakiet w zastrzeżeniu RCz Bycie niepasywnym można łatwo wykorzystać com eksmisja.
Nieujemny kolec i lasso płytowe (nsslasso)
Rozszerzamy również nieujemny DE przed nieujemną mieszanką elewacji i płyt przed DE (rysunek uzupełniający 1),
$${w}_j\mid {s}_j\sim DE\left({w}_j|0,{s}_j\right)=\frac{1}{2{s}_j}\mathit{\exp }\left(-\frac{w_j}{s_j}\right),\kern0.5em {w}_j\ge 0$$
(7)
Gdzie SY= (1 – γY) S0 + γYS1 Nazywa się to parametrem całkowitego zakresu. γY jest wskaźnikiem ( γY ∈{0, 1}) po rozkładzie dwumianowym; S0 I S1 ( S1 >S0 > 0) to parametry skali odpowiednio dla wysokości i rozkładu płyty.S1 Stosuje słabszą kompresję do silniejszych ścieżek efektów i zwykle ma ustaloną większą wartość, npS1 = 1; chwila S0Zapewnia silniejszą kompresję słabym ścieżkom wpływu (lub nawet kompresję do zera) i jest elastyczną mniejszą wartością wybraną z zestawu wartości kandydujących określonych wcześniej w drodze walidacji krzyżowej. Lasso kolczaste i płytowe jest zwykle bardziej elastyczne niż lasso [26]. Wagi można oszacować za pomocą algorytmu współczynnika współrzędnych EM [26] za pomocącompakiet iBahjalam package w R. Ograniczenie wag do wartości nieujemnych można również wykonać za pomocącomeksmisja.
Sztuczna sieć neuronowa
Biorąc pod uwagę, że SSN może działać jako klasyfikator i nadawać ograniczone (nieujemne) wagi danym wejściowym, możemy wykorzystać ją jako funkcję uczącą się. SSN wykorzystuje algorytm propagacji wstecznej i algorytm opadania gradientu do iteracyjnego szacowania wag.
Oceń wydajność modelu
W zasadzie model układania przeżycia jest problemem klasyfikacji binarnej dla danego okresu [21]. W tym przypadku zastosowaliśmy zależną od czasu wartość AUC i zależną od czasu skalę Briera (BS), która oblicza AUC i BS dla organizmów w grupie ryzyka w dowolnym momencie, zgodnie z zaleceniami Roberta Tibshiraniego. [21]. Zależną od czasu wartość AUC wykorzystuje się do badania zdolności modelu do rozróżniania różnych wyników w danym momencie. Zależny od czasu BS służy do pomiaru wydajności kalibracji w danym momencie: \(\textrm{BS}(y)=\frac{1}{n}\sum_{i=1}^n{\left({Z}_i(y)-\hat{S}\left(y| \boldsymbol {x}\right)\right)}^2\). Do oceny wybraliśmy trzy punkty czasowe, mianowicie 25, 50 i 75% całkowitego czasu obserwacji danych testowych.
Konkurencyjne metody statystyczne
W proponowanym przez nas modelu układania przetrwania Lasso Cox został wykorzystany do skonstruowania podmodeli opartych na ścieżkach. Aby połączyć podmodele, użyliśmy solnp (implementowanego przez funkcję Rsonp), nLasso/nsslasso (zaimplementowany w pakieciecomIBahjalam) i SSN (zaimplementowane przy użyciu biblioteki TensorFlow (2.3.0) z Pythona (3.7), a wagi można ograniczyć do wartości nieujemnych, używając kernel_constraint = Non_neg()) jako odrębnych elementów uczących. Zobacz proces syntezy SSN Dodatkowe rysunki 2 i 3. W przypadku punktów czasowych do rozkładu obserwowanych zdarzeń wykorzystaliśmy dziewięć równomiernie rozmieszczonych wielkości, a mianowicie {0, 0,125, 0,25, 0,375, 0,5, 0,625, 0,75, 0,875, 1}. Porównujemy skuteczność proponowanej przez nas metody z kilkoma istniejącymi metodami jednomodelowymi, w tym z szeroko stosowaną regresją Lasso Coxa (com.glmnet) [27] Oraz rozszerzenia zawierające struktury grupowe: Group Lasso (gsslasso) (Bahjalam) [28]grupa zagnieżdżona Lasso (grlasso), grupa zagnieżdżona cMCP i grupa zagnieżdżona płynnie wycinane odchylenie bezwzględne (grSCAD) (grpregNakładanie się) [29]. Skuteczność tych metod oceniono na podstawie danych symulowanych i rzeczywistych. Wszystkie metody pojedynczego modelu są implementowane przy użyciu parametrów domyślnych. Wszystkie analizy przeprowadzono przy użyciu oprogramowania R (4.1.3).Procesor Dell T7920 Intel Windows 10 Gold 5117 @ 2,00 GHz.
„Nieuleczalny myśliciel. Miłośnik jedzenia. Subtelnie czarujący badacz alkoholu. Zwolennik popkultury”.
More Stories
Emdoor przygotowuje się do zaprezentowania swoich osiągnięć w zakresie nowej technologii sztucznej inteligencji podczas targów Global Sources Mobile Electronics Show 2024.
LinkedIn wykorzystuje Twoje dane do szkolenia Microsoft, OpenAI i jego modeli AI – oto jak to wyłączyć
Zapomnij o Apple Watch Series 10 — Apple Watch Ultra 2 w kolorze Satin Black to smartwatch, który warto mieć