Hvordan vælger man antallet af skjulte lag og knuder i et feedforward neuralt netværk?

Question

Mere

Spørgsmål

Hvordan vælger man antallet af skjulte lag og knuder i et feedforward neuralt netværk?

Findes der en standardiseret og accepteret metode til at vælge antallet af lag og antallet af knuder i hvert lag i et feed-forward neuralt netværk? Jeg er interesseret i automatiserede metoder til opbygning af neurale netværk.

Post Self

Redigeret spørgsmål 2017ør marts 2017 в 5:51

Maskinlæring og dataanalyse

neural-networks

model-selection

Løsning / svar

Tilføj spørgsmål

Kategorier

Alle

Teknologi

Kultur / fritid

Liv / kunst

Videnskab

Professionel

Virksomhed

Brugere

Alle

Ny

Populære

1

Ксения Комарова

Registreret 2 uger siden

2

Артур «Апер»

Registreret 1 måned siden

3

Viktor Malyutin

Registreret 2 måneder siden

4

Viktor Malyutin

Registreret 2 måneder siden

5

Syahputra Zhedenk

Registreret 2 måneder siden

Do you have a question? Add it on the site and get an answer instantly

en.kzen.dev

doug · Accepted Answer · 2010-08-02T02:20:30+00:00

Jeg er klar over, at dette spørgsmål er blevet besvaret, men jeg synes ikke, at det eksisterende svar virkelig tager fat på spørgsmålet ud over at pege på et link, der generelt har relation til spørgsmålets emne. Linket beskriver især en teknik til programmatisk netværkskonfiguration, men det er ikke en "[en] standardiseret og accepteret metode" til netværkskonfiguration. Ved at følge et lille sæt klare regler kan man programmatisk indstille en kompetent netværksarkitektur (dvs. antallet og typen af neuronale lag og antallet af neuroner i hvert lag). Hvis man følger dette skema, får man en kompetent arkitektur, men sandsynligvis ikke en optimal arkitektur. Men når først dette netværk er initialiseret, kan du iterativt afstemme konfigurationen under træningen ved hjælp af en række hjælpealgoritmer; en familie af disse fungerer ved at pruning noder baseret på (små) værdier af vægtvektoren efter et vist antal træningsepocher - med andre ord ved at eliminere unødvendige/overflødige noder (mere om dette nedenfor). Hver NN har således tre typer lag: input, hidden og output.

Oprettelse af NN-arkitekturen betyder derfor, at man skal finde frem til værdier for antallet af lag af hver type og antallet af knuder i hvert af disse lag. Inputlaget Simpelt - alle NN'er har præcis ét af dem - ingen undtagelser, som jeg kender til. Med hensyn til antallet af neuroner, der indgår i dette lag, bestemmes denne parameter fuldstændigt og entydigt, når du kender formen på dine træningsdata. Nærmere bestemt er antallet af neuroner i dette lag lig med antallet af funktioner (kolonner) i dine data. Nogle NN-konfigurationer tilføjer en ekstra knude til en bias-term.

Udgangslaget Ligesom indgangslaget har alle NN'er nøjagtigt ét udgangslag. Det er enkelt at bestemme dets størrelse (antal neuroner); det bestemmes helt af den valgte modelkonfiguration. Kører din NN i Machine Mode eller Regression Mode (ML-konventionen om at bruge et udtryk, der også bruges i statistik, men som tildeles en anden betydning, er meget forvirrende). Maskintilstand: returnerer en klasselabel (f.eks. "Premium Account"/"Basic Account"). Regressionstilstand: returnerer en værdi (f.eks. pris). Hvis NN er en regressor, har outputlaget en enkelt knude. Hvis NN'en er en klassifikator, har den også en enkelt knude, medmindre softmax er anvendt i hvilket tilfælde outputlaget har én knude pr. klasselabel i din model. De skjulte lag Med disse få regler fastsættes antallet af lag og størrelsen (neuroner/lag) for både input- og outputlagene. Det efterlader de skjulte lag. Hvor mange skjulte lag? Hvis dine data er lineært separerbare (hvilket du ofte ved, når du begynder at kode en NN), har du slet ikke brug for skjulte lag. Selvfølgelig har du heller ikke brug for en NN til at opløse dine data, men den vil stadig kunne klare opgaven. Derudover er der, som du sikkert ved, et bjerg af kommentarer om spørgsmålet om konfigurationen af skjulte lag i NN'er (se den vanvittigt grundige og indsigtsfulde NN FAQ for et fremragende resumé af disse kommentarer). Et spørgsmål inden for dette emne, som der er enighed om, er ydelsesforskellen ved at tilføje yderligere skjulte lag: de situationer, hvor ydelsen forbedres med et andet (eller tredje, osv.) skjult lag, er meget få. Et skjult lag er tilstrækkeligt til langt de fleste problemer. Hvad så med størrelsen af det eller de skjulte lag - hvor mange neuroner? Der findes nogle empiriske tommelfingerregler, hvoraf den mest almindeligt anvendte er 'den optimale størrelse af det skjulte lag ligger normalt mellem størrelsen af input- og outputlagene'. Jeff Heaton, forfatter til Introduction to Neural Networks in Java, tilbyder et par andre. Sammenfattende kan man for de fleste problemer sandsynligvis opnå en anstændig ydelse (selv uden et andet optimeringstrin) ved at indstille konfigurationen af det skjulte lag ved hjælp af blot to regler: (i) antallet af skjulte lag er lig med én, og (ii) antallet af neuroner i det lag er gennemsnittet af neuronerne i ind- og udgangsniveauet.

Optimering af netværkskonfigurationen Pruning beskriver et sæt teknikker til at reducere netværksstørrelsen (ved hjælp af knuder og ikke lag) for at forbedre beregningspræstationen og undertiden opløsningspræstationen. Det centrale i disse teknikker er at fjerne knuder fra netværket under træningen ved at identificere de knuder, som, hvis de fjernes fra netværket, ikke vil påvirke netværkets ydeevne (dvs. dataenes opløsning) mærkbart. (Selv uden at anvende en formel beskæringsteknik kan du få en grov idé om, hvilke knuder der ikke er vigtige, ved at se på din vægtmatrix efter træning; se på vægte meget tæt på nul - det er knuderne i begge ender af disse vægte, der ofte fjernes under beskæring). Hvis du bruger en beskæringsalgoritme under træningen, skal du naturligvis begynde med en netværkskonfiguration, der er mere tilbøjelig til at have overskydende (dvs. "beskærbare") knuder - med andre ord, når du beslutter dig for en netværksarkitektur, skal du vælge flere neuroner, hvis du tilføjer et beskæringsskridt. Sagt på en anden måde: ved at anvende en beskæringsalgoritme på dit netværk under træningen kan du nærme dig den optimale netværkskonfiguration; om du kan gøre det i en enkelt "up-front" (såsom en genetisk-algoritme-baseret algoritme) ved jeg ikke, men jeg ved dog, at denne optimering i to trin er mere almindelig for tiden.