Patroonherkenningssystemen in wereldinformatiebronnen. Herziening van bestaande methoden van patroonherkenning. Voorbeelden van problemen met patroonherkenning

Hoofdstuk 3: Patroonherkenning (identificatie) systemen

  • Het concept van een afbeelding. Het probleem van het leren van patroonherkenning. Geometrische en structurele benaderingen. compactheid hypothese. Onderwijs en zelfstudie. aanpassen en leren.
  • Methoden voor het leren van patroonherkenning - perceptrons, neurale netwerken, methode van potentiële functies, methode van groepsaccounting van argumenten, methode om vereenvoudigingen te beperken, teams van beslissingsregels.
  • Methoden en algoritmen voor het analyseren van de structuur van multidimensionale gegevens - clusteranalyse, hiërarchische groepering.

Het concept van een afbeelding

Afbeelding, klasse - een classificatiegroepering in het classificatiesysteem die een bepaalde groep objecten verenigt (selecteert) volgens een of ander attribuut.

De figuurlijke waarneming van de wereld is een van de mysterieuze eigenschappen van het levende brein, dat het mogelijk maakt de eindeloze stroom van waargenomen informatie te begrijpen en oriëntatie te behouden in de oceaan van ongelijksoortige gegevens over de buitenwereld. Bij het waarnemen van de buitenwereld classificeren we altijd de waargenomen sensaties, dat wil zeggen, we verdelen ze in groepen van vergelijkbare maar niet identieke verschijnselen. Ondanks het significante verschil omvat één groep bijvoorbeeld alle letters A, geschreven in verschillende handschriften, of alle geluiden die overeenkomen met dezelfde noot, genomen in een willekeurig octaaf en op een instrument, en de operator die het technische object bestuurt, voor een geheel verzameling toestanden object reageert met dezelfde reactie. Kenmerkend is dat om het concept van een groep percepties van een bepaalde klasse te vormen, het voldoende is om kennis te maken met een klein aantal van zijn vertegenwoordigers. Een kind kan maar één keer een letter te zien krijgen, zodat hij deze letter kan terugvinden in een tekst die in verschillende lettertypen is geschreven, of deze kan herkennen, zelfs als deze in een opzettelijk vervormde vorm is geschreven. Deze eigenschap van de hersenen stelt ons in staat om zo'n concept als een afbeelding te formuleren.

Beelden hebben een karakteristieke eigenschap, die zich manifesteert in het feit dat bekendheid met een eindig aantal verschijnselen uit dezelfde verzameling het mogelijk maakt een willekeurig groot aantal vertegenwoordigers ervan te herkennen. Voorbeelden van afbeeldingen kunnen zijn: rivier, zee, vloeistof, Tsjaikovski's muziek, Majakovski's gedichten, enz. Een bepaalde reeks toestanden van het controleobject kan ook als een afbeelding worden beschouwd, en deze hele reeks toestanden wordt gekenmerkt door het feit dat in om een ​​bepaald doel te bereiken, dezelfde impact op een object. Beelden hebben karakteristieke objectieve eigenschappen in die zin dat verschillende mensen die leren van verschillend waarnemingsmateriaal, voor het grootste deel dezelfde objecten op dezelfde manier en onafhankelijk van elkaar classificeren. Door deze objectiviteit van beelden kunnen mensen over de hele wereld elkaar begrijpen.

Het vermogen om de buitenwereld in de vorm van afbeeldingen waar te nemen, stelt iemand in staat om met een zekere zekerheid een oneindig aantal objecten te herkennen op basis van kennis van een eindig aantal ervan, en de objectieve aard van de belangrijkste eigenschap van afbeeldingen stelt iemand in staat om de proces van hun erkenning. Omdat het een weerspiegeling is van de objectieve werkelijkheid, is het concept van een beeld even objectief als de werkelijkheid zelf, en daarom kan dit concept op zichzelf het onderwerp zijn van een speciale studie.

In de literatuur die is gewijd aan het probleem van trainingspatroonherkenning (ORO), wordt vaak het concept van een klas geïntroduceerd in plaats van het concept van een afbeelding.

Het probleem van leerpatroonherkenning (ORO)

Een van de meest interessante eigenschappen van het menselijk brein is het vermogen om te reageren op een oneindig aantal omgevingsomstandigheden met een eindig aantal reacties. Misschien was het deze eigenschap die een persoon in staat stelde de hoogste vorm van bestaan ​​​​van levende materie te bereiken, uitgedrukt in het vermogen om te denken, d.w.z. actief de objectieve wereld te reflecteren in de vorm van beelden, concepten, oordelen, enz. Daarom is het probleem van ORO ontstond bij het bestuderen van de fysiologische eigenschappen van de hersenen.

Beschouw een voorbeeld van taken uit het ODP-gebied.


Rijst. een

Hier zijn 12 taken waarbij het nodig is om kenmerken te selecteren die kunnen worden gebruikt om de linker triade van afbeeldingen te onderscheiden van de rechter. De oplossing van deze problemen vereist de volledige modellering van het logisch denken.

In het algemeen bestaat het patroonherkenningsprobleem uit twee delen: leren en herkennen. Educatie wordt uitgevoerd door individuele objecten te tonen met een indicatie dat ze tot een of ander beeld behoren. Als resultaat van training moet het herkenningssysteem in staat zijn te reageren met dezelfde reacties op alle objecten van hetzelfde beeld en verschillende reacties op alle objecten van verschillende afbeeldingen. Het is erg belangrijk dat het leerproces alleen eindigt door een eindig aantal objecten weer te geven zonder enige andere prompts. Als leerobject kunnen er afbeeldingen of andere visuele beelden (letters) zijn of verschillende verschijnselen van de buitenwereld, bijvoorbeeld geluiden, de toestand van het lichaam tijdens een medische diagnose, de toestand van een technisch object in besturingssystemen, etc. Het is belangrijk dat alleen de objecten en hun behorende tot de afbeelding. Training wordt gevolgd door het proces van herkenning van nieuwe objecten, dat de acties van een reeds getraind systeem kenmerkt. De automatisering van deze procedures is het probleem van training in patroonherkenning. In het geval dat een persoon zelf raadt of uitvindt en vervolgens een classificatieregel oplegt aan de machine, is het herkenningsprobleem gedeeltelijk opgelost, aangezien het hoofd- en grootste deel van het probleem (training) door de persoon wordt overgenomen.

Het probleem van het trainen in patroonherkenning is zowel vanuit toegepast als vanuit fundamenteel oogpunt interessant. Vanuit een toegepast oogpunt is de oplossing van dit probleem in de eerste plaats belangrijk omdat het de mogelijkheid opent om veel processen te automatiseren die tot nu toe alleen werden geassocieerd met de activiteit van een levend brein. De fundamentele betekenis van het probleem hangt nauw samen met de vraag die steeds vaker opkomt in verband met de ontwikkeling van ideeën in de cybernetica: wat kan en wat kan een machine in wezen niet? In hoeverre kunnen de mogelijkheden van een machine dichter bij die van een levend brein worden gebracht? Kan een machine met name het vermogen ontwikkelen om van een persoon het vermogen over te nemen om bepaalde acties uit te voeren, afhankelijk van situaties die zich in de omgeving voordoen? Tot nu toe is het alleen duidelijk geworden dat als een persoon eerst zijn vermogen zelf kan realiseren en het vervolgens kan beschrijven, d.w.z. aangeven waarom hij acties uitvoert in reactie op elke toestand van de externe omgeving of hoe (volgens welke regel) hij individuele objecten in beelden, dan kan zo'n vaardigheid zonder fundamentele problemen op een machine worden overgedragen. Als een persoon een vaardigheid heeft, maar deze niet kan uitleggen, dan is er maar één manier om vaardigheid over te dragen naar een machine: leren door voorbeelden.

Het takenpakket dat met behulp van herkenningssystemen kan worden opgelost, is enorm breed. Dit omvat niet alleen de taken van het herkennen van visuele en auditieve beelden, maar ook de taken van het herkennen van complexe processen en verschijnselen die zich voordoen, bijvoorbeeld bij het kiezen van passende acties door het hoofd van een onderneming of het kiezen van het optimale beheer van technologische, economische, transport of militaire operaties. Bij elk van deze taken worden enkele verschijnselen, processen en toestanden van de buitenwereld geanalyseerd, hierna observatieobjecten genoemd. Alvorens met de analyse van een object te beginnen, is het noodzakelijk om er op de een of andere manier bepaalde, geordende informatie over te verkrijgen. Dergelijke informatie is een kenmerk van objecten, hun weergave op de verzameling waarnemingsorganen van het herkenningssysteem.

Maar elk waarnemingsobject kan anders handelen, afhankelijk van de waarnemingsvoorwaarden. Elke letter, zelfs op dezelfde manier geschreven, kan bijvoorbeeld in principe op enigerlei wijze worden verplaatst ten opzichte van de waarnemingsorganen. Bovendien kunnen objecten van hetzelfde beeld behoorlijk van elkaar verschillen en natuurlijk de waarnemingsorganen op verschillende manieren beïnvloeden.

Elke afbeelding van een object aan de waarnemende organen van het herkenningssysteem, ongeacht de positie ten opzichte van deze organen, wordt gewoonlijk een afbeelding van het object genoemd, en verzamelingen van dergelijke afbeeldingen, verenigd door enkele gemeenschappelijke eigenschappen, zijn afbeeldingen.

Bij het oplossen van besturingsproblemen door middel van beeldherkenningsmethoden wordt de term "status" gebruikt in plaats van de term "afbeelding". Een toestand is een bepaalde vorm van het weergeven van de gemeten huidige (of momentane) kenmerken van het waargenomen object. De set van toestanden bepaalt de situatie. Het begrip "situatie" is analoog aan het begrip "beeld". Maar deze analogie is niet volledig, aangezien niet elk beeld een situatie kan worden genoemd, hoewel elke situatie een beeld kan worden genoemd.

Een situatie wordt meestal een bepaalde reeks toestanden van een complex object genoemd, die elk worden gekenmerkt door dezelfde of vergelijkbare kenmerken van het object. Als bijvoorbeeld een bepaald besturingsobject wordt beschouwd als een object van observatie, combineert de situatie dergelijke toestanden van dit object waarin dezelfde besturingsacties moeten worden toegepast. Als het object van observatie een militair spel is, combineert de situatie alle staten van het spel die bijvoorbeeld een krachtige tankaanval vereisen met luchtsteun.

De keuze van de initiële beschrijving van objecten is een van de centrale taken van het ODP-probleem. Bij een succesvolle keuze van de initiële beschrijving (kenmerkruimte) kan de herkenningstaak triviaal blijken te zijn, en omgekeerd kan een tevergeefs gekozen initiële beschrijving leiden tot ofwel zeer moeilijke verdere verwerking van informatie, ofwel tot het ontbreken van een oplossing helemaal niet. Als bijvoorbeeld het probleem van het herkennen van objecten die in kleur verschillen wordt opgelost, en signalen ontvangen van gewichtssensoren als eerste beschrijving worden gekozen, dan kan het herkenningsprobleem in principe niet worden opgelost.

Geometrische en structurele benaderingen.

Elke keer dat we met onbekende problemen worden geconfronteerd, is er een natuurlijke wens om ze te presenteren in de vorm van een gemakkelijk te begrijpen model dat ons in staat zou stellen het probleem te begrijpen in termen die gemakkelijk door onze verbeelding kunnen worden gereproduceerd. En aangezien we in ruimte en tijd bestaan, is de meest begrijpelijke voor ons de ruimtelijk-temporele interpretatie van taken.

Elk beeld dat ontstaat als gevolg van het observeren van een object in het leer- of examenproces kan worden weergegeven als een vector, en dus als een punt in een bepaalde kenmerkruimte. Als wordt beweerd dat het bij het weergeven van afbeeldingen mogelijk is om ze ondubbelzinnig toe te schrijven aan een van twee (of meerdere) afbeeldingen, dan wordt daarmee beweerd dat er in een bepaalde ruimte twee (of meerdere) gebieden zijn die geen gemeenschappelijke punten hebben , en dat de afbeeldingen punten uit deze gebieden zijn. Elk van deze gebieden kan een naam krijgen, d.w.z. een naam geven die overeenkomt met de afbeelding.

Laten we nu het leerproces van patroonherkenning interpreteren in termen van een geometrisch beeld, waarbij we ons voorlopig beperken tot het herkennen van slechts twee patronen. Er wordt vooraf alleen aangenomen dat het nodig is om twee regio's in een bepaalde ruimte te scheiden en dat alleen punten uit deze regio's worden weergegeven. Deze gebieden zelf zijn niet vooraf bepaald, d.w.z. er is geen informatie over de locatie van hun grenzen of regels om te bepalen of een punt tot een bepaald gebied behoort.

Tijdens de training worden willekeurig geselecteerde punten uit deze gebieden gepresenteerd en wordt informatie gegeven over tot welk gebied de gepresenteerde punten behoren. Tijdens de training wordt er geen aanvullende informatie gegeven over deze gebieden, d.w.z. over de ligging van hun grenzen. Het doel van leren is ofwel om een ​​oppervlak te bouwen dat niet alleen de punten die in het leerproces worden getoond scheidt, maar ook alle andere punten die bij deze gebieden horen, of om oppervlakken te bouwen die deze gebieden begrenzen, zodat elk van hen alleen punten van hetzelfde beeld. Met andere woorden, het doel van leren is om zulke functies te construeren uit beeldvectoren die bijvoorbeeld positief zouden zijn op alle punten van een beeld en negatief op alle punten van een ander beeld. Omdat de regio's geen gemeenschappelijke punten hebben, is er altijd een hele reeks van dergelijke scheidingsfuncties, en als resultaat van leren, moet er een worden gebouwd.

Als de gepresenteerde afbeeldingen niet tot twee, maar tot een groter aantal afbeeldingen behoren, is het de taak om, volgens de punten die tijdens de training worden getoond, een oppervlak te bouwen dat alle gebieden die overeenkomen met deze afbeeldingen van elkaar scheidt. Dit probleem kan bijvoorbeeld worden opgelost door een functie te construeren die dezelfde waarde heeft over de punten van elk van de regio's, en de waarde van deze functie over punten uit verschillende regio's zou anders moeten zijn.



Rijst. 2 - Twee afbeeldingen.

Op het eerste gezicht lijkt het kennen van slechts een bepaald aantal punten van het gebied niet voldoende om het hele gebied te scheiden. Men kan inderdaad een ontelbaar aantal verschillende regio's specificeren die deze punten bevatten, en ongeacht hoe het oppervlak dat het gebied selecteert daaruit is opgebouwd, het is altijd mogelijk om een ​​ander gebied te specificeren dat het oppervlak doorsnijdt en tegelijkertijd de punten getoond. Het is echter bekend dat het probleem van het benaderen van een functie uit informatie erover in een beperkte reeks punten, die veel smaller is dan de gehele verzameling waarop de functie wordt gegeven, een algemeen wiskundig probleem is bij het benaderen van functies. Natuurlijk vereist de oplossing van dergelijke problemen de introductie van bepaalde beperkingen op de klasse van functies die worden overwogen, en de keuze van deze beperkingen hangt af van de aard van de informatie die de leraar aan het leerproces kan toevoegen. Een van die hints is het vermoeden over de compactheid van afbeeldingen. Het is intuïtief duidelijk dat de benadering van de scheidingsfunctie een gemakkelijkere taak zal zijn, naarmate de te scheiden gebieden compacter en meer uit elkaar liggen. Dus bijvoorbeeld in het geval getoond in Fig. 2a is de scheiding uiteraard eenvoudiger dan in het geval getoond in Fig. 2b. Inderdaad, in het geval getoond in Fig. 2a kunnen de regio's worden gescheiden door een vlak, en zelfs met grote fouten in de definitie van de scheidingsfunctie, zal het nog steeds doorgaan met het scheiden van de regio's. In het geval in afb. 2b wordt de scheiding uitgevoerd door een ingewikkeld oppervlak en zelfs kleine afwijkingen in de vorm leiden tot scheidingsfouten. Het was deze intuïtieve notie van relatief gemakkelijk te scheiden regio's die leidden tot het vermoeden van compactheid.

Naast de geometrische interpretatie van het probleem van het leren herkennen van patronen, is er nog een andere benadering, die structureel of taalkundig wordt genoemd. Laten we de taalkundige benadering uitleggen aan de hand van het voorbeeld van visuele beeldherkenning. Eerst wordt een reeks beginconcepten onderscheiden - typische fragmenten die in afbeeldingen worden gevonden, en kenmerken van de onderlinge rangschikking van fragmenten - "links", "onder", "binnen", enz. Deze beginconcepten vormen een woordenboek waarmee u kunt bouwen verschillende logische uitspraken, ook wel aannames genoemd. De taak is om een ​​keuze te maken uit een groot aantal uitspraken die met behulp van deze concepten kunnen worden geconstrueerd, de meest significante voor dit specifieke geval.

Verder, kijkend naar een eindig en, indien mogelijk, een klein aantal objecten van elk beeld, is het noodzakelijk om een ​​beschrijving van deze beelden te construeren. De geconstrueerde beschrijvingen moeten zo volledig zijn dat de vraag wordt opgelost bij welk beeld het gegeven object hoort. Bij het implementeren van de linguïstische benadering doen zich twee problemen voor: het probleem van het construeren van een aanvankelijk woordenboek, d.w.z. een reeks typische fragmenten, en het probleem van het construeren van beschrijvingsregels uit de elementen van een bepaald woordenboek.

Binnen het kader van linguïstische interpretatie wordt een analogie getrokken tussen de structuur van beelden en de syntaxis van een taal. Het verlangen naar deze analogie werd veroorzaakt door de mogelijkheid om het apparaat van de wiskundige taalkunde te gebruiken, d.w.z. de methoden zijn syntactisch van aard. Het gebruik van het apparaat van de wiskundige taalkunde om de structuur van afbeeldingen te beschrijven kan pas worden toegepast nadat de afbeeldingen in de samenstellende delen zijn gesegmenteerd, dat wil zeggen dat er woorden zijn ontwikkeld om typische fragmenten en methoden voor hun zoektocht te beschrijven. Na het voorbereidende werk, dat zorgt voor de selectie van woorden, ontstaan ​​eigenlijke taalkundige taken, bestaande uit taken van automatische grammaticale ontleding van beschrijvingen voor beeldherkenning. Tegelijkertijd ontstaat er een onafhankelijk onderzoeksgebied, dat niet alleen kennis van de basis van de wiskundige taalkunde vereist, maar ook de beheersing van technieken die specifiek zijn ontwikkeld voor linguïstische beeldverwerking.

compactheid hypothese

Als we aannemen dat in het leerproces de feature-ruimte wordt gevormd op basis van de geplande classificatie, dan mogen we hopen dat de specificatie van de feature-ruimte zelf een eigenschap bepaalt, onder invloed waarvan afbeeldingen in deze ruimte gemakkelijk van elkaar kunnen worden gescheiden. Het is deze hoop die, naarmate het werk op het gebied van patroonherkenning zich ontwikkelde, de opkomst van de compactheidshypothese stimuleerde, die stelt dat compacte verzamelingen in de kenmerkruimte overeenkomen met patronen. Met een compacte set bedoelen we voorlopig enkele "klompjes" punten in de beeldruimte, ervan uitgaande dat er zeldzaamheden zijn die ze tussen deze bosjes scheiden.

Het was echter niet altijd mogelijk om deze hypothese experimenteel te bevestigen, maar, belangrijker nog, de taken waarin de compactheidshypothese goed presteerde (Fig. 2a), vonden zonder uitzondering allemaal een eenvoudige oplossing. En omgekeerd werden die taken waarvoor de hypothese niet werd bevestigd (Fig. 2b) ofwel helemaal niet opgelost, ofwel met grote moeite opgelost met de inzet van extra trucs. Dit feit deed ons op zijn minst twijfelen aan de geldigheid van de compactheidshypothese, aangezien een enkel voorbeeld dat het ontkent voldoende is om elke hypothese te weerleggen. Tegelijkertijd hield de vervulling van de hypothese waar het mogelijk was om het probleem van training in patroonherkenning op te lossen, de interesse in deze hypothese goed vast. De compactheidshypothese zelf is een teken geworden van de mogelijkheid van een bevredigende oplossing van herkenningsproblemen.

De formulering van de compactheidshypothese brengt ons dicht bij het concept van een abstract beeld. Als de coördinaten van de ruimte willekeurig worden gekozen, worden de afbeeldingen erin willekeurig verdeeld. In sommige delen van de ruimte zullen ze dichter zijn dan in andere. Laten we een willekeurig gekozen ruimte een abstract beeld noemen. In deze abstracte ruimte zullen er vrijwel zeker compacte puntenverzamelingen zijn. Daarom kan, in overeenstemming met de hypothese van compactheid, de verzameling objecten die overeenkomt met compacte verzamelingen punten in een abstracte ruimte redelijkerwijs abstracte afbeeldingen van een bepaalde ruimte worden genoemd.

Onderwijs en zelfstudie. Aanpassing en leren

Alle afbeeldingen getoond in Fig. 1 karakteriseren de leertaak. In elk van deze problemen worden verschillende voorbeelden (trainingsvolgorde) van correct opgeloste problemen gegeven. Als het mogelijk zou zijn om een ​​bepaalde universele eigenschap op te merken die niet afhangt van de aard van de afbeeldingen of van hun afbeeldingen, maar alleen hun vermogen tot scheidbaarheid bepaalt, dan samen met de gebruikelijke taak om te leren herkennen, met behulp van informatie over de bijbehorende van elk object van de trainingsreeks naar een of ander beeld zou men een ander classificatieprobleem kunnen opleveren - het zogenaamde probleem van leren zonder leraar. Een dergelijke taak op beschrijvend niveau kan als volgt worden geformuleerd: objecten worden gelijktijdig of opeenvolgend aan het systeem aangeboden zonder enige indicatie dat ze tot beelden behoren. Het invoerapparaat van het systeem brengt een set objecten in kaart op een set afbeeldingen en maakt, met behulp van een vooraf ingebedde eigenschap van beeldscheidbaarheid, een onafhankelijke classificatie van deze objecten. Na een dergelijk zelflerend proces moet het systeem niet alleen reeds bekende objecten (objecten uit de trainingsreeks) kunnen herkennen, maar ook objecten die nog niet eerder zijn gepresenteerd. Het proces van zelfleren van een bepaald systeem is zo'n proces, waardoor dit systeem, zonder hulp van een leraar, het vermogen verwerft om dezelfde reacties te ontwikkelen op afbeeldingen van objecten van hetzelfde beeld en verschillende reacties op afbeeldingen van verschillende afbeeldingen. De rol van de leraar bestaat in dit geval alleen uit het aansporen van het systeem van een of andere objectieve eigenschap die voor alle afbeeldingen hetzelfde is en die de mogelijkheid bepaalt om een ​​reeks objecten in afbeeldingen te verdelen.

Het blijkt dat zo'n objectieve eigenschap de eigenschap is van compactheid van beelden. De onderlinge rangschikking van punten in de geselecteerde ruimte bevat al informatie over hoe de puntenverzameling moet worden verdeeld. Deze informatie bepaalt de eigenschap van patroonscheidbaarheid, hetgeen voldoende is voor het zelfleren van het patroonherkenningssysteem.

De meeste van de bekende zelflerende algoritmen zijn in staat om alleen abstracte afbeeldingen te extraheren, d.w.z. compacte sets in bepaalde ruimtes. Het verschil tussen beide lijkt te liggen in de formalisering van het begrip compactheid. Dit vermindert echter niet, en verhoogt soms zelfs de waarde van zelflerende algoritmen, aangezien de afbeeldingen zelf vaak door niemand vooraf worden bepaald en het de taak is om te bepalen welke subsets van afbeeldingen in een bepaalde ruimte afbeeldingen zijn. Een goed voorbeeld van zo'n taakstelling is sociologisch onderzoek, waarbij groepen mensen worden onderscheiden door een set van vragen. In dit begrip van het probleem genereren zelflerende algoritmen voorheen onbekende informatie over het bestaan ​​in een bepaalde ruimte van afbeeldingen waar niemand eerder enig idee van had.

Daarnaast kenmerkt het resultaat van zelfleren de geschiktheid van de gekozen ruimte voor een specifieke herkenningsleertaak. Als de tijdens het zelfleren geïdentificeerde abstracte beelden samenvallen met de echte, dan is de ruimte goed gekozen. Hoe meer abstracte afbeeldingen verschillen van echte, hoe "onhandiger" de gekozen ruimte is voor een specifieke taak.

Leren wordt gewoonlijk het proces genoemd waarbij in een bepaald systeem een ​​bepaalde reactie wordt ontwikkeld op groepen van externe identieke signalen door herhaaldelijk het externe correctiesysteem te beïnvloeden. Een dergelijke externe aanpassing in training wordt gewoonlijk "aanmoediging" en "straf" genoemd. Het mechanisme voor het genereren van deze aanpassing bepaalt bijna volledig het leeralgoritme. Zelflerend verschilt van leren doordat hier geen aanvullende informatie over de juistheid van de reactie op het systeem wordt vermeld.

Aanpassing is het proces van het veranderen van de parameters en structuur van het systeem, en mogelijk controleacties op basis van actuele informatie om een ​​bepaalde toestand van het systeem te bereiken met aanvankelijke onzekerheid en veranderende bedrijfsomstandigheden.

Leren is een proces waardoor het systeem geleidelijk het vermogen verwerft om te reageren met de nodige reacties op bepaalde sets van externe invloeden, en aanpassing is de aanpassing van de parameters en structuur van het systeem om de vereiste kwaliteit van controle in omstandigheden van continue veranderingen in externe omstandigheden.

En tekenen. Dergelijke taken worden vrij vaak opgelost, bijvoorbeeld bij het oversteken of rijden van een straat bij verkeerslichten. Door de kleur van een brandend verkeerslicht te herkennen en de verkeersregels te kennen, kunt u op dit moment de juiste beslissing nemen om wel of niet de straat over te steken.

In het proces van biologische evolutie hebben veel dieren problemen opgelost met behulp van visuele en auditieve apparaten. patroonherkenning goed genoeg. Creatie van kunstmatige systemen patroonherkenning blijft een moeilijk theoretisch en technisch probleem. De behoefte aan een dergelijke erkenning ontstaat op verschillende gebieden - van militaire zaken en beveiligingssystemen tot de digitalisering van allerlei analoge signalen.

Traditioneel vallen beeldherkenningstaken onder de taken van kunstmatige intelligentie.

Aanwijzingen in patroonherkenning

Er zijn twee hoofdrichtingen:

  • De studie van de herkenningsvermogens van levende wezens, hun verklaring en modellering;
  • Ontwikkeling van de theorie en methoden voor het construeren van apparaten die zijn ontworpen om individuele problemen in toegepaste problemen op te lossen.

Formele verklaring van het probleem

Patroonherkenning is de toewijzing van initiële gegevens aan een bepaalde klasse door essentiële kenmerken die deze gegevens kenmerken te benadrukken uit de totale hoeveelheid niet-essentiële gegevens.

Bij het stellen van herkenningsproblemen proberen ze de wiskundige taal te gebruiken en proberen, in tegenstelling tot de theorie van kunstmatige neurale netwerken, waarbij de basis is om een ​​resultaat te verkrijgen door middel van experiment, het experiment te vervangen door logisch redeneren en wiskundige bewijzen.

Meestal worden monochrome afbeeldingen overwogen bij patroonherkenningsproblemen, wat het mogelijk maakt om een ​​afbeelding als een functie op een vlak te beschouwen. Als we een punt op een vlak beschouwen T, waar de functie x(x,ja) drukt op elk punt van het beeld zijn karakteristiek uit - helderheid, transparantie, optische dichtheid, dan is zo'n functie een formele registratie van het beeld.

De verzameling van alle mogelijke functies x(x,ja) aan de oppervlakte T- er is een model van de set van alle afbeeldingen X. Introductie van het concept overeenkomsten tussen de afbeeldingen kunt u de taak van herkenning instellen. De specifieke vorm van zo'n setting hangt sterk af van de volgende stadia in herkenning volgens een of andere benadering.

Methoden voor patroonherkenning

Voor optische beeldherkenning kunt u de methode van iteratie toepassen over het type van een object onder verschillende hoeken, schalen, offsets, enz. Voor letters moet u itereren over het lettertype, lettertype-eigenschappen, enz.

De tweede benadering is om de contour van het object te vinden en de eigenschappen ervan te onderzoeken (connectiviteit, aanwezigheid van hoeken, enz.)

Een andere benadering is het gebruik van kunstmatige neurale netwerken. Deze methode vereist ofwel een groot aantal voorbeelden van de herkenningstaak (met correcte antwoorden), ofwel een speciale neurale netwerkstructuur die rekening houdt met de specifieke kenmerken van deze taak.

Perceptron als methode voor patroonherkenning

F. Rosenblatt, die het concept van een model van de hersenen introduceert, wiens taak het is om te laten zien hoe psychologische verschijnselen kunnen ontstaan ​​in een fysiek systeem waarvan de structuur en functionele eigenschappen bekend zijn - beschreef de eenvoudigste discriminatie experimenten. Deze experimenten zijn volledig gerelateerd aan patroonherkenningsmethoden, maar verschillen doordat het oplossingsalgoritme niet deterministisch is.

Het eenvoudigste experiment, op basis waarvan het mogelijk is om psychologisch significante informatie over een bepaald systeem te verkrijgen, komt erop neer dat het model twee verschillende stimuli krijgt aangeboden en er op verschillende manieren op moet reageren. Het doel van een dergelijk experiment kan zijn om de mogelijkheid te bestuderen van hun spontane discriminatie door het systeem zonder tussenkomst van de experimentator, of, omgekeerd, om gedwongen discriminatie te bestuderen, waarbij de experimentator het systeem probeert te leren de vereiste classificatie.

In een leerexperiment krijgt de perceptron meestal een bepaalde reeks afbeeldingen te zien, met daarin vertegenwoordigers van elk van de te onderscheiden klassen. Volgens een of andere geheugenmodificatieregel wordt de juiste reactiekeuze versterkt. Vervolgens wordt de controlestimulus aangeboden aan de perceptron en wordt de waarschijnlijkheid bepaald dat de juiste respons voor stimuli van deze klasse wordt verkregen. Afhankelijk van of de geselecteerde controlestimulus al dan niet overeenkomt met een van de afbeeldingen die in de trainingsreeks zijn gebruikt, worden verschillende resultaten verkregen:

  • 1. Als de controlestimulus niet samenvalt met een van de leerstimuli, wordt het experiment niet alleen geassocieerd met: pure discriminatie, maar bevat ook elementen generalisaties.
  • 2. Als de controlestimulus een bepaalde reeks sensorische elementen opwekt die totaal verschillen van de elementen die werden geactiveerd onder invloed van eerder gepresenteerde stimuli van dezelfde klasse, dan is het experiment een onderzoek pure generalisatie .

Perceptrons hebben niet het vermogen tot pure generalisatie, maar ze functioneren behoorlijk bevredigend in discriminatie-experimenten, vooral als de controlestimulus nauw genoeg overeenkomt met een van de patronen waarmee de perceptron al enige ervaring heeft opgedaan.

Voorbeelden van problemen met patroonherkenning

  • Letterherkenning.
  • Barcode herkenning.
  • Kentekenherkenning.
  • Gezichtsherkenning.
  • Spraakherkenning.
  • Beeldherkenning.
  • Erkenning van lokale delen van de aardkorst waarin zich minerale afzettingen bevinden.

Patroonherkenningsprogramma's

zie ook

Opmerkingen:

Links

  • Joeri Lifshits. Cursus "Moderne problemen van theoretische informatica" - hoorcolleges over statistische methoden van patroonherkenning, gezichtsherkenning, tekstclassificatie
  • Journal of Pattern Recognition Research (Journal of Pattern Recognition Research)

Literatuur

  • David A. Forsyth, Jean Pons Computer visie. Moderne aanpak = computervisie: een moderne aanpak. - M.: "Williams", 2004. - S. 928. - ISBN 0-13-085198-1
  • George Stockman, Linda Shapiro Computervisie = Computervisie. - M.: Binom. Kennislaboratorium, 2006. - S. 752. - ISBN 5947743841
  • AL Gorelik, VA Skripkin, Erkenningsmethoden, M.: Hogere school, 1989.
  • Sh.-K. Cheng, Ontwerpprincipes van visuele informatiesystemen, M.: Mir, 1994.

Wikimedia Stichting. 2010 .

In de technologie een wetenschappelijke en technische richting die verband houdt met de ontwikkeling van methoden en de constructie van systemen (ook op basis van een computer) om vast te stellen of een object (onderwerp, proces, fenomeen, situatie, signaal) behoort tot een van de voor ... ... Groot encyclopedisch woordenboek

Een van de nieuwe regio's cybernetica. De inhoud van de theorie van R. over. is de extrapolatie van de eigenschappen van objecten (afbeeldingen) die tot verschillende klassen behoren naar objecten die er in zekere zin dicht bij staan. Meestal, bij het aanleren van een automaat R. over. er is ... ... Geologische Encyclopedie

Engels herkenning, beeld; Duits Gestalt alterkennung. Een tak van wiskundige cybernetica die principes en methoden ontwikkelt voor het classificeren en identificeren van objecten die worden beschreven door een eindige reeks kenmerken die ze kenmerken. Antinazi. Encyclopedie ... ... Encyclopedie van de sociologie

Patroonherkenning- methode om complexe objecten te bestuderen met behulp van een computer; bestaat uit de selectie van functies en de ontwikkeling van algoritmen en programma's waarmee computers objecten automatisch kunnen classificeren op basis van deze functies. Bijvoorbeeld om te bepalen welke ...... Economisch en wiskundig woordenboek

- (technisch), een wetenschappelijke en technische richting in verband met de ontwikkeling van methoden en de constructie van systemen (inclusief computergebaseerde systemen) om vast te stellen of een object (onderwerp, proces, fenomeen, situatie, signaal) behoort tot een van de voor ... ... encyclopedisch woordenboek

PATROONHERKENNING- een sectie van wiskundige cybernetica die methoden ontwikkelt voor het classificeren en identificeren van objecten, verschijnselen, processen, signalen, situaties van al die objecten die kunnen worden beschreven door een eindige reeks van bepaalde kenmerken of eigenschappen, ... ... Russische sociologische encyclopedie

patroonherkenning- 160 patroonherkenning: identificatie van vormrepresentaties en configuraties met behulp van automatische middelen

Het beeld wordt opgevat als een gestructureerde beschrijving van het object of fenomeen dat wordt bestudeerd, weergegeven door een kenmerkvector, waarvan elk element de numerieke waarde vertegenwoordigt van een van de kenmerken die het overeenkomstige object kenmerken.

De algemene structuur van het herkenningssysteem is als volgt:

De betekenis van het herkenningsprobleem is om vast te stellen of de bestudeerde objecten een vaste eindige verzameling kenmerken hebben waarmee ze aan een bepaalde klasse kunnen worden toegewezen. Herkenningstaken hebben de volgende kenmerken:

1. Dit zijn voorlichtingstaken die uit twee fasen bestaan:

a. De brongegevens in een vorm brengen die geschikt is voor herkenning.

b. Erkenning zelf is een indicatie van het behoren van een object tot een bepaalde klasse.

2. In deze problemen kan men het concept van analogie of gelijkenis van objecten introduceren en het concept van nabijheid van objecten formuleren als basis voor het toewijzen van objecten aan dezelfde klasse of verschillende klassen.

3. Bij deze taken is het mogelijk om te werken met een reeks precedenten - voorbeelden waarvan de classificatie bekend is en die, in de vorm van geformaliseerde beschrijvingen, kunnen worden gepresenteerd aan het herkenningsalgoritme voor aanpassing aan de taak in het leerproces Verwerken.

4. Voor deze problemen is het moeilijk om formele theorieën op te bouwen en klassieke wiskundige methoden toe te passen: vaak is de informatie voor een nauwkeurig wiskundig model of de winst van het gebruik van het model en wiskundige methoden onvergelijkbaar met de kosten.

5. Bij deze taken is "slechte informatie" mogelijk - informatie met hiaten, heterogeen, indirect, vaag, dubbelzinnig, probabilistisch.

Het is raadzaam om de volgende soorten herkenningstaken te onderscheiden:

1. De taak van herkenning, dat wil zeggen, de toewijzing van het gepresenteerde object volgens zijn beschrijving aan een van de gegeven klassen (training met een leraar).

2. De taak van automatische classificatie is de verdeling van een verzameling objecten (situaties) volgens hun beschrijvingen in een systeem van niet-overlappende klassen (taxonomie, clusteranalyse, niet-gesuperviseerd leren).

3. Het probleem van het kiezen van een informatieve reeks kenmerken in herkenning.

4. Het probleem van het reduceren van de initiële gegevens tot een vorm die geschikt is voor herkenning.

5. Dynamische herkenning en dynamische classificatie - taak 1 en 2 voor dynamische objecten.

6. De taak van het voorspellen - taak 5, waarbij de oplossing moet verwijzen naar een bepaald moment in de toekomst.

Het concept van een afbeelding.

Een afbeelding, een klasse is een classificatiegroepering in het systeem die een bepaalde groep objecten verenigt (selecteert) volgens een of ander attribuut. Beelden hebben een aantal karakteristieke eigenschappen, die zich uiten in het feit dat kennis met een eindig aantal verschijnselen uit dezelfde verzameling het mogelijk maakt om een ​​willekeurig groot aantal vertegenwoordigers ervan te herkennen.


Als afbeelding kan men ook een bepaalde reeks toestanden van het controleobject beschouwen, en deze hele reeks toestanden wordt gekenmerkt door het feit dat om een ​​bepaald doel te bereiken, dezelfde impact op het object vereist is. Beelden hebben karakteristieke objectieve eigenschappen in die zin dat verschillende mensen die leren van verschillend waarnemingsmateriaal, voor het grootste deel dezelfde objecten op dezelfde manier en onafhankelijk van elkaar classificeren.

In het algemeen bestaat het probleem van patroonherkenning uit twee delen: training en herkenning.

Educatie wordt uitgevoerd door individuele objecten te tonen met een indicatie dat ze tot een of ander beeld behoren. Als resultaat van training moet het herkenningssysteem in staat zijn te reageren met dezelfde reacties op alle objecten van hetzelfde beeld en verschillende reacties op alle objecten van verschillende afbeeldingen.

Het is erg belangrijk dat het leerproces alleen eindigt door een eindig aantal objecten weer te geven zonder enige andere prompts. De objecten van leren kunnen visuele beelden zijn, of verschillende fenomenen van de buitenwereld en andere.

Training wordt gevolgd door het proces van herkenning van nieuwe objecten, wat de werking van een reeds getraind systeem kenmerkt. De automatisering van deze procedures is het probleem van training in patroonherkenning. In het geval dat een persoon zelf de classificatieregels oplost of uitvindt en vervolgens de computer oplegt, is het herkenningsprobleem gedeeltelijk opgelost, aangezien het hoofd- en grootste deel van het probleem (training) door de persoon wordt overgenomen.

Het probleem van het trainen in patroonherkenning is zowel vanuit toegepast als vanuit fundamenteel oogpunt interessant. Vanuit een toegepast oogpunt is de oplossing van dit probleem in de eerste plaats belangrijk omdat het de mogelijkheid opent om veel processen te automatiseren die tot nu toe alleen werden geassocieerd met de activiteit van een levend brein. De fundamentele betekenis van het probleem hangt samen met de vraag wat een computer in principe wel en niet kan.

Bij het oplossen van problemen met het beheer van patroonherkenningsmethoden wordt de term "status" gebruikt in plaats van de term "afbeelding". Staat - bepaalde vormen van weergave van de gemeten huidige (momentane) kenmerken van het waargenomen object, de reeks toestanden bepaalt de situatie.

Een situatie wordt meestal een bepaalde reeks toestanden van een complex object genoemd, die elk worden gekenmerkt door dezelfde of vergelijkbare kenmerken van het object. Als bijvoorbeeld een bepaald besturingsobject wordt beschouwd als een object van observatie, combineert de situatie dergelijke toestanden van dit object waarin dezelfde besturingsacties moeten worden toegepast. Als het object van observatie een spel is, dan verenigt de situatie alle toestanden van het spel.

De keuze van de initiële beschrijving van objecten is een van de centrale taken van het probleem van het leren van patroonherkenning. Met een succesvolle keuze van de initiële beschrijving (functieruimte) kan de herkenningstaak triviaal blijken te zijn. Omgekeerd kan een tevergeefs gekozen initiële beschrijving ofwel leiden tot een zeer moeizame verdere verwerking van informatie, ofwel tot helemaal geen oplossing.

Geometrische en structurele benaderingen.

Elk beeld dat ontstaat als gevolg van het observeren van een object in het leer- of examenproces kan worden weergegeven als een vector, en dus als een punt in een bepaalde kenmerkruimte.

Als wordt beweerd dat het bij het weergeven van afbeeldingen mogelijk is om ze ondubbelzinnig toe te schrijven aan een van twee (of meerdere) afbeeldingen, dan wordt daarmee beweerd dat er in een bepaalde ruimte twee of meer regio's zijn die geen gemeenschappelijke punten hebben, en dat de afbeelding van een punt komt uit deze regio's. Elk punt van een dergelijk gebied kan een naam krijgen, dat wil zeggen een naam geven die overeenkomt met de afbeelding.

Laten we het leerproces van patroonherkenning interpreteren in termen van een geometrisch beeld, waarbij we ons voorlopig beperken tot het herkennen van slechts twee patronen. Het enige dat van tevoren bekend is, is dat het nodig is om twee regio's in een ruimte te scheiden en dat alleen punten uit deze regio's worden weergegeven. Deze gebieden zelf zijn niet vooraf bepaald, dat wil zeggen, er is geen informatie over de locatie van hun grenzen of regels om te bepalen of een punt tot een bepaald gebied behoort.

Tijdens de training worden willekeurig geselecteerde punten uit deze gebieden gepresenteerd en wordt informatie gegeven over tot welk gebied de gepresenteerde punten behoren. Er wordt geen aanvullende informatie over deze gebieden, dat wil zeggen de locatie van hun grenzen tijdens de training, gerapporteerd.

Het doel van leren is ofwel om een ​​oppervlak te bouwen dat niet alleen de punten die in het leerproces worden getoond scheidt, maar ook alle andere punten die bij deze gebieden horen, of om oppervlakken te bouwen die deze gebieden begrenzen, zodat elk van hen alleen punten van hetzelfde beeld. Met andere woorden, het doel van leren is om zulke functies te construeren uit beeldvectoren die bijvoorbeeld positief zouden zijn op alle punten van een beeld en negatief op alle punten van een ander beeld.

Omdat de regio's geen gemeenschappelijke punten hebben, is er altijd een hele reeks van dergelijke scheidingsfuncties, en als resultaat van leren, moet er een worden gebouwd. Als de gepresenteerde afbeeldingen niet tot twee, maar tot een groter aantal afbeeldingen behoren, is het de taak om, volgens de punten die tijdens de training worden getoond, een oppervlak te bouwen dat alle gebieden die overeenkomen met deze afbeeldingen van elkaar scheidt.

Dit probleem kan bijvoorbeeld worden opgelost door een functie te construeren die dezelfde waarde heeft over de punten van elk van de regio's, en de waarde van deze functie over punten uit verschillende regio's zou anders moeten zijn.

Het lijkt misschien dat het kennen van slechts een bepaald aantal punten uit het gebied niet voldoende is om het hele gebied te scheiden. Men kan inderdaad een ontelbaar aantal verschillende regio's specificeren die deze punten bevatten, en ongeacht hoe het oppervlak dat het gebied selecteert daaruit is opgebouwd, het is altijd mogelijk om een ​​ander gebied te specificeren dat het oppervlak doorsnijdt en tegelijkertijd de punten getoond.

Het is echter bekend dat het probleem van het benaderen van een functie uit informatie erover in een beperkte verzameling punten veel kleiner is dan de gehele verzameling waarop de functie wordt gegeven, en een veelvoorkomend wiskundig probleem is bij het benaderen van functies. Natuurlijk vereist de oplossing van dergelijke problemen de introductie van bepaalde beperkingen op de klasse van functies die worden overwogen, en de keuze van deze beperkingen hangt af van de aard van de informatie die de leraar aan het leerproces kan toevoegen.

Een van die hints is het vermoeden over de compactheid van afbeeldingen.

Naast de geometrische interpretatie van het probleem van het leren herkennen van patronen, is er nog een andere benadering, die structureel of taalkundig wordt genoemd. Laten we eens kijken naar de taalkundige benadering van het voorbeeld van visuele beeldherkenning.

Eerst wordt een reeks initiële concepten onderscheiden - typische fragmenten die in de afbeelding worden gevonden en kenmerken van de relatieve positie van de fragmenten (links, onder, binnen, enz.). Deze initiële concepten vormen een vocabulaire waarmee u verschillende logische uitspraken kunt maken, ook wel zinnen genoemd.

De taak is om een ​​keuze te maken uit een groot aantal uitspraken die met behulp van deze concepten kunnen worden geconstrueerd, de meest significante voor dit specifieke geval. Verder, kijkend naar een eindig en, indien mogelijk, een klein aantal objecten van elk beeld, is het noodzakelijk om een ​​beschrijving van deze beelden te construeren.

De geconstrueerde beschrijvingen moeten zo volledig zijn dat de vraag wordt opgelost bij welk beeld het gegeven object hoort. Bij het implementeren van de linguïstische benadering doen zich twee taken voor: de taak om een ​​aanvankelijk woordenboek te construeren, dat wil zeggen een reeks typische fragmenten, en de taak om beschrijvingsregels te construeren uit de elementen van een bepaald woordenboek.

Binnen het kader van linguïstische interpretatie wordt een analogie getrokken tussen de structuur van beelden en de syntaxis van een taal. Het verlangen naar deze analogie werd veroorzaakt door de mogelijkheid om het apparaat van de wiskundige taalkunde te gebruiken, dat wil zeggen dat de methoden syntactisch van aard zijn. Het gebruik van het apparaat van de wiskundige taalkunde om de structuur van afbeeldingen te beschrijven, kan alleen worden toegepast nadat de segmentering van afbeeldingen in samenstellende delen is gemaakt, dat wil zeggen dat er woorden zijn ontwikkeld om typische fragmenten en methoden voor hun zoektocht te beschrijven.

Na het voorbereidende werk, dat zorgt voor de selectie van woorden, ontstaan ​​eigenlijke taalkundige taken, bestaande uit taken van automatische grammaticale ontleding van beschrijvingen voor beeldherkenning.

compactheid hypothese.

Als we aannemen dat in het leerproces de feature-ruimte wordt gevormd op basis van de geplande classificatie, dan mogen we hopen dat de specificatie van de feature-ruimte zelf een eigenschap bepaalt, onder invloed waarvan afbeeldingen in deze ruimte gemakkelijk van elkaar kunnen worden gescheiden. Het is deze hoop die, naarmate het werk op het gebied van patroonherkenning zich ontwikkelde, de opkomst van de compactheidshypothese stimuleerde, die stelt dat compacte verzamelingen in de kenmerkruimte overeenkomen met patronen.

Onder een compacte verzameling verstaan ​​we bepaalde groepen punten in de beeldruimte, ervan uitgaande dat er zeldzaamheden zijn die ze scheiden tussen deze groepen. Deze hypothese is echter niet altijd experimenteel bevestigd. Maar die problemen waarin de compactheidshypothese goed werd vervuld, vonden altijd een eenvoudige oplossing, en omgekeerd, die problemen waarvoor de hypothese niet werd bevestigd, werden ofwel helemaal niet opgelost, of werden met veel moeite en aanvullende informatie opgelost.

De compactheidshypothese zelf is een teken geworden van de mogelijkheid om herkenningsproblemen naar tevredenheid op te lossen.

De formulering van de compactheidshypothese brengt ons dicht bij het concept van een abstract beeld. Als de coördinaten van de ruimte willekeurig worden gekozen, worden de afbeeldingen erin willekeurig verdeeld. In sommige delen van de ruimte zullen ze dichter zijn dan in andere.

Laten we een willekeurig gekozen ruimte een abstract beeld noemen. In deze abstracte ruimte zullen er vrijwel zeker compacte puntenverzamelingen zijn. Daarom wordt, in overeenstemming met de compactheidshypothese, de verzameling objecten waarmee compacte verzamelingen punten overeenkomen in een abstracte ruimte gewoonlijk abstracte beelden van een bepaalde ruimte genoemd.

Training en zelftraining, aanpassing en training.

Als het mogelijk zou zijn om een ​​bepaalde universele eigenschap op te merken die niet afhangt van de aard van de afbeeldingen of van hun afbeeldingen, maar alleen het vermogen tot scheidbaarheid bepaalt, dan zou samen met de gebruikelijke taak om herkenning te leren met behulp van informatie over het behoren van elk object van de trainingsvolgorde naar het ene of het andere beeld, kan men beter een ander classificatieprobleem stellen - het zogenaamde probleem van leren zonder leraar.

Een dergelijke taak op beschrijvend niveau kan als volgt worden geformuleerd: objecten worden gelijktijdig of opeenvolgend aan het systeem aangeboden zonder enige indicatie dat ze tot beelden behoren. Het invoerapparaat van het systeem brengt een set objecten in kaart op een set afbeeldingen en maakt, met behulp van een vooraf ingebedde eigenschap van beeldscheidbaarheid, een onafhankelijke classificatie van deze objecten.

Na een dergelijk zelflerend proces moet het systeem niet alleen reeds bekende objecten (objecten uit de trainingsreeks) kunnen herkennen, maar ook objecten die nog niet eerder zijn gepresenteerd. Het proces van zelfleren van een bepaald systeem is zo'n proces, waardoor dit systeem, zonder hulp van een leraar, het vermogen verwerft om dezelfde reacties te ontwikkelen op afbeeldingen van objecten van hetzelfde beeld en verschillende reacties op afbeeldingen van verschillende afbeeldingen.

De rol van de leraar bestaat in dit geval alleen uit het aansporen van het systeem van een of andere objectieve eigenschap die voor alle afbeeldingen hetzelfde is en die de mogelijkheid bepaalt om een ​​reeks objecten in afbeeldingen te verdelen.

Het blijkt dat zo'n objectieve eigenschap de eigenschap is van compactheid van beelden. De onderlinge rangschikking van punten in de geselecteerde ruimte bevat al informatie over hoe de puntenverzameling moet worden verdeeld. Deze informatie bepaalt de eigenschap van patroonscheidbaarheid, hetgeen voldoende is voor het zelfleren van het patroonherkenningssysteem.

De meeste van de bekende zelflerende algoritmen kunnen alleen abstracte afbeeldingen selecteren, dat wil zeggen compacte sets in bepaalde ruimtes. Het verschil tussen beide ligt in de formalisering van het begrip compactheid. Dit vermindert echter niet, en verhoogt soms zelfs de waarde van zelflerende algoritmen, aangezien de afbeeldingen zelf vaak door niemand vooraf worden bepaald en het de taak is om te bepalen welke subsets van afbeeldingen in een bepaalde ruimte afbeeldingen zijn.

Een voorbeeld van een dergelijke probleemstelling is sociologisch onderzoek, waarbij groepen mensen worden onderscheiden aan de hand van een reeks vragen. In dit begrip van het probleem genereren zelflerende algoritmen voorheen onbekende informatie over het bestaan ​​in een bepaalde ruimte van afbeeldingen waar niemand eerder enig idee van had.

Daarnaast kenmerkt het resultaat van zelfleren de geschiktheid van de gekozen ruimte voor een specifieke herkenningsleertaak. Als de abstracte afbeeldingen die zijn toegewezen in de ruimte van zelflerend samenvallen met de echte, dan is de ruimte met succes gekozen. Hoe meer abstracte afbeeldingen verschillen van echte, hoe onhandiger de gekozen ruimte voor een specifieke taak.

Leren wordt gewoonlijk het proces genoemd waarbij in een bepaald systeem een ​​bepaalde reactie wordt ontwikkeld op groepen van externe identieke signalen door herhaaldelijk het externe correctiesysteem te beïnvloeden. Het mechanisme voor het genereren van deze aanpassing bepaalt bijna volledig het leeralgoritme.

Zelflerend verschilt van leren doordat hier geen aanvullende informatie over de juistheid van de reactie op het systeem wordt vermeld.

Aanpassing is het proces van het veranderen van de parameters en structuur van het systeem, en mogelijk controleacties, op basis van actuele informatie om een ​​bepaalde toestand van het systeem te bereiken met aanvankelijke onzekerheid en veranderende bedrijfsomstandigheden.

Leren is een proces waardoor het systeem geleidelijk het vermogen verwerft om te reageren met de nodige reacties op bepaalde sets van externe invloeden, en aanpassing is de aanpassing van de parameters en structuur van het systeem om de vereiste kwaliteit van controle onder omstandigheden van continue veranderingen in externe omstandigheden.


Spraakherkenningssystemen.

Spraak fungeert als het belangrijkste communicatiemiddel tussen mensen en daarom wordt spraakcommunicatie beschouwd als een van de belangrijkste componenten van het kunstmatige intelligentiesysteem. Spraakherkenning is het proces waarbij een akoestisch signaal dat aan de uitgang van een microfoon of telefoon wordt gegenereerd, wordt omgezet in een reeks woorden.

Een moeilijkere taak is de taak om spraak te verstaan, die wordt geassocieerd met de identificatie van de betekenis van het akoestische signaal. In dit geval dient de uitvoer van het subsysteem voor spraakherkenning als invoer voor het subsysteem voor het begrijpen van uitingen. Automatische spraakherkenning (APP-systemen) is een van de gebieden van natuurlijke taalverwerkingstechnologieën.

Automatische spraakherkenning wordt gebruikt bij het automatiseren van de invoer van teksten in computers, bij het vormen van mondelinge vragen aan databases of systemen voor het ophalen van informatie, bij het vormen van mondelinge opdrachten aan verschillende intelligente apparaten.

Basisconcepten van spraakherkenningssystemen.

Spraakherkenningssystemen worden gekenmerkt door vele parameters.

Een van de belangrijkste parameters is de woordherkenningsfout (ORF). Deze parameter is de verhouding tussen het aantal niet-herkende woorden en het totale aantal gesproken woorden.

Andere parameters die automatische spraakherkenningssystemen kenmerken zijn:

1) woordenboekgrootte,

2) spraakmodus,

3) stijl van spreken,

4) vakgebied,

5) luidsprekerverslaving,

6) het niveau van akoestische ruis,

7) de kwaliteit van het ingangskanaal.

Afhankelijk van de grootte van het woordenboek zijn APP-systemen onderverdeeld in drie groepen:

Met een kleine woordenboekgrootte (tot 100 woorden),

Met een gemiddelde woordenboekgrootte (van 100 woorden tot enkele duizenden woorden),

Met een grote woordenboekomvang (meer dan 10.000 woorden).

De spraakmodus kenmerkt de manier waarop woorden en zinnen worden uitgesproken. Er zijn systemen voor het herkennen van continue spraak en systemen waarmee alleen geïsoleerde spraakwoorden kunnen worden herkend. In de modus voor geïsoleerde woordherkenning moet de spreker even pauzeren tussen woorden.

Volgens de stijl van spreken zijn APP-systemen verdeeld in twee groepen: deterministische spraaksystemen en spontane spraaksystemen.

In deterministische spraakherkenningssystemen reproduceert de spreker spraak volgens de grammaticale regels van de taal. Spontane spraak wordt gekenmerkt door schendingen van grammaticale regels en is moeilijker te herkennen.

Afhankelijk van het vakgebied zijn er APP-systemen gericht op toepassing in zeer specialistische gebieden (bijvoorbeeld toegang tot databases) en APP-systemen met een onbeperkte reikwijdte. Deze laatste vereisen een grote hoeveelheid woordenschat en moeten zorgen voor herkenning van spontane spraak.

Veel automatische spraakherkenningssystemen zijn sprekerafhankelijk. Dit houdt in dat het systeem vooraf wordt afgestemd op de eigenaardigheden van de uitspraak van een bepaalde spreker.

De complexiteit van het oplossen van het probleem van spraakherkenning wordt verklaard door de grote variabiliteit van akoestische signalen. Deze variabiliteit is te wijten aan verschillende redenen:

Ten eerste, verschillende implementatie van fonemen - de basiseenheden van het geluidssysteem van de taal. De variabiliteit in de implementatie van fonemen wordt veroorzaakt door de invloed van naburige geluiden in de spraakstroom. De tinten van de realisatie van fonemen, vanwege de geluidsomgeving, worden allofonen genoemd.

Ten tweede de positie en kenmerken van akoestische ontvangers.

Ten derde, veranderingen in de parameters van de spraak van dezelfde spreker, die te wijten zijn aan de verschillende emotionele toestand van de spreker, het tempo van zijn spraak.

De afbeelding toont de belangrijkste componenten van het spraakherkenningssysteem:

Het gedigitaliseerde spraaksignaal komt de pre-processing unit binnen, waar de functies die nodig zijn voor geluidsherkenning worden geëxtraheerd. Geluidsherkenning wordt vaak gedaan met behulp van kunstmatige neurale netwerkmodellen. De geselecteerde geluidseenheden worden vervolgens gebruikt om te zoeken naar een reeks woorden die het beste past bij het ingevoerde spraaksignaal.

Het zoeken naar een reeks woorden wordt uitgevoerd met behulp van akoestische, lexicale en taalmodellen. De modelparameters worden bepaald uit de trainingsgegevens op basis van de respectievelijke leeralgoritmen.

Synthese van spraak door tekst. Basisconcepten

In veel gevallen vereist het creëren van kunstmatige-intelligentiesystemen met elementen van haar communicatie de uitvoer van berichten in spraakvorm. De afbeelding toont een blokschema van een intelligent vraag-antwoordsysteem met een spraakinterface:

Foto 1.

Volg een stukje college van Oleg

Overweeg de kenmerken van de empirische benadering van het voorbeeld van herkenning van woordsoorten. De taak is om labels toe te kennen aan de woorden van de zin: zelfstandig naamwoord, werkwoord, voorzetsel, bijvoeglijk naamwoord en dergelijke. Daarnaast is het noodzakelijk om enkele extra kenmerken van zelfstandige naamwoorden en werkwoorden te definiëren. Voor een zelfstandig naamwoord is het bijvoorbeeld een getal en voor een werkwoord is het een vorm. We formaliseren de taak.

Laten we de zin voorstellen als een reeks woorden: W=w1 w2…wn, waarbij wn willekeurige variabelen zijn, die elk een van de mogelijke waarden krijgen die bij het taalwoordenboek horen. De reeks labels die aan de woorden van de zin zijn toegewezen, kan worden weergegeven door de reeks X=x1 x2 ... xn, waarbij xn willekeurige variabelen zijn waarvan de waarden zijn gedefinieerd op de set van mogelijke labels.

Dan is het probleem van part-of-speech-herkenning het vinden van de meest waarschijnlijke volgorde van labels x1, x2, …, xn gegeven de volgorde van woorden w1, w2, …, wn. Met andere woorden, het is nodig om een ​​dergelijke reeks labels X*=x1 x2 … xn te vinden die de maximale voorwaardelijke kans P(x1, x2, …, xn| w1 w2.. wn) oplevert.

Laten we de voorwaardelijke kans P(X| W) herschrijven als P(X| W)=P(X,W) / P(W). Omdat het nodig is om de maximale voorwaardelijke kans P(X,W) voor de variabele X te vinden, krijgen we X*=arg x max P(X,W). De gezamenlijke kans P(X,W) kan worden geschreven als een product van voorwaardelijke kansen: P(X,W)=product over u-1 tot n van P(x i |x1,…,x i -1 , w1,…, w i -1 ) P(w i |x1,…,x i -1 , w1,…,w i -1). Direct zoeken naar het maximum van deze uitdrukking is een moeilijke taak, aangezien voor grote waarden van n de zoekruimte erg groot wordt. Daarom worden de kansen die in dit product worden geschreven benaderd door eenvoudigere voorwaardelijke kansen: P(x i |x i -1) P(w i |w i -1). In dit geval wordt aangenomen dat de waarde van het label xi alleen geassocieerd is met het vorige label xi -1 en niet afhangt van eerdere labels, en dat de waarschijnlijkheid van het woord wi alleen wordt bepaald door het huidige label xi. Deze aannames worden Markovian genoemd en de theorie van Markov-modellen wordt gebruikt om het probleem op te lossen. Rekening houdend met de aannames van Markov, kunnen we schrijven:

X*= arg x1, …, xn max П i =1 n P(x i |x i -1) P(wi|wi-1)

Waar voorwaardelijke kansen worden geschat op een set trainingsgegevens

Het zoeken naar een reeks labels X* wordt uitgevoerd met behulp van het dynamische programmeeralgoritme van Viterbi. Het Viterbi-algoritme kan worden beschouwd als een variant van het zoekalgoritme voor toestandsgrafieken, waarbij de hoekpunten overeenkomen met woordlabels.

Kenmerkend is dat voor elk huidig ​​hoekpunt de set onderliggende labels altijd hetzelfde is. Bovendien vallen voor elk onderliggend hoekpunt ook de reeksen bovenliggende hoekpunten samen. Dit wordt verklaard door het feit dat er overgangen worden gemaakt op de toestandsgrafiek, rekening houdend met alle mogelijke combinaties van labels. De aanname van Markov zorgt voor een aanzienlijke vereenvoudiging van het probleem van de herkenning van delen van spraak, terwijl de hoge nauwkeurigheid van het toewijzen van labels aan woorden behouden blijft.

Met 200 tags is de toewijzingsnauwkeurigheid dus ongeveer 97%. Lange tijd werd imperiale analyse uitgevoerd met behulp van stochastische contextvrije grammatica's. Ze hebben echter een belangrijk nadeel. Het ligt in het feit dat dezelfde kansen kunnen worden toegewezen aan verschillende parsen. Dit komt door het feit dat de kans op ontleden wordt weergegeven als een product van de kansen van de regels die bij het ontleden betrokken zijn. Als tijdens de analyse verschillende regels worden gebruikt, gekenmerkt door dezelfde kansen, dan doet zich het aangegeven probleem voor. De beste resultaten worden gegeven door een grammatica die rekening houdt met de woordenschat van de taal.

In dit geval bevatten de regels de nodige lexicale informatie die verschillende waarschijnlijkheidswaarden biedt voor dezelfde regel in verschillende lexicale omgevingen. Imperial parsing is meer in lijn met patroonherkenning dan traditionele parsing in zijn klassieke zin.

Vergelijkende studies hebben aangetoond dat de nauwkeurigheid van imperiale ontleding van natuurlijke taaltoepassingen hoger is dan die van traditionele ontleding.

Methoden voor automatische patroonherkenning en hun implementatie in optische tekenherkenningssystemen (Optical Character Recognition - OCR-systemen) is een van de meest geavanceerde kunstmatige-intelligentietechnologieën. Bij de ontwikkeling van deze technologie nemen Russische wetenschappers leidende posities in de wereld in.

Onder OCR-systeem wordt verstaan ​​een systeem van automatische beeldherkenning waarbij speciale programma's worden gebruikt om tekens van gedrukte of handgeschreven tekst (bijvoorbeeld ingevoerd in een computer via een scanner) af te beelden en om te zetten in een formaat dat geschikt is voor verwerking door tekstverwerkers, tekstverwerkers , enzovoort.

De afkorting OCR wordt soms ontcijferd als Optical Character Reader - een apparaat voor optische tekenherkenning of het automatisch lezen van tekst. Momenteel verwerken dergelijke apparaten in industrieel gebruik tot 100.000 documenten per dag.

Industrieel gebruik omvat de invoer van documenten van goede tot gemiddelde kwaliteit - dit is de verwerking van volkstellingsformulieren, belastingaangiften, enz.

We zetten de kenmerken van het vakgebied op een rij die belangrijk zijn vanuit het oogpunt van OCR-systemen:

  • lettertype en grootte verscheidenheid aan tekens;
  • vervormingen in de afbeeldingen van symbolen (breuken in de afbeeldingen van symbolen);
  • vervormingen tijdens het scannen;
  • buitenlandse insluitsels in afbeeldingen;
  • combinatie van tekstfragmenten in verschillende talen;
  • een grote verscheidenheid aan karakterklassen die alleen kunnen worden herkend met aanvullende contextuele informatie.

Het automatisch lezen van gedrukte en handgeschreven teksten is een speciaal geval van automatische visuele waarneming van complexe afbeeldingen. Talrijke studies hebben aangetoond dat om dit probleem volledig op te lossen, intellectuele herkenning, d.w.z. 'erkenning met begrip', noodzakelijk is.

Er zijn drie principes waarop alle OCR-systemen zijn gebaseerd.

  • 1. Het principe van de integriteit van het beeld. In het bestudeerde object bevinden zich altijd significante delen waartussen relaties bestaan. De resultaten van lokale bewerkingen met delen van het beeld worden alleen gezamenlijk geïnterpreteerd in het proces van het interpreteren van integrale fragmenten en het hele beeld als geheel.
  • 2. Het principe van doelgerichtheid. Erkenning is een doelgericht proces van het genereren en testen van hypothesen (te weten komen wat er van een object wordt verwacht).
  • 3. Het principe van aanpassingsvermogen. Het herkenningssysteem moet zelflerend zijn.

Toonaangevende Russische OCR-systemen: FineReader; FineReader-manuscript; formulierReader; CunieForm (cognitieve technologieën), cognitieve vormen (cognitieve technologieën) .

Het FineReader-systeem wordt geproduceerd door ABBYY, opgericht in 1989. ABBYY ontwikkelt zich in twee richtingen: machinevisie en toegepaste taalkunde. De strategische richting van wetenschappelijk onderzoek en ontwikkeling is het natuurlijke taalaspect van technologieën op het gebied van machine vision, kunstmatige intelligentie en toegepaste taalkunde.

CuneiForm GOLD voor Windows is 's werelds eerste zelflerende intelligente OCR-systeem, dat gebruik maakt van de nieuwste adaptieve tekstherkenningstechnologie en vele talen ondersteunt. Voor elke taal wordt een woordenboek geleverd voor contextuele controle en verbetering van de kwaliteit van herkenningsresultaten. Herkent alle polygrafische, getypte lettertypen en lettertypen die van drukkers worden ontvangen, met uitzondering van decoratieve en handgeschreven teksten, evenals teksten van zeer lage kwaliteit.

Kenmerken van patroonherkenningssystemen. Onder OSL-technologieën zijn speciale technologieën voor het oplossen van bepaalde soorten problemen van automatische patroonherkenning van groot belang:

  • mensen zoeken op foto's;
  • zoeken naar minerale afzettingen en weersvoorspellingen op basis van luchtfotografie en satellietbeelden in verschillende lichtstralen;
  • het samenstellen van geografische kaarten op basis van de initiële informatie die in de vorige taak is gebruikt;
  • analyse van vingerafdrukken en tekeningen van de iris in forensische, veiligheids- en medische systemen.

In de fase van voorbereiding en verwerking van informatie, vooral bij het automatiseren van een onderneming, het automatiseren van de boekhouding, rijst de taak om een ​​grote hoeveelheid tekstuele en grafische informatie in een pc in te voeren. De belangrijkste apparaten voor het invoeren van grafische informatie zijn: een scanner, een faxmodem en minder vaak een digitale camera. Daarnaast kunt u met optische tekstherkenningsprogramma's ook tekstinformatie in een computer invoeren (digitaliseren). Moderne software- en hardwaresystemen maken het mogelijk om de invoer van grote hoeveelheden informatie in een computer te automatiseren, bijvoorbeeld met een netwerkscanner en parallelle tekstherkenning op meerdere computers tegelijk.

De meeste OCR-programma's werken met een bitmapafbeelding die wordt ontvangen via een faxmodem, scanner, digitale camera of ander apparaat. In de eerste fase moet het OSA-systeem de pagina opsplitsen in tekstblokken, gebaseerd op de kenmerken van de rechter- en linkeruitlijning en de aanwezigheid van meerdere kolommen. Het herkende blok wordt vervolgens opgesplitst in regels. Ondanks de ogenschijnlijke eenvoud is dit niet zo'n voor de hand liggende taak, aangezien in de praktijk de vervorming van het paginabeeld of de fragmenten ervan bij het vouwen onvermijdelijk is. Zelfs een lichte helling zorgt ervoor dat de linkerrand van de ene regel lager is dan de rechterrand van de volgende, vooral wanneer de regelafstand klein is. Daardoor is er een probleem bij het bepalen van de lijn waartoe dit of dat fragment van het beeld behoort. Bijvoorbeeld voor brieven

De lijnen worden vervolgens opgedeeld in aangrenzende gebieden van de afbeelding die overeenkomen met individuele letters; het herkenningsalgoritme maakt aannames over de overeenstemming van deze gebieden met tekens, en vervolgens wordt elk teken geselecteerd, waardoor de pagina wordt hersteld in teksttekens en, in de regel, in een bepaald formaat. OCR-systemen kunnen de beste herkenningsnauwkeurigheid bereiken - meer dan 99,9% voor pure afbeeldingen die zijn samengesteld uit gewone lettertypen. Op het eerste gezicht lijkt deze herkenningsnauwkeurigheid ideaal, maar het foutenpercentage is nog steeds deprimerend, want als er ongeveer 1500 tekens per pagina zijn, dan zijn er zelfs bij een herkenningssucces van 99,9% een of twee fouten per pagina. In dergelijke gevallen moet u de woordenboekcontrolemethode gebruiken, d.w.z. als een woord niet in het systeemwoordenboek staat, zal het proberen een vergelijkbaar woord te vinden volgens speciale regels. Maar hierdoor kunnen nog steeds niet 100% van de fouten worden gecorrigeerd en is menselijke controle over de resultaten vereist.

Teksten die je in het echte leven tegenkomt, zijn meestal verre van perfect, en het percentage herkenningsfouten voor "onzuivere" teksten is vaak onaanvaardbaar hoog. Vuile afbeeldingen zijn het meest voor de hand liggende probleem, omdat zelfs kleine vegen bepalende delen van een personage kunnen verdoezelen of in een ander kunnen veranderen. Het probleem is ook onnauwkeurig scannen in verband met de "menselijke factor", aangezien de operator die aan de scanner zit gewoon niet in staat is om elke gescande pagina glad te strijken en nauwkeurig uit te lijnen met de randen van de scanner. Als het document is gefotokopieerd, zijn er vaak onderbrekingen en samenvoeging van tekens. Elk van deze effecten kan ervoor zorgen dat het systeem fouten maakt, omdat sommige OSD-systemen ervan uitgaan dat een aangrenzend gebied van een afbeelding uit één teken moet bestaan. Een out-of-bounds of scheve pagina creëert enigszins scheve karakterafbeeldingen die door het OSA-systeem kunnen worden verward.

De OSL-systeemsoftware werkt meestal met een grote bitmap van de pagina die van de scanner is ontvangen. Afbeeldingen met een standaard resolutie worden bereikt door te scannen met een nauwkeurigheid van 9600 p/d. Een afbeelding op een A4-vel met deze resolutie neemt ongeveer 1 MB geheugen in beslag.

Het belangrijkste doel van OCR-systemen is het analyseren van rasterinformatie (gescand teken) en het toewijzen van een overeenkomstig teken aan een beeldfragment. Nadat het herkenningsproces is voltooid, moeten OCR-systemen in staat zijn om de opmaak van brondocumenten te behouden, een alinea-attribuut op de juiste plaats toe te wijzen, tabellen, afbeeldingen, enz. op te slaan. Moderne herkenningsprogramma's ondersteunen alle bekende tekst- en grafische formaten en spreadsheetformaten, evenals HTML en PDF.

Het werken met OCR-systemen zou in de regel geen bijzondere problemen moeten opleveren. De meeste van deze systemen hebben de eenvoudigste automatische modus "scannen en herkennen" (Scan & Read), en ze ondersteunen ook de modus voor het herkennen van afbeeldingen uit bestanden. Om de best mogelijke resultaten voor een bepaald systeem te bereiken, is het echter wenselijk (en vaak noodzakelijk) om het vooraf handmatig aan te passen aan een specifiek type tekst, briefhoofdlay-out en papierkwaliteit. Een out-of-bounds of scheve pagina creëert enigszins vervormde karakterafbeeldingen die door het OCR-systeem kunnen worden verward.

Bij het werken met een OCR-systeem is het erg belangrijk om de herkenningstaal en het type materiaal te kiezen dat moet worden herkend (schrijfmachine, fax, dot-matrixprinter, krant, enz.), evenals de intuïtiviteit van de gebruikersinterface. Bij het herkennen van teksten waarin meerdere talen worden gebruikt, hangt de herkenningsefficiëntie af van het vermogen van het OCR-systeem om taalgroepen te vormen. Tegelijkertijd hebben sommige systemen al combinaties voor de meest gebruikte talen, zoals Russisch en Engels.

Op dit moment zijn er enorm veel programma's die tekstherkenning als een van de mogelijkheden ondersteunen. De leider op dit gebied is het FineReader-systeem. De nieuwste versie van het programma (6.0) heeft nu tools voor het ontwikkelen van nieuwe systemen op basis van FineReader 6.0-technologie. De FineReader 6.0-familie omvat: FineReader 6.0 Professional, FineReader 6.0 Corporate Edition, FineReader Scripting Edition 6.0 en FineReader Engine 6.0. Het FineReader 6.0-systeem kent niet alleen een groot aantal formaten om op te slaan, waaronder PDF, maar heeft ook de mogelijkheid om PDF-bestanden direct te herkennen. Met de nieuwe Intelligent Background Filtering-technologie (intelligente achtergrondfiltering) kunt u informatie uitfilteren over de textuur van het document en de achtergrondruis van de afbeelding: soms wordt een grijze of gekleurde achtergrond gebruikt om tekst in een document te markeren. Dit weerhoudt een persoon niet om te lezen, maar conventionele algoritmen voor tekstherkenning hebben ernstige problemen bij het werken met letters die zich op een dergelijke achtergrond bevinden. FineReader kan zones met dergelijke tekst detecteren door de tekst van de achtergrond van het document te scheiden, stippen te vinden die kleiner zijn dan een bepaald aantal en deze te verwijderen. Tegelijkertijd blijven de contouren van de letters behouden, zodat achtergrondpunten die dicht bij deze contouren liggen geen interferentie introduceren die de kwaliteit van tekstherkenning kan verminderen.

Gebruikmakend van de mogelijkheden van moderne lay-outprogramma's, creëren ontwerpers vaak objecten met een complexe vorm, zoals tekst met meerdere kolommen om een ​​niet-rechthoekige afbeelding. FineReader 6.0 ondersteunt de herkenning van dergelijke objecten en hun opslag in MS Word-bestanden. Nu worden complexe lay-outdocumenten nauwkeurig gereproduceerd in deze teksteditor. Zelfs tabellen worden met maximale nauwkeurigheid herkend, met behoud van alle bewerkingsmogelijkheden.

ABBYY FormReader is een van ABBYY's herkenningsprogramma's op basis van ABBYY FineReader Engine. Dit programma is ontworpen om formulieren te herkennen en te verwerken die handmatig kunnen worden ingevuld. ABBYY FormReader kan formulieren met een vaste opmaak net zo goed verwerken als formulieren waarvan de structuur kan veranderen. De nieuwe ABBYY FlexiForm-technologie werd gebruikt voor herkenning.

Toonaangevende softwarefabrikanten hebben Russische informatietechnologie in licentie gegeven voor gebruik met hun producten. De populaire softwarepakketten Corel Draw (Corel Corporation), FaxLine/OCR & Business Card Wizard (Inzer Corporation) en vele andere hebben de CuneiForm OCR-bibliotheek ingebouwd. Dit programma werd het eerste OCR-systeem in Rusland dat het MS Windows-compatibele logo ontving.

Readiris Pro 7 is een professioneel tekstherkenningsprogramma. Volgens de fabrikanten onderscheidt dit OCR-systeem zich van analogen door de hoogste nauwkeurigheid bij het omzetten van gewone (alledaagse) gedrukte documenten, zoals brieven, faxen, tijdschriftartikelen, krantenknipsels, in bewerkbare objecten (inclusief PDF-bestanden). De belangrijkste voordelen van het programma zijn: de mogelijkheid om afbeeldingen die "tot het maximum" zijn gecomprimeerd (met maximaal kwaliteitsverlies) min of meer nauwkeurig te herkennen met behulp van de JPEG-formaatmethode, ondersteuning voor digitale camera's en automatische detectie van paginaoriëntatie, ondersteuning voor tot 92 talen (inclusief Russisch).

OmniPage 11 is een ScanSoft-product. Een beperkte versie van dit programma (OmniPage 11 Limited Edition, OmniPage Lite) wordt meestal gebundeld met nieuwe scanners (in Europa en de VS). De ontwikkelaars beweren dat hun programma gedrukte documenten met bijna 100% nauwkeurigheid herkent en hun opmaak herstelt, inclusief kolommen, tabellen, woordafbreking (inclusief woordafbreking), koppen, hoofdstuktitels, handtekeningen, paginanummers, voetnoten, alinea's, genummerde lijsten , rode lijnen, grafieken en afbeeldingen. Het is mogelijk om op te slaan naar Microsoft Office, PDF en 20 andere formaten, te herkennen uit PDF-bestanden en in dit formaat te bewerken. Met het kunstmatige intelligentiesysteem kunt u automatisch fouten detecteren en corrigeren na de eerste handmatige correctie. Een nieuwe speciaal ontwikkelde softwaremodule "Dcspeckle" stelt u in staat om documenten met verminderde kwaliteit (faxen, kopieën, kopieën van kopieën, enz.) te herkennen. Het voordeel van het programma is de mogelijkheid om gekleurde tekst te herkennen en met de stem te corrigeren. Er bestaat ook een versie van OmniPage voor Macintosh-computers.

  • Cm.: Bashmakov A.I., Bashmakov I.A. Intelligente informatietechnologieën.

Stuur uw goede werk in de kennisbank is eenvoudig. Gebruik het onderstaande formulier

Studenten, afstudeerders, jonge wetenschappers die de kennisbasis gebruiken in hun studie en werk zullen je zeer dankbaar zijn.

geplaatst op http://www.allbest.ru/

Ministerie van Onderwijs en Wetenschappen van de Russische Federatie

Novosibirsk State University of Economics and Management "NINH"

Faculteit Informatietechnologie

Afdeling Toegepaste Informatietechnologie

discipline Fuzzy logic en neurale netwerken

Patroonherkenning

Richting: Bedrijfsinformatica (elektronische zaken)

Volledige naam van de student: Ekaterina Vitalievna Mazur

Gecontroleerd door: Pavlova Anna Illarionovna

Novosibirsk 2016

  • Invoering
  • 1. Het begrip herkenning
    • 1.1 Ontwikkelingsgeschiedenis
    • 1.2 Classificatie van patroonherkenningsmethoden
  • 2. Methoden voor patroonherkenning
  • 3. Algemene kenmerken van patroonherkenningsproblemen en hun typen
  • 4. Problemen en vooruitzichten voor de ontwikkeling van patroonherkenning
    • 4.1 Toepassing van patroonherkenning in de praktijk
  • Conclusie

Invoering

Lange tijd werd het probleem van patroonherkenning alleen vanuit biologisch oogpunt bekeken. Tegelijkertijd werden alleen kwalitatieve kenmerken onderworpen aan observaties, waardoor het werkingsmechanisme niet kon worden beschreven.

Het concept geïntroduceerd door N. Wiener aan het begin van de 20e eeuw cybernetica(de wetenschap van de algemene wetten van de processen van controle en overdracht van informatie in machines, levende organismen en de samenleving), maakte de introductie mogelijk van kwantitatieve methoden op het gebied van herkenning. Dat wil zeggen, om dit proces (in feite - een natuurlijk fenomeen) met wiskundige methoden te presenteren.

De theorie van patroonherkenning is een van de belangrijkste onderdelen van cybernetica, zowel theoretisch als toegepast. De automatisering van sommige processen omvat dus het creëren van apparaten die in staat zijn om te reageren op veranderende kenmerken van de externe omgeving met een bepaald aantal positieve reacties.

De basis voor het oplossen van problemen van dit niveau zijn de resultaten van de klassieke theorie van statistische oplossingen. Binnen het raamwerk zijn algoritmen gebouwd voor het bepalen van de klasse waaraan een herkenbaar object kan worden toegewezen.

Het doel van dit werk is om kennis te maken met de concepten van patroonherkenningstheorie: de belangrijkste definities onthullen, de geschiedenis van het voorkomen bestuderen, de belangrijkste methoden en principes van de theorie benadrukken.

De relevantie van het onderwerp ligt in het feit dat patroonherkenning momenteel een van de leidende gebieden van cybernetica is. Dus de laatste jaren wordt het steeds vaker gebruikt: het vereenvoudigt de interactie van een persoon met een computer en schept de voorwaarden voor het gebruik van verschillende kunstmatige-intelligentiesystemen.

toepassing voor beeldherkenning

1. Het concept van herkenning

Lange tijd trok het herkenningsprobleem de aandacht van alleen wetenschappers op het gebied van toegepaste wiskunde. Het resultaat is dat de werken van R. Fischer, gecreëerd in jaren '20, leidde tot de vorming van discriminantanalyse - een van de secties van de theorie en praktijk van patroonherkenning. BIJ jaren 40 A. N. Kolmogorov en A. Ya. Khinchin stelden het doel om een ​​mengsel van twee distributies te scheiden. En in 50-60 jaren van de twintigste eeuw, op basis van een groot aantal werken, verscheen de theorie van statistische beslissingen. Binnen het kader van cybernetica begon een nieuwe richting vorm te krijgen, die verband houdt met de ontwikkeling van theoretische grondslagen en de praktische implementatie van mechanismen, evenals systemen die zijn ontworpen om objecten en processen te herkennen. De nieuwe discipline heette "Pattern Recognition".

Patroonherkenning(objecten) is de taak om een ​​object te identificeren aan de hand van zijn afbeelding (optische herkenning), geluidsopname (akoestische herkenning) of andere kenmerken. Afbeelding- Dit is een classificatiegroepering waarmee u een groep objecten kunt combineren volgens bepaalde criteria. Beelden hebben een karakteristiek kenmerk dat zich manifesteert in het feit dat bekendheid met een eindig aantal verschijnselen uit één set het mogelijk maakt om een ​​groot aantal van zijn vertegenwoordigers te herkennen. In de klassieke formulering van het herkenningsprobleem is de verzameling in delen verdeeld.

Een van de basisdefinities is ook het concept stelt. In een computer is een verzameling een verzameling niet-repeterende elementen van hetzelfde type. "Niet-herhalend" betekent dat een element al dan niet in de set aanwezig is. De universele set bevat alle mogelijke elementen, de lege set bevat er geen.

De methode om een ​​element aan een afbeelding toe te wijzen heet beslissingsregel. Een ander belangrijk concept is: statistieken- bepaalt de afstand tussen de elementen van de set. Hoe kleiner deze afstand, hoe meer op elkaar lijken de objecten (symbolen, geluiden, etc.) die we herkennen. Standaard worden de elementen gespecificeerd als een reeks getallen en wordt de metriek gespecificeerd als een soort functie. De efficiëntie van het programma hangt af van de keuze van de afbeeldingsrepresentatie en de implementatie van de metriek: hetzelfde herkenningsalgoritme met verschillende metrieken zal fouten maken met verschillende frequenties.

aan het leren gewoonlijk het proces van ontwikkeling in een bepaald systeem een ​​bepaalde reactie op factoren van externe soortgelijke signalen genoemd door hun herhaalde impact op het systeem. zelfstudie verschilt van training doordat hier geen aanvullende informatie over de reactie aan het systeem wordt gerapporteerd.

Voorbeelden van patroonherkenningsproblemen zijn:

Letterherkenning;

Barcode herkenning;

Herkenning van kentekenplaten;

Herkenning van gezichten en andere biometrische gegevens;

Spraakherkenning enz.

1.1 Verhaal ontwikkeling

Tegen het midden van de jaren vijftig zette R. Penrose het neurale netwerkmodel van de hersenen in twijfel en wees hij op de essentiële rol van kwantummechanische effecten bij het functioneren ervan. Op basis hiervan ontwikkelde F. Rosenblatt een leermodel voor visuele patroonherkenning, de perceptron.

Afbeelding1 - Schema van de Perceptron

Verder werden verschillende generalisaties van de perceptron uitgevonden en was de functie van neuronen gecompliceerd: neuronen konden niet alleen invoergetallen vermenigvuldigen en het resultaat vergelijken met drempelwaarden, maar er ook complexere functies op toepassen. Figuur 2 toont een van deze complicaties:

Rijst. 2 Schema van het neurale netwerk.

Bovendien zou de topologie van het neurale netwerk nog ingewikkelder kunnen zijn. Bijvoorbeeld als volgt:

Figuur 3 - Schema van het neurale netwerk van Rosenblatt.

Neurale netwerken, die een complex object zijn voor wiskundige analyse, maakten het bij juist gebruik mogelijk om zeer eenvoudige datawetten te vinden. Maar dit voordeel is ook een bron van mogelijke fouten. De moeilijkheid voor analyse wordt in het algemeen alleen verklaard door de complexe structuur, maar als gevolg daarvan door de praktisch onuitputtelijke mogelijkheden om een ​​grote verscheidenheid aan regelmatigheden te veralgemenen.

1.2 Classificatiemethodenerkenningafbeeldingen

Zoals we al hebben opgemerkt, is patroonherkenning de taak om equivalentierelaties tot stand te brengen tussen bepaalde afbeeldingen-modellen van objecten in de echte of ideale wereld.

Deze relaties bepalen het behoren van herkenbare objecten tot sommige klassen, die als onafhankelijke onafhankelijke eenheden worden beschouwd.

Bij het construeren van herkenningsalgoritmen kunnen deze klassen worden gespecificeerd door een onderzoeker die zijn eigen ideeën gebruikt of aanvullende informatie gebruikt over de overeenkomst of het verschil van objecten in de context van een bepaalde taak. In dit geval spreekt men van 'herkenning bij de leraar'. In een andere, d.w.z. wanneer een geautomatiseerd systeem een ​​classificatieprobleem oplost zonder aanvullende informatie, is er sprake van "unsupervised recognition".

In het werk van V.A. Duke geeft een academisch overzicht van herkenningsmethoden en gebruikt twee belangrijke manieren om kennis weer te geven:

Intensief (in de vorm van een diagram van relaties tussen attributen);

Extensioneel met behulp van specifieke feiten (objecten, voorbeelden).

De intensere representatie legt de patronen vast die de structuur van de gegevens verklaren. Met betrekking tot diagnostische taken bestaat een dergelijke fixatie uit het bepalen van bewerkingen op de kenmerken van objecten die tot het gewenste resultaat leiden. Intensieve representaties worden geïmplementeerd door bewerkingen op waarden en omvatten geen bewerkingen op specifieke objecten.

Op hun beurt worden extensionele representaties van kennis geassocieerd met de beschrijving en fixatie van specifieke objecten uit het onderwerpgebied en geïmplementeerd in operaties, waarvan de elementen objecten zijn als onafhankelijke systemen.

Dus de classificatie van herkenningsmethoden voorgesteld door V.A. Hertog, er worden fundamentele wetmatigheden vastgelegd die in principe ten grondslag liggen aan de menselijke manier van kennen. Dit plaatst deze indeling in klassen in een bijzondere positie ten opzichte van andere minder bekende classificaties, die tegen deze achtergrond kunstmatig en onvolledig lijken.

2. Methoden:patroonherkenning

Iteratie methode. Bij deze methode wordt een vergelijking gemaakt met een bepaalde database, waarbij er voor elk van de objecten verschillende opties zijn om de weergave aan te passen. Voor optische beeldherkenning kunt u bijvoorbeeld de iteratiemethode toepassen op verschillende hoeken of schalen, offsets, vervormingen, enz. Voor letters kunt u het lettertype of de eigenschappen ervan herhalen. In het geval van geluidspatroonherkenning is er een vergelijking met enkele bekende patronen (een woord dat door veel mensen wordt gesproken). Verder wordt een diepere analyse van de kenmerken van het beeld uitgevoerd. In het geval van optische herkenning kan dit de definitie zijn van geometrische kenmerken. Het geluidsmonster wordt in dit geval onderworpen aan frequentie- en amplitudeanalyse.

De volgende methode is: gebruik van kunstmatige neurale netwerken(INS). Het vereist ofwel een groot aantal voorbeelden van de herkenningstaak, of een speciale neurale netwerkstructuur die rekening houdt met de specifieke kenmerken van deze taak. Maar niettemin wordt deze methode gekenmerkt door een hoge efficiëntie en productiviteit.

Methoden gebaseerd op schattingen van de distributiedichtheden van kenmerkwaarden. Ontleend aan de klassieke theorie van statistische beslissingen, waarin de onderzoeksobjecten worden beschouwd als realisaties van een multidimensionale willekeurige variabele die volgens een of andere wet in de kenmerkruimte wordt verdeeld. Ze zijn gebaseerd op het Bayesiaanse besluitvormingsschema, dat een beroep doet op de initiële waarschijnlijkheden van objecten die tot een bepaalde klasse behoren en voorwaardelijke kenmerkdistributiedichtheden.

De groep methoden op basis van de schatting van de distributiedichtheden van kenmerkwaarden is direct gerelateerd aan de methoden van discriminantanalyse. De Bayesiaanse benadering van besluitvorming is een van de meest ontwikkelde parametrische methoden in de moderne statistiek, waarvoor de analytische uitdrukking van de distributiewet (de normale wet) bekend wordt geacht en slechts een klein aantal parameters (gemiddelde vectoren en covariantiematrices) ) moeten worden geschat. De belangrijkste problemen bij het toepassen van deze methode zijn de noodzaak om de hele trainingssteekproef te onthouden om dichtheidsschattingen te berekenen en een hoge gevoeligheid voor de trainingssteekproef.

Methoden gebaseerd op aannames over de klasse van beslissingsfuncties. In deze groep wordt het type beslissingsfunctie als bekend beschouwd en wordt de functionele kwaliteit ervan gegeven. Op basis van deze functie wordt de optimale benadering van de beslissingsfunctie gevonden uit de trainingsreeks. De kwaliteitsfunctionaliteit van de beslissingsregel wordt meestal geassocieerd met een fout. Het belangrijkste voordeel van de methode is de duidelijkheid van de wiskundige formulering van het herkenningsprobleem. De mogelijkheid om nieuwe kennis over de aard van een object te extraheren, in het bijzonder kennis over de mechanismen van interactie van attributen, wordt hier fundamenteel beperkt door een bepaalde structuur van interactie, vastgelegd in de gekozen vorm van beslissingsfuncties.

Prototype vergelijkingsmethode. Dit is in de praktijk de gemakkelijkste extensionele herkenningsmethode. Het is van toepassing wanneer de herkenbare klassen worden weergegeven als compacte geometrische klassen. Vervolgens wordt het midden van de geometrische groepering (of het object dat zich het dichtst bij het midden bevindt) gekozen als het prototypepunt.

Om een ​​onbepaald object te classificeren, wordt het prototype gevonden dat er het dichtst bij ligt, en het object behoort tot dezelfde klasse als het. Uiteraard worden bij deze methode geen gegeneraliseerde beelden gevormd. Als maatstaf kunnen verschillende soorten afstanden worden gebruikt.

k methode naaste buur. De methode ligt in het feit dat bij het classificeren van een onbekend object een gegeven aantal (k) geometrisch dichtstbijzijnde kenmerkruimte van andere dichtstbijzijnde buren waarvan bekend is dat ze tot een klasse behoren, wordt gevonden. De beslissing om een ​​onbekend object toe te wijzen wordt genomen door informatie over zijn naaste buren te analyseren. De noodzaak om het aantal objecten in de trainingssteekproef te verminderen (diagnostische precedenten) is een nadeel van deze methode, omdat dit de representativiteit van de trainingssteekproef vermindert.

Gebaseerd op het feit dat verschillende herkenningsalgoritmen zich verschillend gedragen op dezelfde steekproef, rijst de vraag van een synthetische beslissingsregel die de sterke punten van alle algoritmen zou gebruiken. Hiervoor is er een synthetische methode of reeksen beslisregels die de meest positieve aspecten van elk van de methoden combineren.

Ter afsluiting van het overzicht van herkenningsmethoden presenteren we de essentie van het bovenstaande in een samenvattende tabel, en voegen we enkele andere methoden toe die in de praktijk worden gebruikt.

Tabel 1. Classificatietabel van herkenningsmethoden, vergelijking van hun toepassingsgebieden en beperkingen

Classificatie van herkenningsmethoden

Toepassingsgebied

Beperkingen (nadelen)

Intensieve herkenningsmethoden

Methoden gebaseerd op dichtheidsschattingen

Problemen met een bekende verdeling (normaal), de noodzaak om grote statistieken te verzamelen

De noodzaak om de volledige trainingsset op te sommen tijdens herkenning, hoge gevoeligheid voor niet-representatie van de trainingsset en artefacten

Op veronderstellingen gebaseerde methoden

Klassen moeten goed te scheiden zijn

De vorm van de beslisfunctie moet vooraf bekend zijn. De onmogelijkheid om rekening te houden met nieuwe kennis over correlaties tussen kenmerken

Booleaanse methoden

Problemen van kleine afmetingen

Bij het selecteren van logische beslisregels is een volledige opsomming noodzakelijk. Hoge arbeidsintensiteit

Taalkundige methoden

De taak om de grammatica voor een bepaalde set uitspraken (beschrijvingen van objecten) te bepalen, is moeilijk te formaliseren. Onopgeloste theoretische problemen

Extensionele herkenningsmethoden

Prototype vergelijkingsmethode

Problemen met een kleine dimensie van feature space

Hoge afhankelijkheid van classificatieresultaten van de metriek. Onbekende optimale statistiek

k methode naaste buur

Hoge afhankelijkheid van classificatieresultaten van de metriek. De noodzaak van een volledige opsomming van het trainingsmonster tijdens de herkenning. Computationele complexiteit

Algoritmen voor cijferberekening (ABO)

Problemen van kleine omvang in termen van het aantal klassen en kenmerken

Afhankelijkheid van classificatieresultaten van de metriek. De noodzaak van een volledige opsomming van het trainingsmonster tijdens de herkenning. Hoge technische complexiteit van de methode

Collectieve beslisregels (CRC) is een synthetische methode.

Problemen van kleine omvang in termen van het aantal klassen en kenmerken

Zeer hoge technische complexiteit van de methode, het onopgeloste aantal theoretische problemen, zowel bij het bepalen van de competentiegebieden van bepaalde methoden als bij de specifieke methoden zelf

3. Algemene kenmerken van patroonherkenningsproblemen en hun typen

De algemene structuur van het herkenningssysteem en zijn fasen worden weergegeven in figuur 4:

Figuur 4 - De structuur van het herkenningssysteem

Erkenningstaken hebben de volgende kenmerkende fasen:

Transformatie van initiële gegevens naar een handige vorm voor herkenning;

Herkenning (aangeven dat een object tot een bepaalde klasse behoort).

In deze problemen kan men het concept van gelijkenis van objecten introduceren en een reeks regels formuleren op basis waarvan een object wordt toegewezen aan een of verschillende klassen.

Het is ook mogelijk om te werken met een reeks voorbeelden waarvan de classificatie bekend is en die in de vorm van gegeven beschrijvingen kan worden aangegeven aan het herkenningsalgoritme om aan te passen aan de taak in het leerproces.

Moeilijkheden bij het oplossen van herkenningsproblemen hangen samen met het onvermogen om klassieke wiskundige methoden toe te passen zonder correcties (vaak is er geen informatie beschikbaar voor een nauwkeurig wiskundig model)

Er zijn de volgende soorten herkenningstaken:

De taak van herkenning is de toewijzing van het gepresenteerde object volgens zijn beschrijving aan een van de gegeven klassen (training met een leraar);

De taak van automatische classificatie is om de set op te splitsen in een systeem van niet-overlappende klassen (taxonomie, clusteranalyse, zelflerend);

Het probleem van het kiezen van een informatieve set attributen in herkenning;

De taak om de initiële gegevens in een handige vorm te brengen;

Dynamische herkenning en classificatie;

De taak van het voorspellen - dat wil zeggen, de beslissing moet verwijzen naar een bepaald moment in de toekomst.

Er zijn twee moeilijkste problemen in bestaande herkenningssystemen:

Het probleem van "1001 klassen" - het toevoegen van 1 klasse aan 1000 bestaande klassen veroorzaakt problemen bij het opnieuw trainen van het systeem en het controleren van de eerder verkregen gegevens;

Het probleem van "correlatie van woordenschat en bronnen" komt het sterkst tot uiting bij spraakherkenning. Huidige systemen kunnen ofwel een groot aantal woorden van een kleine groep individuen herkennen, ofwel een paar woorden van een grote groep individuen. Het is ook moeilijk om een ​​groot aantal gezichten met make-up of grimassen te herkennen.

Neurale netwerken lossen deze problemen niet direct op, maar vanwege hun aard passen ze zich veel gemakkelijker aan veranderingen in invoersequenties aan.

4. Problemen en vooruitzichtenontwikkelingpatroonherkenning

4.1 Toepassing van patroonherkenning in de praktijk

In het algemeen bestaat het patroonherkenningsprobleem uit twee delen: leren en herkennen. Leren wordt uitgevoerd door onafhankelijke objecten met hun opdracht aan een of andere klas te tonen. Als resultaat van training moet het herkenningssysteem het vermogen verwerven om met dezelfde reacties te reageren op alle objecten van één afbeelding en verschillende op alle andere. Het is belangrijk dat in het leerproces alleen de objecten zelf en hun behorende tot het beeld worden aangegeven. Training wordt gevolgd door een herkenningsproces dat de acties van een reeds getraind systeem kenmerkt. De automatisering van deze procedures is het probleem.

Voordat u begint met de analyse van een object, is het noodzakelijk om bepaalde, op de een of andere manier geordende, nauwkeurige informatie erover te verkrijgen. Dergelijke informatie is een verzameling eigenschappen van objecten, hun weergave op de verzameling waarnemingsorganen van het herkenningssysteem.

Maar elk waarnemingsobject kan anders handelen, afhankelijk van de waarnemingsvoorwaarden. Bovendien kunnen objecten van dezelfde afbeelding erg van elkaar verschillen.

Elke afbeelding van een object aan de waarnemende organen van het herkenningssysteem, ongeacht de positie ten opzichte van deze organen, wordt gewoonlijk een afbeelding van het object genoemd, en verzamelingen van dergelijke afbeeldingen, verenigd door enkele gemeenschappelijke eigenschappen, zijn afbeeldingen. Bij een succesvolle keuze van de initiële beschrijving (functieruimte) kan de herkenningstaak vrij eenvoudig blijken te zijn, en omgekeerd kan een tevergeefs gekozen leiden tot zeer moeilijke verdere verwerking van informatie, of zelfs tot het ontbreken van een oplossing .

Herkenning van objecten, signalen, situaties, verschijnselen is de meest voorkomende taak die een persoon elke seconde moet oplossen. Hiervoor worden enorme hersenbronnen gebruikt, die wordt geschat door een indicator als het aantal neuronen, gelijk aan 10 10 .

Ook in de technologie wordt voortdurend herkenning aangetroffen. Berekeningen in netwerken van formele neuronen doen in veel opzichten denken aan informatieverwerking door de hersenen. In het afgelopen decennium is neurocomputing enorm populair geworden en is het erin geslaagd om een ​​technische discipline te worden die verband houdt met de productie van commerciële producten. Er wordt hard gewerkt om een ​​basis voor neurocomputing te creëren.

Hun belangrijkste kenmerk is het vermogen om niet-geformaliseerde problemen op te lossen waarvoor om de een of andere reden geen oplossingsalgoritmen worden verondersteld. Neurocomputers bieden een relatief eenvoudige technologie voor het verkrijgen van algoritmen door middel van training. Dit is hun belangrijkste voordeel. Daarom is neurocomputing juist nu relevant - in de hoogtijdagen van multimedia, wanneer wereldwijde ontwikkeling de ontwikkeling vereist van nieuwe technologieën die nauw verwant zijn aan patroonherkenning.

Een van de belangrijkste problemen bij de ontwikkeling en toepassing van kunstmatige intelligentie blijft het probleem van het herkennen van geluid en visuele beelden. Alle andere technologieën zijn al klaar om hun toepassing te vinden in de geneeskunde, biologie en beveiligingssystemen. In de geneeskunde helpt patroonherkenning artsen om nauwkeurigere diagnoses te stellen; in fabrieken wordt het gebruikt om defecten in partijen goederen te voorspellen. Biometrische identificatiesystemen, als hun algoritmische kern, zijn ook gebaseerd op herkenningsresultaten. Verdere ontwikkeling en ontwerp van computers die in staat zijn tot directere communicatie met een persoon in natuurlijke talen voor mensen en door spraak is onoplosbaar zonder herkenning. Hier rijst reeds de vraag naar de ontwikkeling van robotica, kunstmatige controlesystemen, die herkenningssystemen als vitale subsystemen bevatten.

Conclusie

Als resultaat van het werk werd een kort overzicht gemaakt van de belangrijkste definities van de concepten van een dergelijke sectie van cybernetica als patroonherkenning, werden herkenningsmethoden geïdentificeerd en werden taken geformuleerd.

Natuurlijk zijn er veel richtingen voor de ontwikkeling van deze wetenschap. Daarnaast is, zoals in een van de hoofdstukken is geformuleerd, herkenning een van de belangrijkste ontwikkelpunten op dit moment. Zo kan software in de komende decennia nog aantrekkelijker worden voor de gebruiker en competitiever worden in de moderne markt als het een commercieel formaat krijgt en begint te worden gedistribueerd onder een groot aantal consumenten.

Nader onderzoek kan worden gericht op de volgende aspecten: diepgaande analyse van de belangrijkste verwerkingsmethoden en de ontwikkeling van nieuwe gecombineerde of aangepaste methoden voor herkenning. Op basis van het uitgevoerde onderzoek kan een functioneel herkenningssysteem worden ontwikkeld, waarmee de geselecteerde herkenningsmethoden op effectiviteit kunnen worden getoetst.

Bibliografie

1. David Formais, Jean Pons Computervisie. Moderne benadering, 2004

2. Aizerman M.A., Braverman EM, Rozonoer L.I. Methode van potentiële functies in de theorie van machine learning. - M.: Nauka, 2004.

3. Zhuravlev Yu.I. Over een algebraïsche benadering voor het oplossen van herkennings- of classificatieproblemen // Problems of Cybernetics. M.: Nauka, 2005. - Uitgave. 33.

4. Mazurov V.D. Comités van stelsels van ongelijkheden en het probleem van erkenning // Cybernetica, 2004, nr. 2.

5. Potapov A.S. Patroonherkenning en machineperceptie. - St. Petersburg: Polytechnic, 2007.

6. Minsky M., Papert S. Perceptrons. - M.: Mir, 2007.

7. Rastrigin L. A., Erenshtein R. Kh. Methode van collectieve erkenning. M. Energoizdat, 2006.

8. Rudakov K.V. Over de algebraïsche theorie van universele en lokale beperkingen voor classificatieproblemen // Erkenning, classificatie, voorspelling. Wiskundige methoden en hun toepassing. Kwestie. 1. - M.: Nauka, 2007.

9. Fu K. Structurele methoden voor patroonherkenning. - M.: Mir, 2005.

Gehost op Allbest.ru

...

Vergelijkbare documenten

    Basisconcepten van patroonherkenningstheorie en de betekenis ervan. De essentie van de wiskundige theorie van patroonherkenning. De belangrijkste taken die zich voordoen bij de ontwikkeling van patroonherkenningssystemen. Classificatie van realtime patroonherkenningssystemen.

    scriptie, toegevoegd 15/01/2014

    Het concept en de kenmerken van de constructie van patroonherkenningsalgoritmen. Verschillende benaderingen van de typologie van herkenningsmethoden. De studie van de belangrijkste manieren om kennis te representeren. Karakterisering van intensional en extensionele methoden, beoordeling van hun kwaliteit.

    presentatie, toegevoegd 01/06/2014

    Theoretische grondslagen van patroonherkenning. Functioneel diagram van het herkenningssysteem. Toepassing van Bayesiaanse methoden bij het oplossen van het probleem van patroonherkenning. Bayesiaanse beeldsegmentatie. TAN-model voor het oplossen van het probleem van beeldclassificatie.

    proefschrift, toegevoegd 13-10-2017

    Overzicht van taken die ontstaan ​​bij de ontwikkeling van patroonherkenningssystemen. Trainbare beeldclassificaties. Perceptron-algoritme en zijn modificaties. Creatie van een programma dat is ontworpen om afbeeldingen te classificeren met behulp van de kleinste gemiddelde kwadratische foutmethode.

    scriptie, toegevoegd 04/05/2015

    Patroonherkenningsmethoden (classifiers): Bayesiaans, lineair, methode van potentiële functies. Ontwikkeling van een programma om een ​​persoon te herkennen aan zijn foto's. Voorbeelden van het werk van classifiers, experimentele resultaten over de nauwkeurigheid van de methoden.

    scriptie, toegevoegd 15-08-2011

    Creatie van een softwaretool die visuele beeldherkenning uitvoert op basis van kunstmatige neurale netwerken. Methoden die worden gebruikt voor patroonherkenning. Pandemonium Selfridge. Perceptron Rosenblatt. Regel voor het vormen van kettingcodes.

    proefschrift, toegevoegd 04/06/2014

    Patroonherkenning is de taak om een ​​object te identificeren of de eigenschappen ervan te bepalen aan de hand van een beeld- of geluidsopname. Geschiedenis van theoretische en technische ontwikkelingen in het vakgebied. Methoden en principes die worden gebruikt bij het computergebruik voor herkenning.

    samenvatting, toegevoegd 04/10/2010

    Concept van patroonherkenningssysteem. Classificatie van herkenningssystemen. Ontwikkeling van een systeem voor het herkennen van de vorm van micro-objecten. Algoritme voor het creëren van een systeem voor het herkennen van micro-objecten op een kristallogram, kenmerken van de implementatie ervan in een softwareomgeving.

    scriptie, toegevoegd 21-06-2014

    Het type en de structuur van het neurale netwerk kiezen. Selectie van een herkenningsmethode, een blokschema van het Hopfield-netwerk. Het patroonherkenningssysteem trainen. Kenmerken van het werken met het programma, de voor- en nadelen ervan. Beschrijving van de gebruikersinterface en schermformulieren.

    scriptie, toegevoegd 14-11-2013

    Opkomst van technische systemen voor automatische herkenning. De mens als element of schakel van complexe automatische systemen. Mogelijkheden van automatische herkenningsapparatuur. Stadia van het maken van een beeldherkenningssysteem. Meet- en codeerprocessen.