förstärkning – Helenas hörna

2008-09-09

Omstart

Vi har haft en lång och lat sommar, men nu är det dags att börja skriva igen! Jag ser att jag har fått en hel del träffar i dag och misstänker starkt att orsaken är att Hundtränaren 2009, ett bokprojekt som jag medverkar i, har lanserats. Jag har jämte ett flertal andra, mestadels betydligt mer namnkunniga, författare skrivit ett månadskapitel i boken/kalendern. Min text handlar om förstärkare, och jag har tidigare diskuterat några av tankarna i blogginläggen Beteenden och stimuli som konsekvenser samt Om sociala belöningar.

Så mycket träning har det inte blivit under sommaren, men nu börjar vi så smått komma igång igen. För några veckor sedan var vi på tredje träffen på klickertränarutbildningen, med tema stimuluskontroll. Och lite koll på signalerna börjar faktiskt unge herrn att få. Åtminstone ”sitt” och ”ligg” vågar jag nog påstå är hyfsat pålitliga beteenden, i de flesta situationer. Och apportering à la lydnadsklass I är i det närmaste tävlingsklart.

Gamlingen Kasper hänger fortfarande med, men det är nätt och jämnt så det blir kanske inte så länge till. Jag är tveksam till om han hör något överhuvudtaget, och det är uppenbarligen så att han ser rätt illa också. Han rör sig långsamt och styltigt, men leker fortfarande med Viktor ibland (om än rätt motvilligt), och tycker om att skutta omkring om han får springa fritt.

Några badbilder från Ångermanälven får avsluta detta höstens första inlägg:

Dragkamp om pinne — Kasper och Viktor fajtas om en pinne.

Vinst av pinne — Fjortonåringen visar att gammal är äldst ...

Språngmarsch i gröngräset — Kasper föredrar att springa i gröngräset med sin pinne.

Lapande av vatten i Ångermanälven — Varför ska de prompt dricka på ett och samma ställe när hela älvfåran är full av kallt och friskt vatten?

2008-02-22

Kreativitet och konsekvenser

Maria skriver om en upplevelse i det inflytelserika landet i väster, där hundägare för att få köpa en klicker i syfte att utdela positiv förstärkning anses behöva kompetent ledning och instruktion, medan allehanda straffredskap kan inhandlas utan någon som helst kompetensprövning. Rimligen borde det naturligtvis vara tvärtom!

Osäkerhet hos oerfarna klickertränare tar sig ibland uttryck i att att man inte vågar testa sig fram, i rädsla för att göra fel. Visserligen har tajming, kriterier och förstärkning en avgörande betydelse för resultatet, och både kunskap och färdighet behövs för att komma dit man vill – men en av de bästa sakerna med metoden, i synnerhet för oss oerfarna och klantiga hundtränare, är att den är så förlåtande. Visst, man får det man förstärker, och med fel tajming och kriterier förstärks ett annat beteende än det man tänkt sig. Men till skillnad från när man tränar med dåligt tajmade straff så förstör man inte relationen till hunden. Mekaniska färdigheter kan förbättras med träning, och i takt med att man blir bättre når man också snabbare sina mål. Så det är bara att träna på, ha roligt under tiden och inte ta sig själv på alltför blodigt allvar.

Människans tydligen aldrig sinande kreativitet i att hitta på straff åt sin bästa vän är förbluffande. Det är ju så mycket roligare att hitta på belöningar! Ett bra exempel tycker jag är denna nu något gamla tråd på Aktiv Hund, som handlar om olika sätt att leka med hunden utan leksak. Läs och inspireras!

2008-02-15

Om sociala belöningar

När jag nu har utrett den primära förstärkningens natur skulle jag vilja återvända till det här med sociala belöningar. Jag tycker att det är en mycket spännande och utvecklingsbar belöningsform, som tyvärr ofta blivit lite styvmoderligt behandlad i belöningsträning (klickerträning och locka-belöna-träning). Själv försöker jag nu att observera Viktor när han interagerar med mig under hälsande, lek, kel och annat umgänge, se vad han faktiskt gör, i syfte att bli bättre på att utnyttja sociala beteenden som förstärkare på ett systematiskt sätt. Nyckeln till det tror jag är att definiera belöningen inte utfrån det jag gör (stimulit, till exempel klappen) utan utifrån det hunden gör (beteendet, till exempel att han trycker sig mot handen och trampar med bakbenen), och samtidigt lägga märke till eller medvetet koppla beteendet till stimuli som kan användas för att få fram det i situationer där jag vill använda det som förstärkning.

Till exempel så är Viktor väldigt förtjust i att hoppa upp mot eller på mig, och jag är rätt säker på att det är ett självförstärkande beteende, det vill säga att han får ut något av själva hoppandet. Nu är inte jag lika förtjust i det, åtminstone inte i alla situationer, men i stället för att försöka få bort beteendet helt och hållet har jag bestämt mig för att försöka få stimuluskontroll på det. När jag med en armrörelse inbjuder honom att hoppa får han göra det, men inte annars, och i lämpliga situationer kan jag belöna honom genom att inbjuda honom att hoppa på mig. Vi är inte där än, kan jag tillägga, men vi är på väg! Jag tycker att han verkar ha fått bättre förståelse för att låta bli att hoppa (ha tassarna på marken) sedan jag infört en signal för hoppandet.

En typ av social belöning som ofta framställts som viktig i ”traditionell” hundträning är den mänskliga rösten, berömmet (och nu talar jag inte om ett inlärt förstärkningsord som ”bra”, utan beröm där tonfall och röstläge har större betydelse än orden). Frågan är om beröm är en primär eller sekundär förstärkare. Enligt mitt resonemang om primära förstärkare så ser jag på röstberöm (som sådant) som en sekundär förstärkare – det är ett stimulus, inte ett beteende. Samtidigt så har rösten något av en särställning, då den är så intimt förknippad med oss själva och vår närvaro, och därmed hela skalan av sociala beteenden som hunden visar mot oss. Men om rösten var en primär förstärkare för en hund så borde det vara möjligt att få den att arbeta enbart för att få höra en snutt med inspelat beröm. Det kanske är någon som har försökt? I samma ”traditionella” hundträning (åtminstone av senare datum – kanske inte i 70-talsböckerna jag refererade) framhålls att man verkligen ska se att hunden blir glad när man berömmer den, annars är det inget värt. Och då är vi ju där igen – observerbart beteende! Allt handlar om att låta beteenden förstärka beteenden! (Nämnde jag att jag var fascinerad av Premacks princip?)

2008-02-15

Beteenden och stimuli som konsekvenser

På Aktiv Hund har det på sistone varit en diskussion om olika typer av belöningar, där bland annat fördelar och nackdelar med att belöna med ”sig själv” (social belöning) jämfört med att använda olika ”yttre” belöningar (till exempel mat eller leksaker) har avhandlats. I mina ögon och för träningsbruk är det bättre ju fler användbara belöningar jag har tillgång till – det ökar förutsättningarna att variera och välja den bäst lämpade i varje situation.

Men vad är en belöning, eller, med ett lite mer vetenskapligt språkbruk, en primär förstärkare? Lite småslarvigt säger vi kanske att vi förstärker med godis, boll eller kamptrasa. Men godiset som sådant är ingen förstärkare, lika lite som bollen! Beteendet att äta godis är det däremot, och beteendekedjan att springa efter, gripa och hålla bollen (eller vad hunden nu gör med den). Jag har tidigare skrivit om Premacks princip, som ju säger att ett mer sannolikt beteende kan förstärka ett mindre sannolikt. Det jag säger nu är liksom Premacks princip fast omvänt: endast beteenden (inte stimuli) kan fungera som primära (positiva) förstärkare.

Jag tror egentligen inte att denna utsaga är vetenskapligt giltig. Bara ur ett vardagligt perspektiv kan jag tänka mig situationer när den inte gäller, eller det åtminstone är väldigt svårt att veta om den gäller eller inte. Och jag är ännu mer osäker på den vetenskapliga sanningshalten i det resonemang som följer. Men som praktiskt (okej, teoretiskt då …) träningstänk tycker jag att det fungerar. Det hjälper mig att hålla ordning på mina primära och sekundära förstärkare, och det tror jag är en förutsättning för effektiv hundträning. Det hjälper mig också att skilja mellan negativt och positivt straff.

Hur fungerar en förstärkning? De olika konsekvenserna i operant betingning definieras ju utifrån sin effekt på det framtida beteendet (förstärkning om frekvensen ökar, straff om den minskar) och om något tillförs (positivt) eller tas bort (negativt) ur situationen. Dessa saker är observerbara faktorer, oavsett om man tränar en människa eller en kackerlacka. Det betyder inte att förstärkningar och straff inte påverkar känslor (huruvida kackerlackor har känslor ska jag dock låta vara osagt)! Tvärtom är det sannolikt just genom känslorna som både förstärkningar och straff har sin verkan – det finns det numera även vetenskapliga belägg för. Och de olika konsekvenserna är förknippade med olika slags känslor. Niina och Kenth Svartberg har i Med sikte på 10:an beskrivit det som att spela på två olika känsloskalor: glädje kontra besvikelse och eventuellt frustration när man rör sig från positiv förstärkning till negativt straff, lättnad kontra obehag och rädsla när man använder negativ förstärkning och positivt straff.

Jag tänker mig att när vi jobbar med positiv förstärkning och negativt straff (PF-NS-skalan), som vi gör i klickerträning, så är det beteendet som utlöser de positiva känslorna hos hunden, och att den hindras från att utföra ett (förväntat) beteende som ger besvikelse och frustration. Alla sorters stimuli (åsynen av en godbit, ljudet från en klicker, prasslet i fickan, åsynen av träningsplanen) som förekommer i situationen och mer eller mindre pålitligt förutsäger förstärkande beteenden blir sekundära (betingade) förstärkare, och förekomsten av dessa kommer då att utlösa positiva känslor (förväntan) hos hunden även utan beteendet. Men om ett stimulus som är en sekundär förstärkare inte tillräckligt ofta följs av ett förstärkande beteende (en primär förstärkare) så kommer det att avbetingas och inte längre fungera som förstärkare.

Vi använder alltså beteenden för att påverka beteenden, och stimuli (förutom som signaler om vilka beteenden som kommer att förstärkas) som pålitliga förebud om möjlighet att utföra förstärkande beteenden.

Detta gäller inte för den andra skalan, den som går från negativ förstärkning till positivt straff (NF-PS-skalan). Där arbetar man i stället direkt med stimuli för att påverka beteenden. Det är stimulit/sinnesförnimmelsen som utlöser känslor av obehag eller rädsla hos hunden (PS), och att det upphör som gör hunden lättad (NF). Det är för övrigt svårt att utdela ett positivt straff utan att samtidigt utöva negativ förstärkning, och vice versa. Ett obehagligt stimulus med någon som helst duration kommer nämligen alltid att fungera som både och: det straffar det beteende som pågår när det startar och förstärker det beteende som pågår när det upphör. Detta är ännu en anledning att tänka sig för innan man använder korrigeringar i sin träning.

I praktiken är det naturligtvis inte alltid så lätt att skilja på sinnesförnimmelse och beteende. Vad skiljer hörandet (varseblivandet) från lyssnandet, till exempel? Varseblivandet kanske till och med är ett beteende? (Det finns säkert någon kognitionsforskare som har svar på det.) Vi människor kan utan tvivel njuta av våra sinnesförnimmelser – när vi lyssnar på musik vi tycker om, eller betraktar en vacker vy. Fast när jag observerar mig själv så tycker jag att musiklyssnande och vybetraktande är något som går utöver själva varseblivandet, ett beteende som sker inne i hjärnan. Precis som tänkande är det.

Om hundar på motsvarande sätt kan njuta av ljud, synintryck eller dofter är svårt att veta. Självklart kan det vara förstärkande för en hanhund att lukta på en löptikfläck. Men kvarstår den förstärkande effekten om han inte får utföra sitt sniffande beteende på fläcken, om han bara får uppleva själva doften? Omöjligt att säga – att och vad hunden faktiskt varseblir (även om det skulle ske genom direkt retning av luktbarken) kan vi inte veta säkert om det inte utlöser ett observerbart beteende.

Slut på de filosofiska grubblerierna! För praktiskt träningsbruk begränsar jag mig till att enbart tänka på observerbara beteenden som primära förstärkare. Och när jag funderar på hur jag ska förstärka ett beteende försöker jag att tänka på beteendet som hunden ska få (möjlighet att) utföra (springa efter bollen) snarare än ”prylen” (bollen) eller stimulit (bollkastet). Det ger mig en mycket mer exakt kunskap om vad som faktiskt är förstärkande för just min hund, och bättre möjlighet att reglera förstärkningskvaliteten.

När jag vill använda mig av negativt straff (eller utsläckning) måste jag se till att förhindra hunden från att utföra beteenden som skulle kunna förstärka (med Premacks ord: är mer sannolika än) det beteende jag vill straffa/inte förstärka. Här får man se upp så att de stimuli man använder i själva hindrandet (till exempel ett tag i halsbandet) inte uppfattas som obehagliga av hunden, och därmed blir ett positivt straff. Det kan vara lurigt tycker jag – gränsen är nog inte alltid solklar. Två sätt att förebygga att NS blir PS är att medvetet förknippa de stimuli man tänker använda med något positivt (det vill säga göra dem till betingade förstärkare), och att se till att det beteende som hunden får utföra i stället för det förhindrade, potentiellt förstärkande beteendet är något som hunden gillar och som i en annan situation mycket väl skulle kunna vara förstärkande. (Tänk på Premack igen.)

Ett avsett eller från början positivt straff kan också bli en betingad förstärkare, om det ofta följs av en primär förstärkare. Det tror jag är oerhört vanligt i hundträning, där ”små” straff eller sådant vars ”straffvärde” är tveksamt (”nej”, ”grälande”, ett peppande tag i nackskinnet eller ryck i halsbandet) ofta utdelas slentrianmässigt och man ständigt fått höra hur viktigt det är att genast belöna när hunden tar rättelse. Men att detta även kan ske med starkt obehagliga och smärtsamma stimuli som elstötar finns det vetenskapliga belägg för.

Så tänk på konsekvenserna! Konsekvensen blir kanske inte alltid den du avsett.