På Aktiv Hund har det på sistone varit en diskussion om olika typer av belöningar, där bland annat fördelar och nackdelar med att belöna med ”sig själv” (social belöning) jämfört med att använda olika ”yttre” belöningar (till exempel mat eller leksaker) har avhandlats. I mina ögon och för träningsbruk är det bättre ju fler användbara belöningar jag har tillgång till – det ökar förutsättningarna att variera och välja den bäst lämpade i varje situation.
Men vad är en belöning, eller, med ett lite mer vetenskapligt språkbruk, en primär förstärkare? Lite småslarvigt säger vi kanske att vi förstärker med godis, boll eller kamptrasa. Men godiset som sådant är ingen förstärkare, lika lite som bollen! Beteendet att äta godis är det däremot, och beteendekedjan att springa efter, gripa och hålla bollen (eller vad hunden nu gör med den). Jag har tidigare skrivit om Premacks princip, som ju säger att ett mer sannolikt beteende kan förstärka ett mindre sannolikt. Det jag säger nu är liksom Premacks princip fast omvänt: endast beteenden (inte stimuli) kan fungera som primära (positiva) förstärkare.
Jag tror egentligen inte att denna utsaga är vetenskapligt giltig. Bara ur ett vardagligt perspektiv kan jag tänka mig situationer när den inte gäller, eller det åtminstone är väldigt svårt att veta om den gäller eller inte. Och jag är ännu mer osäker på den vetenskapliga sanningshalten i det resonemang som följer. Men som praktiskt (okej, teoretiskt då …) träningstänk tycker jag att det fungerar. Det hjälper mig att hålla ordning på mina primära och sekundära förstärkare, och det tror jag är en förutsättning för effektiv hundträning. Det hjälper mig också att skilja mellan negativt och positivt straff.
Hur fungerar en förstärkning? De olika konsekvenserna i operant betingning definieras ju utifrån sin effekt på det framtida beteendet (förstärkning om frekvensen ökar, straff om den minskar) och om något tillförs (positivt) eller tas bort (negativt) ur situationen. Dessa saker är observerbara faktorer, oavsett om man tränar en människa eller en kackerlacka. Det betyder inte att förstärkningar och straff inte påverkar känslor (huruvida kackerlackor har känslor ska jag dock låta vara osagt)! Tvärtom är det sannolikt just genom känslorna som både förstärkningar och straff har sin verkan – det finns det numera även vetenskapliga belägg för. Och de olika konsekvenserna är förknippade med olika slags känslor. Niina och Kenth Svartberg har i Med sikte på 10:an beskrivit det som att spela på två olika känsloskalor: glädje kontra besvikelse och eventuellt frustration när man rör sig från positiv förstärkning till negativt straff, lättnad kontra obehag och rädsla när man använder negativ förstärkning och positivt straff.
Jag tänker mig att när vi jobbar med positiv förstärkning och negativt straff (PF-NS-skalan), som vi gör i klickerträning, så är det beteendet som utlöser de positiva känslorna hos hunden, och att den hindras från att utföra ett (förväntat) beteende som ger besvikelse och frustration. Alla sorters stimuli (åsynen av en godbit, ljudet från en klicker, prasslet i fickan, åsynen av träningsplanen) som förekommer i situationen och mer eller mindre pålitligt förutsäger förstärkande beteenden blir sekundära (betingade) förstärkare, och förekomsten av dessa kommer då att utlösa positiva känslor (förväntan) hos hunden även utan beteendet. Men om ett stimulus som är en sekundär förstärkare inte tillräckligt ofta följs av ett förstärkande beteende (en primär förstärkare) så kommer det att avbetingas och inte längre fungera som förstärkare.
Vi använder alltså beteenden för att påverka beteenden, och stimuli (förutom som signaler om vilka beteenden som kommer att förstärkas) som pålitliga förebud om möjlighet att utföra förstärkande beteenden.
Detta gäller inte för den andra skalan, den som går från negativ förstärkning till positivt straff (NF-PS-skalan). Där arbetar man i stället direkt med stimuli för att påverka beteenden. Det är stimulit/sinnesförnimmelsen som utlöser känslor av obehag eller rädsla hos hunden (PS), och att det upphör som gör hunden lättad (NF). Det är för övrigt svårt att utdela ett positivt straff utan att samtidigt utöva negativ förstärkning, och vice versa. Ett obehagligt stimulus med någon som helst duration kommer nämligen alltid att fungera som både och: det straffar det beteende som pågår när det startar och förstärker det beteende som pågår när det upphör. Detta är ännu en anledning att tänka sig för innan man använder korrigeringar i sin träning.
I praktiken är det naturligtvis inte alltid så lätt att skilja på sinnesförnimmelse och beteende. Vad skiljer hörandet (varseblivandet) från lyssnandet, till exempel? Varseblivandet kanske till och med är ett beteende? (Det finns säkert någon kognitionsforskare som har svar på det.) Vi människor kan utan tvivel njuta av våra sinnesförnimmelser – när vi lyssnar på musik vi tycker om, eller betraktar en vacker vy. Fast när jag observerar mig själv så tycker jag att musiklyssnande och vybetraktande är något som går utöver själva varseblivandet, ett beteende som sker inne i hjärnan. Precis som tänkande är det.
Om hundar på motsvarande sätt kan njuta av ljud, synintryck eller dofter är svårt att veta. Självklart kan det vara förstärkande för en hanhund att lukta på en löptikfläck. Men kvarstår den förstärkande effekten om han inte får utföra sitt sniffande beteende på fläcken, om han bara får uppleva själva doften? Omöjligt att säga – att och vad hunden faktiskt varseblir (även om det skulle ske genom direkt retning av luktbarken) kan vi inte veta säkert om det inte utlöser ett observerbart beteende.
Slut på de filosofiska grubblerierna! För praktiskt träningsbruk begränsar jag mig till att enbart tänka på observerbara beteenden som primära förstärkare. Och när jag funderar på hur jag ska förstärka ett beteende försöker jag att tänka på beteendet som hunden ska få (möjlighet att) utföra (springa efter bollen) snarare än ”prylen” (bollen) eller stimulit (bollkastet). Det ger mig en mycket mer exakt kunskap om vad som faktiskt är förstärkande för just min hund, och bättre möjlighet att reglera förstärkningskvaliteten.
När jag vill använda mig av negativt straff (eller utsläckning) måste jag se till att förhindra hunden från att utföra beteenden som skulle kunna förstärka (med Premacks ord: är mer sannolika än) det beteende jag vill straffa/inte förstärka. Här får man se upp så att de stimuli man använder i själva hindrandet (till exempel ett tag i halsbandet) inte uppfattas som obehagliga av hunden, och därmed blir ett positivt straff. Det kan vara lurigt tycker jag – gränsen är nog inte alltid solklar. Två sätt att förebygga att NS blir PS är att medvetet förknippa de stimuli man tänker använda med något positivt (det vill säga göra dem till betingade förstärkare), och att se till att det beteende som hunden får utföra i stället för det förhindrade, potentiellt förstärkande beteendet är något som hunden gillar och som i en annan situation mycket väl skulle kunna vara förstärkande. (Tänk på Premack igen.)
Ett avsett eller från början positivt straff kan också bli en betingad förstärkare, om det ofta följs av en primär förstärkare. Det tror jag är oerhört vanligt i hundträning, där ”små” straff eller sådant vars ”straffvärde” är tveksamt (”nej”, ”grälande”, ett peppande tag i nackskinnet eller ryck i halsbandet) ofta utdelas slentrianmässigt och man ständigt fått höra hur viktigt det är att genast belöna när hunden tar rättelse. Men att detta även kan ske med starkt obehagliga och smärtsamma stimuli som elstötar finns det vetenskapliga belägg för.
Så tänk på konsekvenserna! Konsekvensen blir kanske inte alltid den du avsett.