Luriga tankar om lockande och andra hjälper

När jag nu har kommit in på det här med ord så vill jag lufta en sak som har stört mig ända sedan jag började komma in litegrann i klickervärlden och dess jargong. Det gäller ”locka-lura”. Det används i två lite olika betydelser: dels om hela den träningsmetod som bygger på att man lockar hunden (ofta med en godbit eller annan belöning) till ett beteende som man sedan förstärker positivt (genom att den får belöningen), dels mer specifikt om just den typen av belöningshjälper.

Det jag stör mig på är ”lura”. Om man tror att metoden går ut på att lura hunden så tar man grundligt miste, och är dömd att misslyckas om man försöker sig på den. Man lurar hunden om man till exempel lockar den till sig med en köttbulle (eller en boll) som man stoppar i fickan när man väl har fått tag på hunden. Det man håller på med då är avlärning – hunden lär sig att när matte håller upp en köttbulle lönar det sig inte att gå fram till henne, då det enda som händer är att den får avbryta en rolig aktivitet. Det som formar och upprätthåller beteenden är att de förstärks och bara det, aldrig någonsin de stimuli som utlöser dem. Vilket alla goda djurtränare (inte bara klickertränare) vet.

Jag tror bara att jag har hört klickertränare tala om locka-lura – det är alltså inte ett uttryck som används av de tränare som själva använder metoden. För säkerhets skull gjorde jag en koll på Google, och fann att av de första 40 träffarna på ”locka-lura” och ”hund” som verkligen berörde hundar så handlade 39 om klickerträning (där locka-lura nämndes som något man gjorde förut eller som inte är så bra att hålla på med).

Det är inte så svårt att gissa hur det svenska ordet ”lura” har hamnat i begreppet – naturligtvis är det ljudlikheten med det engelska ”lure” som påverkar. Men även om ”lure” visst kan betyda ”lockbete” (som substantiv) och ”lura” (som verb) så tycker jag (av ovan angivna skäl) att ”lockelse” respektive ”locka” är bättre svenska motsvarigheter i det här sammanhanget. Och när det gäller metoden: vad hände med ”reward”? Mitt förslag är att man på svenska kallar den träningsmetod som på engelska går under benämningen ”lure-reward training” för locka-belöna-träning. Då får man med både hjälpen och belöningen, det vill säga det som händer såväl före som efter beteendet man tränar, och metoden fokuserar ju faktiskt på båda.

Belöningsträning är ett annat tänkbart begrepp, men det tycker jag passar bättre som en sammanfattande benämning på all träning som baserar sig på positiv förstärkning, där locka-belöna-träning och klickerträning kan sägas vara olika underkategorier.

När det gäller typen av hjälp så föredrar jag att kalla den locka-visa, fortfarande med motiveringen att hjälper som går ut på att lura hunden motverkar sitt syfte och bara får hjälpen att sluta fungera. Förutom direkta belöningshjälper (till exempel en godishand) inkluderar jag i locka-visa andra större eller mindre åtbörder där man med hjälp av kroppsspråket ”visar” hunden vad den ska göra. Och till skillnad från många andra klickertränare så anser jag att locka-visa-hjälper har sin givna plats i klickerträningen, som ett av flera verktyg att få fram ett beteende som kan förstärkas.

Locka-visa framställs ibland som något ”naturligt”, något som hunden förstår av sig själv utan föregående inlärning. Så är det inte. Ytterst få retningar som vi använder som hjälper i hundträning är inte i någon mån inlärda, även om många naturligtvis bygger vidare på medfödda beteenden. Att följa en godishand är ett inlärt beteende likaväl som ett targetbeteende är det, och detsamma gäller att följa våra kroppsrörelser. Vi kanske inte har behövt lägga ner någon medveten träning på att få det att fungera, men inlärt är det ändå, genom att beteendet har förstärkts. Ett exempel på en lockhjälp som ofta kräver en inlärningsperiod (om än kort) innan den fungerar som avsett är den klassiska L-rörelsen för att få hunden att lägga sig ner.

Jag är helt med på att lockande, i synnerhet med synlig belöning, kan ha oönskade bieffekter. Vilken eller vilka metoder man väljer för att få fram ett beteende har betydelse för resultatet, på kort men kanske framför allt på lång sikt. Hjälpen som sådan är förstärkande, och man riskerar att förstärka passivitet och därmed hämma den kreativitet hos hunden som är en sådan tillgång för effektiv klickerträning. Hjälper ska hanteras med omdöme – man måste tänka på hur ofta, hur länge (vid inlärningen av nya beteenden) och på vilket sätt man använder hjälpen. Framför allt ska man alltid ha en plan för att arbeta bort hjälpen, och se till att man belönar det frivilliga beteendet innan man lägger på signal. Men detta gäller alla hjälper, i lägre eller högre grad, och alls inte bara locka-visa. Därför tycker jag att man begränsar sig i onödan om man av princip utesluter en viss typ av hjälp ur sin klickerträning.

Nu har jag ägnat nästan ett helt blogginlägg åt hjälper, alltså det som kommer före beteendet vi vill förstärka. Klickerträning som metod fokuserar ju på förstärkningen, konsekvensen, som är det som faktiskt påverkar beteendet. Ändå tycker jag att det i forumdiskussioner och liknande, även när det är klickertränare som diskuterar, tenderar att bli väl mycket slagsida mot hur man ska få fram ett beteende: vilken metod eller vilka hjälper man kan/ska använda, och vad man inte bör göra. Det är tasstarget hit och omvänt lockande dit, när det vi borde koncentrera oss på är de grundläggande och avgörande faktorerna tajming, kriterier, förstärkningsfrekvens och förstärkningskvalitet (TKFF), som alla har med förstärkningen (det som kommer efter beteendet) att göra.

Och kanske är det inte så konstigt, för inlärningens lagar fungerar ju också på oss människor. Vi funderar på vad det är för beteende hos oss (vilken hjälp) som snabbast utlöser det beteende vi vill ha av hunden, det vill säga snabbast leder oss till belöningen. Vårt egentliga mål, att det utlösta beteendet efterhand ska bli starkare och mer frekvent, ligger längre fram i tiden och utgör därför en inte fullt lika omedelbar, om än säkert kraftigare, förstärkning. Därför tycker jag att shejping är en så fantastisk metod att arbeta med. Genom att hela tiden fokusera på de små, små stegen snarare än ett färdigt beteende ser jag till att både hunden och jag hela tiden förstärker varandra. Och eftersom jag inte behöver ägna så mycket uppmärksamhet åt de där besvärliga hjälperna kan jag lägga maximalt med fokus på de viktiga TKFF (vilket är mycket nog för mig). Ett lyckat shejpingpass gör mig verkligen glad i hela kroppen!

Shejping, stimuluskontroll och baklängeskedjning

Efter två intensiva dagar på kurs i avancerad klickerträning med Maria som instruktör känner jag mig helt slut i huvudet. Viktor är också trött, men faktum är att jag tror att jag är tröttare!

Trots namnet ”avancerad” så började Maria gårdagen med att gå igenom förutsättningarna för effektiv klickerträning, för som hon så riktigt påpekade: som klickertränare, oavsett nivå, har man alltid anledning att gå tillbaka till, och framför allt träna på, grunderna.

Anledningen till att jag alls vågade anmäla mig till en kurs med det namnet var beskrivningen av förutsättningarna för att ha utbyte av den: hunden skulle ha lätt att erbjuda beteenden spontant utan hjälper, och den skulle kunna koppla av i bur mellan träningspassen (eftersom kursen hölls i en ganska trång lokal inomhus). Båda förutsättningarna uppfylldes med råge av Viktor, kan jag konstatera. Det jag möjligen hade oroat mig lite för (åtminstone när jag anmälde mig i höstas) var det där med vilandet i buren, men han har verkligen varit som en dröm och kopplat av totalt inne i buren. Till och med när flera av de andra hundarna skällde för att det kom in någon genom dörren höll han tyst och kikade bara lite nyfiket ut genom burdörren. Min vanligen så skälliga hund!

Annars så anser jag mig på intet vis vara en ”avancerad” klickertränare, och helgens kurs har gett mig ännu en påminnelse om att jag verkligen inte är det. När det gäller praktiska färdigheter så har jag nätt och jämnt kommit förbi det absoluta nybörjarstadiet. Men genom träning blir man bättre, och inspiration till att träna och bli bättre har jag verkligen fått massor av. ”Träning är en mekanisk färdighet”, som Bob Bailey säger. Jag skulle nog vilja tillägga att det även är en mental färdighet, i synnerhet när det gäller den viktiga förmågan att sätta kriterier på rätt nivå. Och det mentala och det mekaniska hänger intimt samman, förstås.

Första uppgiften med hundarna var en diskrimineringsövning: vi skulle shejpa fram en markering av ett speciellt föremål bland tre. Eller i varje fall börja – jag vet inte om det var någon som hann hela övningen. Vi gjorde det i varje fall inte, men vid dagens slut hade jag nästan nått målet för del 1 av övningen, nämligen själva markeringen av det ”heta” föremålet.

Vi arbetade i grupper om tre (två hundförare och en observatör) och varvade mellan att träna de båda hundarna och observera och föra logg åt varandra. Jag valde att lära Viktor markera locket på en liten glasburk genom att hålla nosen på det i upp till 5 sekunder. Återigen blev det pinsamt tydligt hur frestande och lätt det är att sätta för höga kriterier, kanske i synnerhet alldeles i inledningen av träningen av ett nytt beteende. Med hjälp av en kombination av alltför höga kriterier, taskig tajming och ostrategisk placering av mig själv hade jag på några minuter shejpat fram ett välta-burken-med-nosen-och-krafsa-på-den-med-tassen-beteende som absolut inte var vad jag ville ha, trots att jag samtidigt belönat en massa lyckade utföranden.

Efter att ha fått lite tips av Maria och mina träningspartners lyckades jag arrangera situationen så att kriterierna blev möjliga att uppfylla med hänsyn till 80%-regeln (att minst 80% av repetitionerna ska vara lyckade, det vill säga uppfylla kriteriet, där varje annat beteende räknas som ”skräpbeteende” och därför en misslyckad repetition). Viktor tryckte nosen mot burken gång på gång, och min burkhållare utstötte små förtjusta ”åh”, för han såg verkligen ganska näpen och samtidigt lite smådum ut, så fullständigt koncentrerad på sina nostryckningar.

Så här i efterhand kan jag naturligtvis, hur enkelt som helst, se att det självklart var så jag skulle riggat situationen från första början. Vi har ju faktiskt tränat en del på nostarget mot en yta (förutom mot en punkt som en targetsticka och min näsa), men alltid bara mot en vertikal sådan. Om ytan varit horisontell har det varit tasstarget som varit det önskade beteendet. Men jag kom liksom inte på möjligheten att göra det lättare för min hund genom att placera burken en bit upp i luften och med locket riktat åt sidan, utan ställde ner burken på golvet (som dessutom var halt) och tyckte att jag satt ett lågt kriterium när det första var att han skulle titta på burken. Men jag fick snabbt mycket mer än så, och även om nospekandet fanns med där så lyckades jag upprepade gånger oavsiktligt klicka för tasskrafsande också.

När jag väl fått till kriterierna blev också min tajming oerhört mycket bättre. Jag fick flyt i övningen och rörde mig stadigt framåt under de återstående träningspassen. Det där med flytet kändes så skönt. Även om jag ibland kan få till det när jag tränar hemma i min ensamhet (tycker jag, i alla fall) så har jag när jag tidigare varit på klickerkurs bara känt mig fipplig och oskicklig. Det har räckt med någon enstaka ny komponent, eller att jag ska försöka göra något på ett sätt som jag vanligtvis inte brukar, för att jag ska bli totalt osynkad och grovt okoordinerad. Att jag faktiskt fick till flytet i går ser jag som ett bevis för att jag trots allt rör mig lite framåt i mina tränarfärdigheter.

I dag har vi ägnat oss åt övningar i stimuluskontroll och baklängeskedjning. Där har vi en del att träna på, kan man lugnt säga! Jag trodde att jag hade hyfsad stimuluskontroll på ”sitt” och ”ligg”, men i den här miljön (och med solbrillor och scarf för mun och näsa på matte …) var det, om än inte som bortblåst (för det mesta gör han vad jag ber honom om, snabbt och säkert), ja, inte under kontroll i varje fall (han gör det också tusen gånger däremellan).

För baklängeskedjningen valde jag möjligen en lite för svår uppgift, då delarna inte var riktigt färdiga. Som sista led i kedjan hade jag att han skulle gå in i buren och lägga sig, och det gjorde han bra, men han kunde inte riktigt vänta på signal, så när jag försökte lägga på det näst sista ledet, att stoppa huvudet i en kruka, fungerade inte ”buren” som en förstärkning och tillåtelse att göra sista ledet. Vi ändrade till att han fick gå frivilligt in i buren – när han gjorde näst sista ledet öppnades helt enkelt burdörren så att det blev möjligt. Det var bara det att han med huvudet nedstoppat i krukan hade lite svårt att uppfatta när burdörren öppnades … Men han jobbade och tänkte som sjutton, och hade vi hållit på lite till hade han nog knäckt det. Jag fick också fram fina spontana snurranden som jag hade tänkt ha som första led i min kedja, men så långt hann vi aldrig.

Sammanfattningsvis så skulle jag nu behöva ha en vecka ledigt för att verkligen följa upp och ta vara på inspirationen från helgen. Det har jag tyvärr inte.

Lydnad i upplyst mörker

Lydnaden har, till skillnad från många andra hundsporter som kräver tillgång till marker eller speciell utrustning, fördelen att den kan tränas lite var som helst. I synnerhet i stan finns det många platser som kan utnyttjas för ett lydnadspass, som ett litet avbrott på promenaden eller en längre stund. Så här års är man förstås lite begränsad av mörkret, åtminstone om man är tvungen att ägna sig åt andra saker under den ljusa delen av dygnet. Då behöver man någon form av belysning.

Jag är verkligen inte förtjust i det nuvarande mildvädret – jag hade mycket hellre haft kyla och snö – men det finns en fördel och det är att de planer som brukar spolas till isbana på vintern står isfria och till förfogande för hundträning. Jag har en sådan alldeles nästgårds, på Malmaskolans fotbollsplan. Förra torsdagen tränade vi där tillsammans med Karin och Tuva, och Karin visade mig var man tänder, så nu kan jag träna där när jag vill (så länge den inte är upptagen vill säga).

Den här veckan har varit helt hysterisk, men i kväll tog jag mig äntligen samman och fick till ett riktigt träningspass utomhus. Det kändes lyxigt att kunna gå ut klockan halv tio och träna på en stor strålkastarbelyst grusplan!

Vi tränade en del på att byta beteende. Viktor är duktig på att bjuda på olika beteenden för att få mig att klicka – han är utan tvivel ”klickerklok”. I viss mån är han också ”repetitionsklok” (upprepar ofta det beteende som senast gav klick och belöning), men han har vissa problem med att upphöra med ett beteende som inte ger utdelning, det vill säga, han är inte särskilt ”felklok” (”mappklok” ska vi inte tala om).

Att vi inte har kommit längre med detta beror naturligtvis på att jag har svårt att få ordning på mina signaler och kriterier. Jag har också kommit på att jag nästan drar mig för att växla beteendet vi tränar på, för när Viktor väl har ”fäst” på det vi håller på med går det oftast riktigt bra, och det blir förstås väldigt förstärkande för mig. Så jag har fått en uthållig hund som kan hålla på länge med samma sak, men när jag vill ha bara en eller några få repetitioner i följd av varje beteende (om det inte är på signal) börjar han antingen blanda hej vilt eller pipa och gnälla i frustration över att han inte får något för det han har bestämt sig för att det bara måste vara (de senaste dagarna har det varit backa).

Jag har sedan en tid infört en signal (en speciell gest och en fras) för att byta beteende. Den skiljer sig från min felsignal (som är en signal om att ett visst beteende inte kommer att belönas den här gången, så hunden kan lika gärna prova något annat) på det viset att jag ger den redan i samband med att jag belönar hunden för det beteende vi ska byta från, det vill säga innan den ens har hunnit påbörja nästa repetition. I går och i dag har jag tvingat mig själv att träna lite mer systematiskt på detta, och kanske tycker jag att det gick något lite bättre i kväll.

Däremellan tränade vi inkallning. Jag har nyligen infört signalen ”hit”, som ska vara vår tävlingsinkallningssignal (jag har ”kom” för vardagsinkallningen som jag inte är fullt lika noga med högsta tempo på), och satt ihop själva inkallningen med sittande beredskap (signalen för det är ”beredd”). Detta var tredje gången vi tränade på det, i den här formen – jag har tidigare förberett genom att träna explosiva starter till en kamptrasa som jag lockar med från ”frivilligt” sittande. Viktor var ruskigt taggad, så jag fick riktigt bra tempo. Jag avancerade genom att förlänga sträckan tills klicket kom, och växlade mellan att belöna med godis hos mig och en fantastiskt rolig studsboll som jag slängde i riktning bakåt.

Viktor sitter så stadigt, så stadigt, och startar som en kanonkula. Det är häftigt att se, och jag hoppas att det betyder att han begriper att det bara är när han sitter som han har chans att få signalen ”hit”. Om jag hade tränat detta på ”gammalt” sätt hade jag förmodligen gått tillbaka och belönat minst lika många gånger som jag kallat in, för att motarbeta tjuvstarter. Men nu betyder ”beredd” att han ska vara beredd att springa, och han kommer att få göra det under förutsättning att han väntar på signalen. Signalen ”hit” förstärker sittandet. Och det ser verkligen ut som det fungerar – jag har kört massor av repetitioner på rad och han sitter lika stadigt varje gång.

För er som undrar hur det går med lydnadsutmaningen så är det här första ansatsen till att överhuvudtaget sätta ihop några (del)moment. Det är kanske det enklaste momentet, och det är inte ens ett helt moment. Jag måste träna mer på ingångarna innan jag kan baklängeskedja hela inkallningen. Sedan har vi de andra, mer komplicerade momenten som lär ta betydligt längre tid att få till och sätta ihop … Men under tiden har vi ju roligt, och lär oss en massa båda två.

Beteendeobservationer

I dag gjorde jag ett tredje försök att genomföra den observationsövning som är en av hemuppgifterna inför nästa helgs kurs i avancerad klickerträning hos Maria. Uppgiften går ut på att man observerar hunden under 20 minuter då den får göra vad den vill, och en gång i minuten antecknar vilket beteende hunden just då utför. Observationspasset upprepas vid tre tillfällen, och resultatet sammanställs till en tio-i-topp-lista på hundens vanligaste beteenden.

Jag gjorde det första försöket under julledigheten, men det stupade på att det hela tiden kom folk och hundar gående på såpass kort avstånd att jag inte vågade låta Viktor gå omkring helt fritt, utan till exempel ropade honom till mig eller höll honom i halsbandet en stund. Efter några omstarter gav jag upp och gick hem, och tänkte att det fanns ju gott om tid att göra det någon annan dag under ledigheten, på något lugnare och ensligare ställe. Vi var nästan inte i Uppsala alls under jul och nyår, utan tillbringade en del tid på just lugnare och ensligare (nåja) ställen. Men något mer försök lyckades jag nu inte få till – vart tog tiden vägen?

I går gjorde jag därför ett nytt försök, men då blev det så mörkt att jag inte kunde vare sig skriva eller observera ordentligt, och gav upp för den sakens skull.

Men i dag då. Nu hade jag bestämt mig för att det bara skulle gå. Jag tog Viktor med ut i Hågadalen, där jag också gjort de första två försöken, men tog stolsryggsäcken med för att kunna sätta mig ner var som helst, utan att behöva leta upp en sten att sitta på. Sedan gick jag ut på ett fält där jag inte väntade mig att det skulle passera några människor, och tog ut avståndet från vägar och stigar såpass att jag inte trodde Viktor skulle våga sig så långt bort från mig. Även denna kulna, regniga januaridag dag var det nämligen rätt många som var ute och promenerade, sprang eller red i området. Och så satte jag mig ner på ryggsäcken och tog fram mitt anteckningsblock.

Själva situationen var ganska ny för oss. Till största delen har jag när jag varit ute och haft Viktor lös varit i rörelse själv och serverat rikligt med aktiviteter som belöning för bra beteenden (att han tar kontakt eller kommer till mig till exempel). När jag har suttit eller stått stilla på en och samma plats (något som jag dessutom gjort alldeles för lite) har jag för det mesta haft honom i koppel, om vi inte har ägnat oss åt någon specifik träning eller aktivitet (såsom hundlek).

Det hela var både lärorikt och intressant – jag kan verkligen rekommendera alla att göra liknande observationsstudier av sina hundar. Jag antecknade förutom beteendet varje hel minut lite löst vad han gjorde däremellan, och noterade varje gång han tog kontakt med mig.

Jag ”fuskade” en gång, då Viktor vid ett tillfälle sökte sig närmare hundra meter bort från mig, och det kom en stavgångare på vägen som han då hade mycket närmare till än till mig. Han är visserligen inte så modig av sig, men jag hade ändå inte riktigt is i magen utan ropade på honom, och belönade med godis när han kom. Men i övrigt följde jag instruktionerna för uppgiften (”om hunden spontant tar kontakt med dig får du svara, men bli passiv igen inom en minut”).

Resultatet av observationerna då? Ja, jag kan för det första konstatera att Viktor föredrar att hålla sig relativt nära mig även när jag är passiv. Med undantag för ovannämnda utflykt (som totalt tog ca två minuter i anspråk) växlade han mellan att springa iväg ca 10 till 20 meter och komma till mig där jag satt. Han kom fram och tog kontakt (föreföll förvänta sig godis eller någon aktivitet, och hoppade upp och pussades några gånger) ungefär varannan minut. Ibland stannade han vid mina fötter ett tag, uppemot en minut, men oftast varade kontakterna kanske 10–15 sekunder.

Jag ska göra övningen två gånger till innan jag sammanställer resultatet, men en inte alltför vågad gissning är nog att ”nosa” i någon form kommer att hamna överst på tio-i-topp-listan, lite beroende på hur jag väljer att klassificera de olika beteendena (nosa i rörelse och nosa på en specifik fläck kanske ska vara två olika beteenden, till exempel).

Vid det avbrutna observationsförsöket i går lät jag Viktor ha en boll (som vi lekt med och han sedan burit på under promenaden dit), och det gav mig idén till en annan observationsövning, nämligen att låta hunden välja leksak. När jag nu ändå var igång med pennan och anteckningsblocket gick jag vidare med den. Kanske skriver jag mer om den senare, för den var också intressant.

Vad är då syftet med detta, förutom att det tillfredsställer en allmänt nyfiken och kategoriserande person som mig? Att veta vilka beteenden som hunden väljer oftare än andra är mycket användbart. Klickerträning (och för den delen all träning/ beteendemodifikation, det är bara det att man i klickerträning medvetet gör bruk av principen) baserar sig i stor utsträckning på Premacks princip. Ett beteende, vilket som helst, som i en viss situation är mer sannolikt än ett annat kan användas för att förstärka ett mindre sannolikt, men önskvärt, beteende.

Det är en enkel och samtidigt fascinerande princip, men inte alltid lätt att tillämpa. För att lyckas behöver man hela tiden ha en känsla för beteendehierarkin, som givetvis skiftar beroende på hundens motivation (en hungrig hund får ätbeteendet högre upp i sin hierarki, för att ta ett enkelt exempel) och tillgängliga alternativ. Men om man lär sig behärska principen har man ett mycket effektivt verktyg för att påverka beteenden, och antalet möjliga förstärkare blir oändligt – det gäller ”bara” att veta i vilka situationer man kan utnyttja dem.

Att bli bättre på att observera beteenden och använda Premacks princip i den vardagliga hundträningen hör till mina personliga mål för året.