彰化翰林訓犬學校 TEL0931-503388: 2006

經常被問到你是如何訓練狗?你們的狗都那麼乖是不是都用打的?
1.談到狗狗訓練，歷史上有兩隻狗，是大家耳熟能詳的，一隻是靈犬萊西（Lassi），另一隻便是 Pavlov 巴夫洛夫的狗了，很可惜的是大部分的人不知道牠的名字。巴夫洛夫的狗所以出名是因為狗爸俄國生理學家巴夫洛夫他認為學習是一種刺激與反應的交替過程。在實驗開始之前， Pavlov 發現食物在狗的口中，狗就開始流口水，實驗者在鈴聲響後立即出現食物，使狗對聽到鈴聲會產生唾液分泌的反應。由於狗已學到將鈴聲與食物相聯結，因此縱使沒有食物，鈴聲還是能引發唾液分泌。這就是心理學上有名的「古典制約」。
要談訓練狗狗的技巧，就得從最基礎的訓練理論說起，在動物的訓練中應用最為廣泛的理論便是制約反應，制約反應可以簡單的解釋成：
>>動物學習或重複曾經被鼓勵而不被處罰的動作；不學習也不重複曾經被處罰而不被鼓勵的動作<<。
在理論的應用上出現處罰、鼓勵應用的極端與混合應用等3種型態；過去的馬戲團獅子、老虎表演時，訓獸師總是拿根鞭子，動物不做動作鞭子就抽打過去。而鼓勵應用的極致就屬海洋動物園的海豚表演，訓獸師腰間總是掛個魚袋子，海豚表演一個動作就賞飼一條魚作為鼓勵。弔詭的是兩種極端不同的方法，卻都能有效的令動物做出驚人的動作。最近在歐美興起的一種強調完全不用處罰狗狗讓狗可以主動學習的響板訓練（click-training）亦屬於制約理論中獎勵的應用。大部分的訓犬學校因有來自客戶的學習進度壓力，大都尋求軟硬兼施的有效方法，再依照狗狗不同的個性學習狀況施與比重、比例不同的獎賞與處罰。當然我也承認訓犬師良莠不齊，亂處罰狗的畢竟僅是少數。
2.古典制約是什麼？
古典制約學習（classical conditioning，Pavlovian conditioning）
• 非制約刺激（unconditioned stimulus，US）：不需經過學習就能引起反應的刺激。( 香噴噴的美食)
• 非制約反應（unconditioned response，UR）：不需經過學習就能對非制約刺激起的反應。( 流口水)
• 制約刺激（conditioned stimulus，CS）：本為中性刺激，與非制約刺激連結，能引起反應的刺激。
• 制約反應（conditioned response，CR）：由制約刺激所引起的反應。
以 Pavlov 的狗實驗為例，Pavlov 穿著實驗用的白衣進入動物房把狗罐頭（不知道當年有沒有寶路）倒進餐盤中，餐盤中的狗食對狗而言就是非制約的刺激（US），因為不需制約的程序，就可以引發狗流口水的反應，因此流口水此種因US而起的反應就是非制約反應（UR），可是有一天，Pavlov 忘了買寶路了，當他同樣穿著實驗白衣進入動物房時，他發現狗仍然有流口水的反應，於是 Pavlov 發現古典制約（classical conditioning）的形成，因為狗學到的是實驗的白衣（一個中性的刺激，S）會出現在狗食（US）之前，經過幾次配對之後，S 與 US 產生連結，變成制約刺激（CS），因此當 CS 出現時，CS 會連結到 US，US 會引發 UR，但是因為此時刺激由 CS 開始，因此此時的反應稱為 CR。（請看以下的簡圖）
US ---> UR
^
|
CS
3.網路上有很多訓練方法的討論
其中爭議最大的就是該不該處罰
一派強調不該處罰完全鼓勵, 一派認為適度的處罰較為有效(那又何謂適度?)
從理論上來說吧
操作制約是什麼？他是如何發生的？
操作制約理論－
其理論認為，大多數的行為受約制於環境，即學習有賴於操作制約。操作行為是學習來的自願性行為，不是反射性行為，也不是被強迫的。(史金納的箱子)
操作制約又稱工具性制約
增強物（reinforcerment）：
符合個體需求的刺激物，作為個體有正確反應時之獎賞用。增強指的是行為發生的頻率增高了，所以不管正增強或是負增強看到的行為發生頻率都是增加的，只是正增強是因為增強物的出現，負增強是因為增強物的移除。
1.正增強：行為表現後得到酬賞，行為也因之強化，此酬賞為正增強。例：索取統一發票（行為）中大獎（正增強），以後每次購物皆會要統一發票。
2.負增強：行為表現後即終止所厭惡的刺激，行為得到強化，此厭惡的刺激為負增強。
例：戴太陽眼鏡後（行為），陽光不再刺眼（厭惡的刺激），大晴天一出門立即戴上太陽眼鏡。
3.處罰：給個體厭惡的刺激（正處罰）或取消酬賞物（負處罰），以削弱行為。
例：男頭綁紅絲帶被取笑（處罰），不再綁紅絲帶（行為消失）。
ㄧ般人很容易將處罰與負增強搞混而不自知，在更清楚的區分:處罰會使行為停止，處罰的瞬間會暫停行為繼續進行。負增強可以繼續出現該行為，因為出現該行為可以停止厭惡的刺激。
處罰在實施上有兩個重要的意義，如果無法達到這2個要求我們寧可尋求其他方式
1明確的讓狗狗知道這個行為是主人所不悅的.常常有犬友當狗狗做錯事的時候用溫柔的語調罵狗狗：你不乖ㄛ、、、、、。這種溫柔的語調彷彿在鼓勵狗狗。
2在極短的時間內或極少的練習次數，讓處罰變為負增強。我常常要學員伸出手掌後我迅速打下（處罰），再要求學員伸出手掌，再迅速打下，幾次之後學員了解到手掌迅速移開（行為）可以避免被打到（處罰）。（手掌迅速移開）是我們想要訓練得到的動作，行為因負增強得到強化，因而學會單一動作，至此為第一階段。第2階段如果（處罰）繼續加強而學員少有機會避免則多數學員便不再伸出手掌終止練習，這便是所謂（迴避學習）
＊＊棒下出孝子？不打不成器？這種說法被主張訓犬應適度體罰派奉為圭臬，但卻沒考慮到　　處罰可能帶出避開處罰的行為；
迴避學習（avoidance learning）：在經歷厭惡刺激的痛苦後，個體學到在厭惡刺激出現之前逃離現場，以免遭打擊。常常看到負增強應用不當的狗狗一有機會便逃離現場。一位有經驗的訓犬師於應用負增強訓練時，會在狗狗達到第一階段時轉而給予鼓勵（正增強）來強化學習效果及避免發生迴避學習。
4.南下高雄巧遇某位犬友，提及他的3個月小邊界非常聰明，坐、臥、跳(25公分高)握手都會，就只有等待STAY一直教不會。他說：他先要狗狗坐下等待2、3秒後立刻給予鼓勵，練習ㄌ1星期時間一直無法加長到等一分鐘，後來他加入處罰的方式，狗狗坐下等待後如果一移動就立刻怒斥並把他捉到茶几罰站罰到兩腳發抖才罷休，說實在我的小邊界還真聰明(飼主自以為是洋洋得意的說)，幾天的練習之後，如果他等不住一移動我怒斥他，他便知道坐錯事ㄌ會自動到茶几處等我罰他站。可是等待的時間一直無法增加？
>天ㄚ！！又是一個用人類想法來看待狗狗的世界的無知犬主。可憐的小邊界被自以為是的主人罰站到2腿發抖。
>制約學習的發生有所謂連續性（continuity）與關連性（contingency）？兩者的差別為何
>張三與李四分屬A、B兩公司的水昆級(混)員工，於同一棟大樓上班。每天5點一到張三便箭步衝出大樓，接著便是李四出大樓下班，兩個人的出現具有連續性，但是未必具有關連性。又譬如李四跟王二是舊識，李四經過守衛室時總會跟守衛王二痲子打招呼。王二跟李四打招呼的動作這兩件事就有關連性。因為只有李四走出大門口王二才會寒喧。
>同樣的小邊界再訓練時，等待後亂動便被怒斥和罰站，移動和罰站兩件事，雖有連續性，但卻沒有關連性【讓我們來想想大部分的時間裡小邊界追趕跑跳碰也沒被罰站，因此更難產生關聯性】，小邊界在多次的配對解讀後，把怒斥和罰站配對成關聯性的命令動作，所以主人怒斥他，他便知道自動到茶几處罰站。
>
>每次在心理學裏提到學習，就會講那隻流口水的狗。雖然很早的人就知道某些事情之間彼此有連結，例如閃電與打雷，而那隻狗為什麼有名，就是因為 Pavlov 將這種連結現象以實驗來呈現出來。（試試看其他的配對：蘋果會想到誰？風箏呢？浴缸呢？）
5.談狗狗訓練 - 經典實驗
povlov找了一隻狗，放進分成A、B兩區導電板的狗籠中。一開始，當狗停留再A區時，A區通電B無，狗狗在A區受到電擊一度驚慌失措，緊張的跳動，不經意中跳到B區脫離ㄌ電擊的疼痛。再將停在B區的狗狗通電A區無，狗在B區受到電擊緊張的跳到B區脫離ㄌ電擊的疼痛。經過幾次的配對練習，狗狗清楚的了解到---只要A有電立刻跳到B區；如果B有電立刻跳到A區以避免電擊。
再找一隻對照組的狗狗實驗，放入整個狗籠都通電的狗籠中，
通電時，一開始狗狗受到電擊相同的驚慌失措，緊張的跳動，幾分鐘之後狗狗無助的停ㄌ下來，默默的承受痛苦，在經過幾次的配對練習，只要一通電狗狗都只有無助默默的承受痛苦不再跳動以求掙脫。再將這隻狗狗放入分成AB區通電的狗籠中，狗狗一受到電擊都只有無助的停住不動，經過再多次的練習有無法學會跳到另一區即可脫離痛苦。
由以上的實驗得之以下的結論：個體被制約不產生行為，表現出對環境完全無法控制，對未來要發生的事情亦無法預測，甚至放棄一切，以逃避負面增強。這種絕望的心境是由制約學習來的，故稱為「習得的無助感」Learned helplessness。
大家都有幫小狗狗帶上頸圈的經驗，第一次小狗狗總是不舒服的努力掙脫，如果你是個盡責的狗爸狗媽盡心的安撫受驚嚇的小狗狗，幾次練習後狗狗都能欣然的接受頸圈；萬一、如果、假設、也許、IF【與未來事實不同的猜測】第一次你就很不幸地被狗狗脫逃，那麼在未來的日子裡這些戲碼將會不定時的重演。
有些人會有以下的困擾，狗狗會趁你不注意時咬斷你綁住他的牽引繩，因而成為用品店的常客。
小時候去看馬戲團表演，非常好奇，那麼大隻力量那麼大的大象要用多大多粗的籠子才關得住牠，想不到吧！馬戲團綁住大象只用細如小指頭的麻繩綁著牠的前腳，再用搭帳棚的營釘釘在地上。當時年紀小也只覺得訓獸師真厲害把大象教的伏伏貼貼，也不知原來訓獸師是用制約反應(習得無助)來控制大象的行動。
有個寓言故事，大概是說：有個馬戲團失火ㄌ，聰明機靈的猴子，解開了自己的籠子，還趕緊將其他動物的籠子打開，幫其他動物逃離火海，就再大家慶幸逃過一劫時，發現大象沒逃出火海，當時已經火海一片無法進入火場救人，大家在火場外呼喊大象的名字，忽然聽到大象驚慌的呼喊：SOMEBODY HELP ME（大象上了幾年的何嘉仁美語）。大家用力的喊著：火太大ㄌ，你的腳只有細繩綁著，用力一拉就斷ㄌ，快點跑出來吧。只聽到大象回答：不行我的腳被綁住，誰快來就我幫我解開繩子，愈來愈微弱的救命聲大象呼喊著。現代的父母不也經常告誡小孩這不行那不行一大堆不行，無形中抹殺主動學習、自主反應的能力。
在上述經典實驗中經過配對學會：「只要A有電立刻跳到B區；如果B有電立刻跳到A區以避免電擊」的狗，我們在每次電擊之前先加入一個燈光閃爍訊號，數次的配對之後，我們僅只有閃燈而不加以電擊，卻可以看到只要燈光一閃狗狗立刻跳往另一區；即原本狗在A區燈光一閃狗狗立刻跳往B區，狗在B區燈光一閃狗狗立刻跳往A區。這便是負增強應用來訓練犬隻的理論基礎。

星期四, 十二月 21, 2006

談狗狗訓練

星期四, 七月 06, 2006

瑪莉諾種母貝獅**Dassi VD. Berlex-hoeve

我的简介

Links

星期四, 十二月 21, 2006

談狗狗訓練

星期四, 七月 06, 2006

瑪莉諾種母 貝獅**Dassi VD. Berlex-hoeve

瑪莉諾種母貝獅**Dassi VD. Berlex-hoeve