Портал освітньо-інформаційних послуг «Студентська консультація»

  
Телефон +3 8(066) 185-39-18
Телефон +3 8(093) 202-63-01
 (066) 185-39-18
Вконтакте Студентська консультація
 portalstudcon@gmail.com
 facebook.com/studcons

<script>

  (function(i,s,o,g,r,a,m){i['GoogleAnalyticsObject']=r;i[r]=i[r]||function(){

  (i[r].q=i[r].q||[]).push(arguments)},i[r].l=1*new Date();a=s.createElement(o),

  m=s.getElementsByTagName(o)[0];a.async=1;a.src=g;m.parentNode.insertBefore(a,m)

  })(window,document,'script','//www.google-analytics.com/analytics.js','ga');

 

  ga('create', 'UA-53007750-1', 'auto');

  ga('send', 'pageview');

 

</script>

Інструментальний та класичний умовний рефлекс

Предмет: 
Тип роботи: 
Контрольна робота
К-сть сторінок: 
57
Мова: 
Українська
Оцінка: 
Вступ 
 
Більшість вироблених нами дій залежить не від цих вроджених механізмів, а від досвіду, що набувається протягом усього життя. Іншими словами, людина учиться. Вона вчиться тримати пляшечку з соскою, читати і писати, любити і ненавидіти людей зі свого оточення і зрештою зіштовхуватися зі смертю. В інших живих істот роль научіння може бути не настільки яскраво вираженою, але і для них вона надзвичайно важлива.
З точки зору теорії Декарта про організм як рефлекторну машину, поведінка залежить від вроджених зв'язків між визначеним набором нервових посилань, що запускаються зовнішніми стосовно організму стимулами, і набором команд, що направляються до м'язів і залоз. Чи можемо ми дотримувати цієї простої схеми і співвіднести з нею здатність організму до научіння? Безліч дослідників, які вважаються теоретиками научіння, впевнені, що можемо; організм народжується, стверджують вони, з обмеженим репертуаром тісно переплетених між собою рефлексів, але цей набір може бути доповнений шляхом научіння. У деяких випадках научіння створює нові зв'язки між стимулами. Так, наприклад вид материнського обличчя може набувати значення смаку молока. В інших випадках научіння прокладає нові зв'язки між діями і їхніми наслідками, як, наприклад, у випадку, коли дитина, яка робить перші кроки, приходить до розуміння того, що за дотиком до гарячого радіатора слідує хворобливий опік. У будь-якому випадку, однак, базова система залишається колишньою, а стимули, що розрізняються, викликають визначені реакції. Дослідницький інтерес, таким чином, полягає у визначенні того, наскільки часто відбувається перестановка компонентів у таких зв'язках.
Вивчення наукових концепцій вносить істотний вклад у розширення нашого розуміння предмета, причому особливий розквіт розробки теоретичної бази припадає на першу половину XX в. Певною мірою це стало відображенням інтелектуального і політичного клімату того часу: це були роки, коли в суспільстві панувала думка, що кожна людина здатна поліпшити своє життя, прикладаючи досить зусиль і опановуючи нові навички. Було поширене переконання в тому, що людина значною мірою піддається вихованню й удосконалюванню, якщо вдається забезпечити належні зміни в оточенні й в утворенні. При такому підході зовсім не дивно, що тема  вивчення стала центром уваги американських психологів.
Як же варто підходити до дослідження процесу научіння? По крайній мірі спочатку, більшість учених вважали, що існують деякі базові закони, що діють незалежно від того, хто навчається і що він вивчає — чи то собака, що вчиться сідати по команді, чи студент коледжу, що вивчає інтегральне вирахування. Безумовно, можна заперечити, що деякі приклади научіння здаються занадто складними для такого пояснення, але вони, по суті справи, складаються з більш простих складових, подібно до того, як складні хімічні сполуки складаються з простих атомів. Дотримуючись цього принципу, на першому етапі вчені концентрували свої зусилля на дослідженні простих ситуацій і щодо простих тварин, таких, як собаки, пацюки і голуби. Таким чином, дослідники сподівалися проникнути до джерел научіння і розкрити його базові закони. На основі даних «атомів научіння» згодом можна було б відтворити більш складні процеси.
Як ми побачимо нижче, ученим, що досліджував процес научіння, так і не вдалося знайти єдиний комплекс законів, які б пояснювали моделі научіння у всіх тварин. Але, незважаючи на це, пошук таких законів привів до серії важливих відкриттів, що сформували основу тих знань про: научіння, які ми маємо сьогодні.
 
ЗВИКАННЯ
 
•Що таке звикання?..
•Чому звикання може бути адаптивним?
Найпростішою формою научіння є звикання. Цей термін відноситься до процесу зниження інтенсивності реакції на стимул, як тільки він стає знайомим. Шум, який виник раптово, звичайно насторожує нас, але коли ми чуємо цей шум у другий раз, тривога набагато менше, а втретє ,вона майже не відчувається. Після цього шум буде зовсім ігноруватися — ми цілком звикли до нього. Подібним же чином ми настільки звикаємо до гудіння флюоресцентної лампи на кухні, що навіть забуваємо про її існування (до тих пір, поки воно раптом не припиниться, тоді ми це помітимо). Так само жителі міст цілком звикають до вуличного гуркоту, але не можуть заснути від скрекоту цвіркунів, якщо проводять вихідні в селі.
Одним з головних плюсів звикання є зменшення кількості стимулів, що викликають тривогу. Несподіваний і незнайомий стимул може означати небезпеку, і тому є зміст у найбільш повному сприйнятті такого роду інформації. Однак звичайно немає потреби у підвищеній увазі до знайомого об'єкта, тим більше що це відволікає тварину від іншої діяльності, більш необхідної для виживання. Звикання вирішує цю проблему, дозволяючи організмові ігнорувати те, що вже знайомо, що, у свою чергу, дає йому можливість сфокусуватися на більш важливих і інформативних подіях (Wyers, Peeke, and Herz, 1973; Schalter, 1984).
 
КЛАСИЧНИЙ УМОВНИЙ РЕФЛЕКС
 
•Які стадії формування класичного умовного рефлексу?
•Коли умовна реакція засвоєна, які принципи її згасання і відновлення?
•Як розрізняються між собою види класичного умовного рефлексу?
У процесі звикання організм вчиться визначати будь-як явище як знайоме, але він не дізнається нічого нового про це явище. Велика частина нашого научіння припускає переробку нової інформації, і часто ця інформація стосується відносин між явищами або між явищем і визначеним типом поведінки. Багато вчених, які займаються теорією научіння (як і інші дослідники), розглядають ці відносини в рамках концепції асоціацій, припускаючи, що научіння багато в чому може бути пояснене формуванням або зміцненням асоціацій або, навпаки, ослабленням вже існуючих асоціативних зв'язків. Так, наприклад, ми вчимося пов'язувати грім із блискавкою, посмішку з дружелюбністю, тигрів із зоопарком.
Важливість асоціацій у научінні і мисленні була в центрі уваги з часів грецьких філософів, але експериментальні дослідження асоціацій були розпочаті тільки наприкінці XIX ст. І основним внеском можна вважати роботу великого російського фізіолога І. П. Павлова (1849-1936), присвячену умовному рефлексу.
 
ПАВЛОВ І КОНЦЕПЦІЯ УМОВНОГО РЕФЛЕКСУ
 
І. П. Павлов одержав Нобелівську премію за дослідження травлення ще до того, як почав вивчати умовні рефлекси. У своїй більш ранній роботі Павлов досліджував неврологічне регулювання різних травних рефлексів, і його лабораторні експерименти були спрямовані на вивчення секреції слини в собак.
Павлов з'ясував з самого початку, що слиновиділення зазвичай викликається їжею (особливо сухою), що попадає в ротову порожнину. У ході досліджень, однак виявився новий факт: слинний рефлекс міг викликатися також рядом інших стимулів, включаючи стимули, котрі спочатку були зовсім нейтральними. Собаки, які провели якийсь час у лабораторії, виділяли слину не тільки у відповідь на смак м'яса в роті, але і просто побачивши м'ясо, або побачивши миску, у якій було м'ясо, або побачивши людину, що зазвичай приносить м'ясо, або навіть при звуці кроків цієї людини. Павлов вирішив досліджувати природу цього факту, розуміючи, що це послужить розширенню концепції рефлексу, тому що, можливо, даний рефлекс містить у собі як виучені, так і вроджені реакції.
Спочатку спостереження Павлова носили загальний характер — визначений ритм кроків, наприклад, лише випадково став пов'язуватися з появою їжі. Однак при дослідженні ефекту научіння Павлов не став покладатися на випадок, а використовував такі стимули, що тварина могла розрізнити і засвоїти (мал. 4.1). В одному з досвідів він періодично дзвонив у дзвіночок за яким завжди розпочиналася годівля собаки. У наступних дослідах він спостерігав, що відбувається, коли дзвонять у дзвіночок просто так, без появи їжі (Раvlov, 1927).
У результаті проведених досвідів Павлов зробив наступне відкриття: повторювані сполучення дзенькання і появи їжі приводять до того, що згодом слина виділяється, як тільки починає дзвонити дзвіночок (тобто без появи їжі). Щоб пояснити своє відкриття, Павлов запропонував концепцію умовного і безумовного рефлексів. Він стверджував, що безумовний рефлекс має вроджену основу і є результатом біологічних особливостей організму, в основному не залежних від научіння. Прикладом може служити виділення слини, після того як у порожнині рота виявиться їжа. Умовний рефлекс набувається шляхом научіння, він зумовлений досвідом тварини.
Павлов припускав, що безумовний рефлекс базується на тісному зв’язку між безумовним стимулом (БС) і безумовною реакцією (БР), а умовний рефлекс — на зв'язку між умовним стимулом (УС) і умовною реакцією (УР). Однак, як з'ясувалося, зв'язок між УС і УР встановлюється не відразу. Так, УС (у нашому прикладі це був дзенькіт дзвіночка) споконвічно був нейтральним стимулом — він не викликав УР. УС починає викликати УР (у даному випадку слиновиділення) тільки після деяких появ УС (дзенькіт) перед БС (у даному випадку — їжа в порожнині рота). На мал. 4.2 представлена узагальнена схема відносин, що складають основу того, що нині відомо як класичне зумовлення.
 
Загальні закономірності  формування класичного умовного рефлексу
Павлов зміг скласти повний і точний опис основних особливостей формування умовного рефлексу, а його відкриття лягли в основу наступних досліджень у цій області. Нижче наведено опис деяких експериментальних відкриттів Павлова.
Вироблення умовних реакцій
Спочатку умовний стимул (УС) не викликає умовної реакції (УР). Але після декількох спільних появ з безумовним стимулом (БС) умовний стимул (скажемо, дзвоник) уже здатний викликати умовну реакцію (слиновиділення). Звідси ясно, що поява БС (їжа) одночасно з УС (або, частіше, відразу після нього) є визначальною дією в механізмі умовного рефлексу. Вважається, що це сполучення закріплює зв'язок; досліди, у яких присутні УС і БС, називаються закріпляючими пробами; досліди, у яких УС представляється без БС називаються пробами згасання рефлексу.
На мал. 4.3 представлена ідеальна крива научіння, у якій сила УР (вісь У) зіставляється з успішними закріплюючими пробами (вісь X). Тенденція очевидна: сила УР, спочатку нульова, стрімко росте і потім встановлюється на деякому рівні, відмінному від нуля. Це легко демонструється на прикладі слиновиділення в собаки у відповідь на дзвоник, але аналогічні приклади можна привести, спостерігаючи за поведінкою інших тварин, при інших УС і УР. Такий, коротенько, типовий паттерн фактично усіх випадків УР.
Як тільки зв'язок УС-БС досить закріпилася, УС може служити підкріпленням для наступних стимулів. Так, Павлов спочатку закріпив у собаки рефлекс слиновиділення у відповідь на удари метронома, використовуючи м'ясний фарш як БС. Коли рефлекс встановився, він став показувати собаці чорний квадрат слідом за ударами метронома, але вже без подачі їжі. Поєднання появи чорного квадрата і стукоту метронома повторювалося кілька разів, і згодом одного лише виду чорного квадрата було достатньо, щоб викликати виділення слини. Це явище називається обумовлюванням другого порядку. У результаті чорний квадрат став сигналом появи ударів метронома, що, у свою чергу сигналізували про появу їжі.
 
Рис. 4.3. Ідеальна крива научіння
Сила УР зіставляється з кількістю закріпляючих проб. Крива показує результат безлічі таких експериментів, які демонструють, що сила УР зростає зі збільшенням кількості проб, Однак кожна наступна проба приводить до меншого посилення УР, ніж попередня
 
Згасання і відновлення умовного рефлексу
Адаптивна цінність умовного рефлексу очевидна. Уявіть собі вовка, що знайшов якесь місце з безліччю мишей. Для вовка буде дуже корисно засвоїти цей зв'язок між мишами і даним місцем: тепер він буде знати, де імовірніше всього можна знайти ситну їжу наступного разу, коли він зголодніє. Але нічого доброго не було б у тому, якби цей зв'язок, один раз встановившись, уже ніколи не міг бути порушеним. Миші могли б залишити цю територію або бути повністю з'їденими, так що вовк дарма витрачав би час і енергію, знову і знову повертаючись на це уже пусте місце.
Ці міркування прекрасно співвідносяться з тим, що нам відомо про класичне обумовлювання. Павлов зміг показати, що механізм умовної реакції може бути зруйнований подібно тому, як був сформований. Точніше кажучи, він продемонстрував, що УР поступово зникає сам по собі, тобто без сполучення з БС. На його думку, сам зв'язок УС-БС уже припускає загасання умовного рефлексу. На мал. 4.4 приведена крива загасання в експерименті по припиненню дії рефлексу слиновиділення. Так само як на мал. 4.3, сила УР виміряється уздовж осі В, по осі X показується кількість досвідів (у даному випадку кількість проб, що послабляють — досвідів без підкріплення). В міру збільшення кількості проб потік слини висихає. У результаті собака засвоює, що УС більше не є сигналом до їжі.
Графік показує зниження кількості виділеної слини (УР) зі збільшенням кількості проб, що послабляють, у яких ВУС пред'являється без БС (Раavlov, 1928)
Але; і саме загасання може бути зупинено. Це відбувається шляхом відновлення умовного рефлексу, тобто подальшого проведення підкріплювальних досвідів. Відновлення умовного рефлексу звичайно відбувається швидше, ніж його первісне засвоєння; іншими словами, швидкість перенавчання вища, ніж швидкість навчання. Це справедливо навіть для ситуації, коли проби згасання проводилися аж до повного зникнення реакції на умовний стимул у тварини. Очевидно, при згасанні не відбувається повного «стирання» вихідної навички; після загасання умовного рефлексу тварина не повертається у свій первісний «наївний» стан. Вона зберігає деяку пам'ять про цю навичку, і ця пам'ять забезпечує швидкий старт у відновленні рефлексу.
Генералізація стимулу
Дотепер ми розглядали ситуації, у яких тварина навчалася за допомогою конкретних УС; дзенькоту дзвіночка, ударів метронома або чого-небудь ще,— а наступні тести приводилися з тим же стимулом. У реальному житті, однак, положення речей набагато складніше. Голос хазяїна, імовірно, завжди є сигналом появи їжі, але його точна інтонація міняється від випадку до випадку. Вид яблуні може правильно сигналізувати про наявність фруктів, але яблука розрізняються по кольору і формі. Дані факти жадають від тварини здатності реагувати на стимули, не ідентичні споконвічним УС, у противному випадку попередній досвід стає марним.
Природним наслідком із усього вищесказаного є поява у тварини так називаної генералізації стимулу — реакції на визначене коло стимулів, досить схожих зі споконвічним УС. Наприклад, у собаки вироблена умовна реакція на жовте світло. У наступних дослідах собака дасть найбільш сильну реакцію саме на жовте світло. Однак собака реагує (хоча і трохи слабше) і на жовтогаряче світло. Собака, імовірно, буде реагувати і на червоне світло, але реакція буде ще слабша. Загалом, чим більша різниця між новим стимулом і вихідним УС, тим слабша УР. Ця закономірність називається розподілом генералізації. Пік розподілу (найбільш сильна реакція) звичайно відповідає тестовому стимулові, ідентичному тому, що використовувався при научінні (мал. 4,5); реакція слабшає в міру того, як стимули стають усе менш і менш схожими на початковий.
На графіку показана генералізація реакції моргання в кроликів. УС — звук з частотою 1200 Гц, а БС — удар електричним струмом. Після того як умовна реакція на умовний стимул була вироблено, вимірялася генералізація шляхом пред'явлень різних тестових
стимулів; проранжованих від 400 до 2000 Гц , і було визначено відносну кількість проб, у яких кролики давали УР. На графіку показані результати після декількох тестових проб (Мооге, 1972)
Диференціація стимулів
Очевидно, що генералізація стимулу корисна, але вона не може застосовуватися занадто широко. Тигр може стати подібним до кошеняти, але той, хто прийме одного за іншого, швидше за все, пошкодує про це. Саме тому потрібно провести диференціацію і не намагатися приручити тигра.
Феномен диференціації стимулів легко продемонструвати в лабораторії. Спочатку в собаки формують умовну реакцію слиновиділення на УС — наприклад, на чорний квадрат. Після того як УР цілком встановленей, підкріплення з чорним квадратом у випадковому порядку чергується з дослідами, де інший УС (скажемо, сірий квадрат) не одержує підкріплення. Це продовжується доти, поки собака не стане в досконалості розрізняти їх, постійно виділяючи слину у відповідь на підкріплюваний стимул ( що позначається як УС+) і не даючи реакції на непідкріплюваний стимул ( що позначається як УС-). Звичайно, собака досягає цього не відразу. У процесі ранніх дослідів два механізми будуть змішуватися, або, точніше, генералізація буде переважати над диференціацією, і слина буде виділятися однаково на УС+- і УС-. Однак кількість цих помилок поступово зменшується доти, поки зрештою не буде досягнута повна диференціація.
Природно, диференціація буде складнішою при значній схожості УС- і УС+. У ситуації зі схожими стимулами відповідна реакція на УС+, імовірно, буде поширюватися і на УС-; у свою чергу, негативна реакція на УС- може розповсюджується і на УС+. У результаті собаці буде потрібно безліч спроб, перш ніж вона навчиться реагувати на стимул без помилок.
Чи схожі стимули, або чи легко вони диференціюються? У будь-якому випадку важливо, щоб тварина засвоїла значення і УС+, і УС-. Звичайно, вона засвоює, що УС+ сигналізує появу БС. А як же УС-? Можна подумати, що тварина сприймає цей стимул як такий, що не несе ніякої інформації — адже за цим стимулом не випливає БС. Але і тут є інформація: УС- свідчить про визначений відрізок часу, протягом якого БС, швидше за все, не з'явиться. Якщо БС — це голосний шум, тоді УС- є початком періоду відсутності шуму. Якщо БС — це їжа, тоді УС- показує, що їжа з'явиться не швидко.
Дійсно, УС- і УС+ мають протилежний сенс: УС- означає відсутність шуму або відсутність їжі, загалом, відсутність БС. Відповідно, реакція тварини на УС-, імовірно, буде зворотної реакції на УС+. Якщо БС — це раптовий сильний шум, то УС+ буде викликати страх; а УС- швидше за все, знижувати тривогу. Якщо БС — це їжа, то УС+ викликає слиновиділення, а УС- приводить до меншого виділення слини у тварини, ніж зазвичай. Таким чином, УС- приймає на себе роль інгібітора: він затримує реакцію, викликувану дією УС+.
 
ГРАНИЦІ ПРОЯВУ КЛАСИЧНОГО УМОВНОГО РЕФЛЕКСУ
 
Класичний умовний рефлекс можна спостерігати в багатьох видів тварин, із широким колом стимулів і безліччю реакцій. За допомогою рефлексу краби можуть стискати свої хвостові хребці, а восьминоги — змінювати колір. У повсякденному житті люди відчувають голод перед прийняттям їжі або сексуальне порушення у відповідь на жест або слово, які мають еротичний підтекст. Однак навіть при такій розмаїтості умовних реакцій основні прояви класичного умовного рефлексу мають розпізнаваний профіль, який ми можемо використовувати для визначення рефлексу, де б ми з ним ні зштовхнулися. Впізнаючи цей профіль, ми можемо, наприклад, ідентифікувати багато емоційних реакцій, які відносяться до класичного умовного рефлексу.
Обумовлювання страху
У багатьох випадках умовний рефлекс складається з одиничного акта, наприклад, такого, як виділення слини або моргання. Іноді, однак, УР набагато складніший. Ми вже згадували ситуації, де БС (приміром, голосний шум) є аверсивним стимулом. У цьому випадку УС приведе до множинної реакції, включаючи зміни в поведінці тварини, а також у її фізичному стані (серцевий ритм, гормональний тон і т.д.). Коротше кажучи, тварина буде відчувати страх і робити всі ті дії, які роблять злякані тварини.
Багато досліджень було присвячено вивченню реактивних емоцій, особливо страху. Найчастіше в таких дослідженнях (наприклад, на пацюках) аналізувалася умовна емоційна реакція (УЕР). Спочатку пацюка вчили натискати на педаль для того, щоб з'явилася винагорода у вигляді їжі. Після декількох навчальних досвідів пацюк починав робити це з достатньою сталістю, і тепер можна було почати підкріплення страхом: коли пацюк натискав на педаль, пред'являвся УС-, допустимо, світло або звук, що тривав 3 хв. Наприкінці ці відрізку часу УС припинявся і пацюк одержував короткий удар електричним струмом (БС). Це змушувало пацюка на якийсь час перестати натискати на педаль, але незабаром він знову повертався до цього заняття, і повторювалася послідовність УС— БС. Через якийсь час, протягом якого пацюк натискав на педаль, сполучення УС-БС знову повторювалося, і т.д. (Estes and Skinner, 1941; Kamin, 1965).
У даній ситуації підкріплення страхом накладається на поточну діяльність, а саме на натискання пацюком педалі. Це особливо важливо, тому що дозволяє, вимірювати ступінь переляку. Раніше у дослідах тварина, по суті, ігнорувала УС і, коли він пред'являвся, продовжувала натискати на педаль. Пізніше тварина навчилася тому, що УС сигналізує наближення БС (удар струмом). На цій стадії УС (і передбачення удару струмом), схоже, гальмувало ритмічне натискання педалі, так що тварина через переляк натискала педаль з меншою частотою під час УС, ніж без нього. Вимірюючи це гальмування реакції, ми можемо визначити силу умовного рефлексу (мал. 4.6).
Чи виражаються подібним чином і людські емоції? У багатьох випадках, імовірно, так. Неприємні переживання, які відбулися в якійсь кімнаті, можуть привести до страху перед цією кімнатою, падіння з велосипеда може привести до страху перед їздою на велосипеді. Ці випадки легко підвести під рамки умовного рефлексу. Деякі психологи припускають, що вкрай сильні страхи які називають фобіями, можуть розглядатися в тому ж контексті, однак інші дослідники скептично відносяться до такої точки зору (Schwartz and Robbins, 1995). Не так уже важливо, як буде вирішена ця суперечка; багато вчених сходяться на тому, що механізм умовного рефлексу може бути з користю застосований у терапії фобій.
Пацюка привчають натискати, на педаль у стійкому ритмі, щоб одержати їжу. На графіку показана залежність між ступенем гальмування реакції після пред'явлення 3-хвилинного світлового сигналу (УС), за яким негайно випливає удар струмом (БС). Після 12-ти таких проб гальмування досягає рівня 100% і пацюк не дає ніякої реакції на пред'явлення УС протягом 3-х хвилин (Kamin, 1969).
Відношення між УР і БР
Феномен умовної реакції страху підводить нас до важливої проблеми, що ми дотепер не розглядали: які відносини між УР і БР? При слиновиділенні УР і БР здаються схожими: собаки Павлова виділяли слину і коли чули УС, і коли відчували БС. Але УР і БР, навіть не дивлячись на схожість, навряд чи можуть вважатися ідентичними. У тому випадку, коли в ротову порожнину попадає м'ясо (БС), слиновиділення в собак більше і містить більше ферментів, ніж у випадку, коли слина виділяється у відповідь на звук (УС).
Розходження між УР і БР виражено ще сильніше у випадку з умовною реакцією страху. Під дією електричного струму тварина злегка підстрибує і її серце б'ється частіше; це — БР. Коли ж тварина чує або бачить УС, що сигналізує про удар струмом, воно реагує зовсім інакше: завмирає, напружується, її серце б'ється повільніше. Це не реакція уникнення удару, це — вираження передчуття страху, тобто УР.
Усе сказане вище має глибокий біологічний зміст. Тварина не може з'їсти звук, що супроводжує їжу; точно так само саме по собі світло, що супроводжує удар струмом, не наносить їй ніякої шкоди. Отже, не має змісту лякатися УС точно так само, як БС. Навпроти тварина, імовірно, сприймає погрозу УС як сигнал «Будь готовий!», як показник наближення БС. З цього погляду, УР є не що інше як підготовка тварини до БС. Якщо за дзвоником напевно піде їжа, тоді дзвоник означає, що тварині варто зволожити порожнина рота, тобто підготуватися до їжі, до того моменту, коли їжа дійсно з'явиться. Якщо світло сигналізує про удар струмом, тоді це сигнал для тварини напружити м'язи, щоб бути готовим до стрибка, коли удар піде (Zener,1937;Holland, 1984,Hollis,1984).
Умовний рефлекс і дія ліків
Підготовки до БС може набувати різноманітних форм. Уявіть собі, наприклад, людину, яка одержала велику кількість ін'єкцій інсуліну — ліків, що зменшує зміст цукру в крові. Після безлічі таких уколів людина починає реагувати на різні стимули, які зазвичай супроводжували ліки, такі, як звичайна голка. Однак реакція на такі стимули зовсім обернена реакції на сам препарат: при дії таких стимулів (але без інсулінової ін'єкції) рівень цукру в крові підвищується.
У контексті умовного рефлексу інсулін у даному випадку є БС, а БР — не набуте досвідом, а біологічно детерміноване зниження змісту цукру в крові, що відбувається під дією інсуліну. УС — це вид голки (або деякі інші стимули, що супроводжують ін'єкції). І, очевидно, що УР – це підвищення рівня цукру в крові.
Ця УР дійсно має універсальне значення, якщо ми вважаємо її підготовкою до впливу БС. У нашому тілі існують різні механізми, що намагаються зберегти стабільне і незмінне внутрішнє середовище. Інсулін порушує цю стабільність, знижуючи рівень цукру в крові. Як же тоді можна зберегти рівновагу? Шляхом підвищення інсуліну в крові. Це підвищення випливає відразу ж за дією інсуліну, що знижує цукор, приводячи в підсумку до загальної рівноваги, стабільності.
Підготовка організму до інсуліну може, таким чином, розглядатися як компенсаторна реакція, що нейтралізує дію ліків, які надходять в організм. Якщо провести грубу аналогію, то це схоже на те, як ведмідь об'їдається перед початком своєї зимової сплячки: тварина споживає надмірну кількість калорій, призначену для наступаючого енергетичного дефіциту. Безперечно, у випадку з ведмедем компенсаторна реакція є навмисною і залежить від зовнішніх харчових ресурсів. Що ж стосується інсулінової реакції, то відповідна реакція організму відбувається автоматично, у повній залежності від внутрішніх механізмів. 
 
ІНСТРУМЕНТАЛЬНИЙ УМОВНИЙ РЕФЛЕКС
 
•Що таке інструментальний умовний рефлекс і чим він відрізняється від класичного умовного рефлексу?
•Яка суть закону ефекту і чому Торндайк вважав цей закон аналогією еволюційної концепції?
•Що таке підкріплення?
•Яку дію роблять пропорційний і інтервальный режими?
Звикання і класичне обумовлювання — це дві форми простого научіння. Ще одним його різновидом є інструментальне (або оперантне) обумовлення. Приклад інструментального обумовлення можна знайти в зоопарку. Коли тюлень робить стрибок, щоб узяти рибу в доглядача зоопарку, він вивчає інструментальну умовну реакцію. Вона називається інструментальною тому, що веде до бажаного результату.
Інструментальний рефлекс відрізняється від класичного по декількох параметрах. Найважливіша відмінність полягає в тому, що при оперантному научінні підкріплення (тобто нагорода) залежить від правильної реакції. Для навченого тюленя неправильна реакція означає відсутність риби. Це не підходить для класичного рефлексу, у якому БС з'являється поза залежністю від того, що робить тварина — наприклад, м'ясний фарш тварина одержувала незалежно від того, виділяла вона чи ні слину. Ще одна відмінність стосується вибору реакції. При оперантному научінні реакція повинна бути обрана з якоїсь (іноді великої) кількості альтернатив. Тюлень повинен вибрати саме стрибок з безлічі інших дій, які він може продемонструвати. У класичному рефлексі, на відміну від інструментального, реакція нав'язана тварині: смак м'яса стимулює виділяє слини, у неї немає вибору.
ТОРНДАЙК І ЗАКОН ЕФЕКТУ
Експериментальні дослідження оперантного научіння почалися приблизно сто років тому, ставши наслідком дебатів навколо дарвінівської теорії еволюції шляхом природного добору. Прихильники дарвінівської теорії наголошували на наступності серед видів — і вимерлих, і нині існуючих: не дивлячись на зовнішні розходження, крила птахів, плавці китів і руки людини у своїй основі мають загальну кісткову будову. Ця наступність є основним аргументом на користь того, що всі ці різнорідні організми походять від загальних предків. Опоненти теорії Дарвіна вказували на те, що розглядалося як принципова переривчастість у еволюції живих істот, а саме на здатність людини мислити і міркувати, ту здатність, яка відсутня у тварин. 
У відповідь Дарвін і його колеги доводили, що наступність розумової функції можна знайти й у тваринному світі. Так, людина набагато розумніша за інші види, але розходження, можливо, набагато менше, ніж ми звикли думати; для підтвердження своєї ідеї дарвіністи збирали історії про інтелектуальні досягнення різних тварин, наприклад, історію про хитру кішку, що розсипала хлібні крихти на галявині для того, щоб нападати на птахів, що прилітали, (Romanes, 1882).
У багатьох випадках, однак, залишалося незрозумілим, чи були ці історії доказами високої розумової здатності тварин чи лише елементами фольклору. Якщо допустити перше, то всерівно залишається незрозумілим, чи були ці історії літературно оброблені чи просто любовно розказані гордими хазяями тварин. Були потрібні систематичні, об'єктивні і документально оформлені дослідження. Такі досліди здійснив Едвард Л. Торндайк (1874-1949). У 1898 р. він описав їх у своїй докторській дисертації, що стала однією з класичних праць американської психології (Thorndike, 1898).
Кішки в проблемній шухляді
Метод Торндайка полягав у тому, щоб змусити тварину — у його експериментах це зазвичай була голодна кішка — виконати те або інше завдання. Кішку поміщали в проблемну шухляду – огорожу, вибратися з якої можна було тільки виконавши визначену операцію, таку, наприклад, як натискання на досить велику педаль, що дозволяло відкрити дверцята шухляди (мал. 4.7). Як тільки кішка виявлялася зовні, вона одержувала невелику порцію корму. Потім її знову поміщали в шухляду для наступної проби, так що експеримент міг повторюватися знову і знову доти, поки завдання не засвоювалося.
При першій спробі типова кішка нявкала, дряпалася і кидалася на огорожу. Це продовжувалося протягом декількох хвилин доти, поки вона, зовсім випадково, не робила правильну дію. Наступні досліди приносили поступовий прогрес. Період боротьби скорочувався, і тварині було потрібно усе менше і менше часу, щоб зробити операцію, яка відкриває дверцята. І коли досліди підходили до кінця, поведінка тварини змінювалася до невпізнанності у порівнянні з початком. При потраплянні в шухляду вона негайно спрямовувалася до педалі, діловито і швидко натискала на неї і поспішала через дверцята, що відкрилися, одержати свою заслужену нагороду.
Якби хтось просто побачив, як поводиться кішка в момент завершення дослідів, він міг би повірити в існування розуму і мислення у тварин. Але Торндайк фіксував, скільки часу потрібно тварині в кожній проб, щоб вибратися із шухляди - латентний період реакції тварини, - і показав, як цей час змінюється в процесі научіння. Торндайк знайшов, що отримана ним крива знижується в міру процесу научіння. Це не відповідає поведінці тварини, коли вона приходить до розуміння того, як вирішується проблема. Якби це було так, крива научіння мала б різкий спад у той момент, коли кішка зрозуміла задачу. «Ага! - промурчала б кішка, яку раптово осінило, - ось ця педаль дасть мені вийти»; і з цього моменту не було б ніяких завивань і стрибків. Але отримана Торндайком крива научіння показує, що кішки досягали правильної реакції шляхом незначних поліпшень, демонструючи відсутність розуміння поставленої задачі і без раптового осяяння з приводу її рішення (рисі. 4.8).
 
Щоб вибратися з шухляди кішка повинна була повернути дерев'яний важіль з вертикального в горизонтальне положення. Графік показує поступове зниження латентного періоду реакції тварини (часу, необхідного для того, щоб вибратися з; шухляди). Помітьте, що крива зовсім неоднорідна і має досить виражені коливання. Це характерно для кривих научіння окремих тварин. Монотонні криві в основному виходять при усередненні результатів, отриманих у безлічі особин (Thorndike, 1898)
 
Закон ефекту
 
На думку Торндайка, первісні реакції кішок на ситуацію були, швидше за все, результатом попереднього досвіду або деяких вроджених схильностей. Як виявилося, усі ці реакції не привели до успіху. У ході подальших дослідів імовірність подібних реакцій поступово знижувалася. Імовірність правильних дій тварини споконвічно була невисока, але в процесі научіння вона неухильно підвищувалася. По вираженню Торндайка, правильна реакція поступово «закарбовувалася», тоді як помилкові реакції поступово «стиралися» з пам'яті тварини.
Які ж причини приводять до посилення одних реакцій і ослаблення інших? Торндайк вважав, що існує закон ефекту, який говорить, що якщо за реакцією випливає нагорода, те ця реакція закріплюється. Якщо ж слідом за реакцією не випливає ніякої нагороди (або, тим більше, якщо випливає покарання), то реакція слабшає. Іншими словами, стійкість реакції визначається тим, що за нею випливає (мал. 4.9).
Таким чином, не потрібно постулювати якийсь особливий інтелектуальний процес у тварин, щоб пояснити її поведінку. Не будемо стверджувати, що тварина встановила зв'язок між дією і наслідком або намагалася досягти якоїсь мети. Якщо тварина зробила якусь дію, за якою пішла нагорода, то досить імовірно, що ця дія згодом буде повторена.
Результати досліджень Торндайка добре вписалися в схему еволюційного мислення, що домінувала в той час у суспільстві. По-перше, закон ефекту утверджує адаптивну природу поведінки тварин, що формувалася поступово. По-друге, і це дуже, важливо, Торндайк відзначав, що закон ефекту є близькою аналогією дарвінівського принципу природного добору. Успішно адаптовані представники виду будуть жити досить довго, щоб передати свої навички наступному поколінню; ті, хто не адаптований, імовірно, вимре, практично не залишивши сліду. У житті окремої особи закон ефекту служить, по суті, аналогом закону природного добору поведінкових реакцій: успішні реакції зберігаються, марні «вимирають». «Це — процес добору серед реакцій... шляхом виключення невідповідних реакцій, що приводять до дискомфорту, і шляхом вибору відповідних реакцій, що приводять до задоволення... Той, хто вчиться й уникає небезпеки, буде жити, щоб, учитися ще один день...» (Тhогndike). 
 
ДОСЛІДЖЕННЯ СУЧАСНОЇ ПСИХОЛОГІЇ УМОВНЕ ПІДКРІПЛЕННЯ, НАРКОТИЧНА ЗАЛЕЖНІСТЬ І ПЕРЕДОЗУВАННЯ
 
Механізми класичного умовного рефлексу справляють на нас різноманітний вплив і можуть сприяти поясненню проблеми, яка має надзвичайне соціальне, політичне і медичне значення, — проблеми наркотичної залежності.
Ключ до розуміння наркоманії лежить у тих декількох принципах, які ми вже розглядали. По-перше, ми згадували, що функціонування багатьох систем організму спрямовано на підтримку постійного внутрішнього середовища. Зокрема, деякі системи викликають компенсаторні реакції, де б не відбувалися зміни, для того, щоб блокувати перекіс і зберегти стабільність. Зниження температури тіла, наприклад, пускає в хід механізми, що генерують тепло; раптова поява несподіваного стимулу запускає в дію процес повернення організму в стан спокою. І, нарешті, ми уже відзначали, що деякі з цих компенсаторних реакцій є набутими, імовірно, через механізм умовно-рефлекторного зв'язку.
Як це застосувати до таких наркотиків, як морфін і героїн? Ці наркотики дають різні ефекти, включаючи рятування від болю, відчуття ейфорії і розслаблення. Але після повторюваних прийомів наркотика всі ці ефекти слабшають. Іншими словами, у того, хто вживає наркотик, розвивається наркотична толерантність — зниження реакції на наркотик і, разом з тим, з'являється потреба в усе більшій і більшій дозі для досягнення повного ефекту.
Ми можемо уточнити і розвинути нашу думку. Для наркомана зі стажем вид шприца (досить лише одного натяку) — це достовірний сигнал швидкого надходження героїну. По суті, вид голки — це умовний стимул (УС), що говорить про обов'язкове надходження наркотика (БС). Щоб підготуватися до його прийому, організм робить умовну компенсаторну реакцію (УР), що прямо протилежна біологічно детермінованій реакції організму на сам героїн (БР). Таким чином, УР блокує БР або, принаймні, знижує бездіяльність, усе-таки допускаючи деяку дію наркотику. (Саме це є метою протидіючого процесу; блокування змін, вироблених наркотиком, захищає баланс організму.) Це зниження впливу ми і називаємо наркотичною толерантністю.
Умовний рефлекс може також пояснити ту жагу наркотика, що є центральною проблемою в наркоманії. Уявіть, що героїновий наркоман бачить шприц або проходить через ту місцевість, де він звичайно «стирчав», але по тій або іншій причині героїну в нього немає. У цьому випадку включається УС (вид голки, «торчкової» вулиці), запускаючи УР (компенсаторну реакцію), але БС (наркотик) не вводиться, виключаючи таким чином БР (дію наркотика). Наркоман випробує компенсаторну реакцію, якій йому немає що протиставити. Ми припускаємо, що тут і знаходиться джерело патологічного потяга до наркотику»!
Підтверджує це припущення і те, що особливі почуття і, симптоми, характерні для наркотичного голоду, насправді прямо протилежні тим, що пов'язуються із самим наркотиком. Героїн викликає ейфорію, спокій і зниження чутливості до болю, тоді як героїновий голод пов'язаний з депресією, занепокоєнням, підвищенням больової чутливості. Героїн викликає сухість у роті, в очах, і в носі, а його недостача — сльози, нежить і слиновиділення.
Це зауваження може мати пряме відношення і до ще одного важливого моменту в наркоманії. В даний час існує кілька різних методів лікування наркоманії, включаючи метадонову терапію. Однак кількість рецидивів у вживанні заборонених опіатів після лікування оцінюється в 70-80% (Rosenhan and Seligman, 1995). Чому це відбувається? Більшість наркоманів після лікування повертаються в те ж фізичне і соціальне середовище, у якому вони жили під час прийому наркотиків. Це середовище наповнене знаками, пов'язаними з минулим вживанням наркотика, і саме ці знаки запускають бажання наркотика. Рівень рецидиву значно нижчий, якщо пацієнти після лікування не повертаються у вихідне середовище і не зіштовхуються в такий спосіб з об'єктами наркотичних асоціацій.
Наступний, і дуже сильний, аргумент на користь протидії наркотикам ми знаходимо, коли розглядаємо самий небезпечний аспект наркоманії — можливість смертельного передозування. Уявіть собі наркомана з великим досвідом наркотизації у своїй квартирі. У нього поступово розвивається толерантність до наркотика завдяки компенсаторній реакції, що спрацьовує у відповідь на множинні асоціативні знаки в його квартирі. А тепер уявіть, що він вирішив уколотися в якомусь новому місці — припустимо, на квартирі друга. А це, у підсумку, нові УС, оскільки багато які зі звичайних асоціативних знаків у цьому випадку відсутні. Відповідно до того, що ми знаємо про генералізацію стимулу, це приведе до зниження УР, тобто до більш слабкої компенсаторної реакції, і наслідки цього можуть бути катастрофічними. Коли можливість компенсувати дію наркотика знижена, організм наркомана в новому середовищі може не справитися, з тією кількістю наркотика, до якого він уже звик.
Підтвердження цього припущення можна знайти в реальному житті, якщо проаналізувати дані опитування наркоманів, які пережили передозування героїну. Вони часто говорять, що смертельна доза була не більша звичайної. Крім того, немає ніяких підстав вважати, що ця ін'єкція, ледь не стала смертельною через домішки або неочищення наркотику. Але що змінилося в цьому випадку? Те, що людина укололася в новому місці, новій компанії і т.д. Подібні дані були отримані й у лабораторії. Пацюки можуть переносити високі дози героїну, якщо вони одержують дозу в тих же умовах, у яких звичайно одержували героїн; у новому місці вони не можуть переносити ту ж саму дозу (Siegel et al., 1982; Siegel 1983).
Як виглядає справа з іншими наркотиками? Умовна компенсаторна реакція може виявлятися й у реакції людини на нікотин і амфетамін; багато інших наркотиків також викликають подібну реакцію. І особливо вражає той факт, що експерименти Павлова зі слиновиділенням у собак, проведені майже сто років тому, дають нам підстави робити досить важливі висновки щодо проблем наркоманії.
СКІННЕР І ОПЕРАНТНА  ПОВЕДІНКА
Експериментальні дослідження оперантної поведінки почав Торндайк, але психологом, який визначив спосіб мислення сучасних вчених у даній області, був Б. Ф. Скіннер (1904-1990). Він у числі перших наполягав на проведенні розходжень між класичним і інструментальним рефлексом. У класичному рефлексі поведінка тварини викликається УР; слиновиділення, наприклад, запускається зовнішнім об'єктом. Але в інструментальному рефлексі, як стверджував Скіннер, тварина набагато менше залежить від зовнішньої ситуації. Її реакції виникають зсередини і викликаються тим, що ми називаємо волею. Скіннер назвав ці інструментальні реакції оперантами: вони справляють дію на середовище, вносячи зміни,які приводять до нагороди. У концепції як Торндайка, так і Скіннера нагорода мала вирішальне значення, і Скіннер прийняв запропонований Торндайком закон ефекту, вважаючи, що наслідок дії визначає посилення або ослаблення операнти (Skinner,1938).
Однак Скіннер був впевнений у тім, що метод дослідження научіння Торндайка неефективний. Замість того, щоб поміщати тварин у проблемну шухляду, Скіннер шукав метод, у якому інструментальна реакція може виконуватися постійно і швидко. Багато своїх досліджень він провів, використовуючи оперантні камери (широко відомі як «шухляди Скіннера), у яких пацюк натискав на важіль або голуб клював світлий диск (мал. 4.10). У цих ситуаціях тварина знаходилася перед важелем або диском протягом, скажемо, години, натискаючи або клюючи в тому темпі, який вона сама вибирала. Сила реагування тварини автоматично записувалася, а стимули і підкріплення керувалися комп'ютером. Звичайною мірою сили реагування є швидкість реакції, тобто кількість реакцій в одиницю часу.
 
ЗАГАЛЬНІ ЗАКОНОМІРНОСТІ ФОРМУВАННЯ ІНСТРУМЕНТАЛЬНОГО УМОВНОГО РЕФЛЕКСУ
 
Більшість проявів оперантного научіння подібні проявам умовного рефлексу. Розглянемо підкріплення. У концепції класичного умовного рефлексу цей термін пов'язується з операцією (встановлення зв'язку УС-БС), що підсилює УР. При оперантному научінні підкріплення відноситься до аналогічної операції, що підсилює реакцію за допомогою наступного привабливого стимулу або ситуацій, що містять щось приємніше, на зразок зерна для голодного голуба. І навпаки, підкріплення може полягати в обмеженні або захисті від чогось неприємного, наприклад, у припиненні ударів електричним струмом.
Іншими словами, підкріплення може полягати або в наявності якихось бажаних стимулів (стимулів, у яких тварина відчуває потребу), або у виключенні якихось аверсивних стимулів (стимулів, яких тварина зазвичай намагається уникнути). Обидва ці стимули забезпечують поліпшення стану тварини і закріплюють попередній тип її поведінки.
Так само як і при класичному обумовлюванні, імовірність інструментальної реакції збільшується з ростом кількості підкріплень і відбувається загасання реакції, коли підкріплення зникає.
Генералізація і диференціація
Інструментальна реакція не викликається зовнішнім стимулом; по термінології Скіннера, вона виникає зсередини. Але це аж ніяк не означає, що зовнішні стимули не грають ролі. Вони також здійснюють контроль, над поведінкою, оскільки служать диференціальними сигналами для тварини. Уявіть собі голуба, який навчили стрибати на педаль, щоб одержати зерно. Коли горить «зелене світло, стрибок на педаль винагороджується. Але коли горить червоне світло, натискання на педаль не приносить нагороди. У даних умовах зелене світло стає позитивним диференціюючим сигналом, а червоний — негативним (звичайно позначаються як З+ і С- відповідно). Голуб швидко вивчає цю закономірність, стрибає при наявності першого сигналу і не стрибає при наявності другого.
Пояснимо різницю між стимулами. УС+ сповіщає тварині про події у світі: «Незалежно від того, що ти робиш, наближається БС». З іншого боку, З+ говорить тварині про майбутній результат її дії: «Якщо ти зробиш це зараз, ти будеш нагороджений. УС- показує, що БС не піде (знов-таки незалежно від поведінки тварини). С-, навпаки, говорить тварині, що немає потреби реагувати саме зараз.
Незважаючи на ці розходження, функції генералізації і диференціації дуже схожі в класичному й інструментальному рефлексах. Розглянемо розподіл генералізації. Раніш ми бачили, що під час тренування з одним УС (допустимо, високим тоном) і тестових іспитах з іншим (низьким тоном) УР буде знижена. Чим більша різниця в УС, тим більший спад у силі УР. Те ж саме можна спостерігати в інструментальному рефлексі: в одному експерименті голубів навчали стукати дзьобом по диску при жовтому світлі. Пізніше тести проводилися з використанням різних хвиль колірного спектра, і результати показали відповідний розподіл генералізації. У міру того як контрольне світло ставало усе менш схожим на вихідний З+, голуби були все менш схильні клювати диск (Guttman and Kalish, 1956).
 
Дресирування
 
Закон ефекту говорить, що як тільки УР встановилася, підкріплення працює на її посилення. Але що змушує тварину виконати бажану дію перший раз? Деякі реакції не складають проблеми: клювання — це така дія, що голуби роблять постійно, маючи безліч можливостей для закріплення цієї реакції; це справедливо і для пацюків, які натискають і пересувають легко досяжні предмети у своєму оточенні.
Але як виглядають справи з більш складними реакціями? Наприклад, ми можемо встановити в камері важіль настільки високо, що пацюку прийдеться витягнутися на задніх лапах, щоб дістати його. Тепер пацюк може ніколи не зробити операцію натискання на важіль довільно. Проте, він може вивчити цю дію, якщо провести відповідне дресирування; здійснюється воно методом поступового наближення.
Як навчити пацюка натискати на високо піднятий важіль? Спочатку ми повинні навчити його одержувати свою нагороду. З рівними інтервалами лунає цокання — і їстівні кульки падають у маленьку чашку. Спочатку пацюка може лякати цей звук, але звикання швидко придушує страх, так що дуже швидко пацюк наближається до блюдця і бере кульки, як тільки чує цокання. З цього моменту можна починати дресирування. Спочатку ми стимулюємо тварину проста знаходитися в тому районі, де розташований важіль. Як тільки пацюк потрапив туди, ми кладемо в чашку їжу: пацюк чує цокання і з'їдає кульку. Дуже незабаром пацюк навчиться залишатися поблизу чашки практично увесь час, дозволяючи нам підвищити вимоги: відтепер він заохочується, тільки якщо дивиться на важіль. Ця реакція також незабаром засвоюється, і тоді ми ще більше ускладнюємо свої вимоги: тепер пацюк заохочується тільки в тому випадку, якщо він дивиться на важіль і мало-мало витягає тіло догори. Ми продовжуємо в тому ж дусі, заохочуючи пацюка тільки тоді, коли він витягається цілком нагору до важеля, потім — тільки коли він торкається його і т.д. Крок за кроком; ми підштовхуємо пацюка до бажаної дії. При цьому ведучим принципом є швидкість підкріплення. Якщо ми хочемо заохотити пацюка за стояння на задніх лапках, ми повинні зробити це в момент виконання дії; навіть секундне зволікання може стати занадто довгим, тому що потім пацюк може опуститися на чотири лапи, і якщо ми дамо йому нагороду пізніше, підкріплення одержить неправильна реакція.
За допомогою цього методу тварин навчають виконувати надзвичайно складні дії. Голуби можуть грати в пінг-понг, собаки — грати 3-акордовий мотив на іграшковому піаніно. Найчастіше вони беруть участь у шоу-бізнесі. Деякі заповзяті психологи організували живі атракціони, створюючи таких зірок, як Присцилла Вихована Свиня, що «просувала на ринку» деякі фермерські продукти (Breland and Breland, 1951). Присцилла включала радіо, з'їдала сніданок за кухонним столом, збирала брудний одяг і кидала в кошик, пилососила підлогу і, зробивши все це, вибирала продукти спонсора, віддаючи перевагу саме їм, тобто виконувала сукупність дій, що робить честь як спонсорові, так і силі підкріплення.
Обумовлене підкріплення
Дотепер наші приклади підкріплення стосувалися їжі, води і припинення ударів електричним струмом. Але інструментальне научіння не завжди припускає підкріплення з таким безпосереднім біологічним значенням. Наприклад, учитель музики рідко заохочує своїх студентів їжею; кивок або репліка «добре» — зазвичай усе, що потрібно. Як же підхід Торндайка пояснює підкріплювальний зміст слова «добре»?
Торндайк і Скіннер вважали, що стимул має підкріплювальне значення, якщо він неодноразово з'являється у сполученні з іншим підкріпленням. У такий спосіб стимул може стати обумовленим підкріпленням і згодом діяти як будь-яке інше підкріплення.
Множинні експерименти показують, що нейтральні стимули можуть набувати якості підкріплення подібним чином. Наприклад, шимпанзе в одному з дослідів спочатку навчили опускати жетони в торговельний автомат, щоб одержувати винограду. Засвоївши це, вона навчилася виконувати наступну операцію, пов'язану з тим, щоб діставати жетони (Coles, 1937; мал. 4.13). Подібні приклади показують, що вирішальним фактором у перетворенні стимулу в зумовлене підкріплення є його зв'язок з первинним підкріпленням. Цілком природно, що ця властивість тим сильніша, чим частіше сполучаються два цих стимули. Можна також очікувати, що зумовлене підкріплення буде поступово втрачати свою силу з багаторазовою появою без підтримки первинного підкріплення.
Усе це доводить, що зумовлене підкріплення схоже, а можливо, і ідентичне класичному умовному рефлексові. Коротше кажучи, зумовлені підкріплення (жетони, посмішки, кивки) подібні УС. В обох випадках спочатку нейтральні стимули пов'язуються з важливими біологічними потребами, і як тільки це відбувається, УС або обумовлене підкріплення приймає на себе мотиваційну роль.
Режими підкріплення
За межами лабораторії підкріплення відбувається лише періодично: нам не платять після виконання кожного завдання під час роботи; ми лише іноді виграємо в лотерею; рибалка ловить рибу не кожним закиданням вудки, і навіть тенісні зірки, трапляється, програють матчі. Усе це випадки часткового підкріплення, у яких наші дії винагороджуються далеко не завжди.
У лабораторії часткове підкріплення може бути організоване в кількох варіантах. Винагорода може даватися після того, як виконана якась кількість дій або через деякий час. Кожний з цих варіантів може бути описаний через режим підкріплення. Власне кажучи, цей режим описує правила, які визначають, коли і за яких умовах реакція одержує підкріплення.
Режими пропорційного підкріплення. Одним із прикладів такого підкріплення є режим з фіксованим співвідношенням (ФС), коли учасник експерименту повинен зробити визначену кількість дій для одержання кожної винагороди. Кількість необхідних дій визначає показник співвідношення, який стоїть поруч із ФС: якщо потрібні дві дії для одержання одного підкріплення — це режим ФС 2. Якщо потрібні три або чотири дії — це режим ФС 3 або ФС 4 (і т.д.). Такий режим може приводити до високих темпів реагування, особливо при високому показнику співвідношення, але щоб досягти такого темпу, показник повинен підвищуватися поступово, починаючи з 1 (кожна дія винагороджується).
Коли показник ФС досить високий, з'являється нова особливість у поведінці: слідом за кожною винагородою тварина робить деяку паузу; чим вищий показник, тим довша пауза (мал. 4.14). Таким чином, лабораторний голуб має багато загального зі студентом, який закінчив одну курсову роботу і повинен починати іншу. Важко починати, але коли перший лист буде закінчено, другий піде легше.
Паузу, що випливає за кожним підкріпленням, можна видалити, перейшовши до режиму з довільним співвідношенням (ДС). У цьому режимі підкріплення також випливає після визначеної кількості дій, але кількість необхідних дій варіює від одного підкріплення до іншого. Режим ДС описується середнім числом необхідних дій: так, наприклад, ДС10 — це режим, у якому тварина одержує винагороду в середньому за кожні 10 дій. Але при такому режимі може виявитися, що перших п'яти дій буде досить для одержання однієї винагороди, а для того, щоб заробити наступне, будуть потрібні ще п'ятнадцять.
У режимі ДС тварина ніяк не може знати, яка з дій принесе їй наступну нагороду. Може бути, що наступна дія принесе приз, а може бути, буде потрібно ще сто. Ця невизначеність допомагає зрозуміти, чому режим ДС викликає такий високий рівень реагування і у людей, і у тварин. Це легко продемонструвати в лабораторії, але більш переконливі докази можна знайти в кожному казино. Там гральні автомати виплачують виграш за законами режиму ДС, з так улаштованою системою підкріплення, що «реакції» проходять у дуже швидкому темпі, будучи заставою того, що казино будуть приносити вигоду своїм власникам, але не їх клієнтам.
Інтервальні режими. В основі режимів пропорційного підкріплення лежить деяка кількість реакцій. Інтервальні режими засновані на часі. При режимі з фіксованим інтервалом (ФІ) підкріплення з'являється тільки після проходження визначеного інтервалу часу з моменту останнього підкріплення. Як тільки інтервал пройдений, наступна дія приносить нагороду. Прикладом режиму ФІ може служити заглядання в поштову скриньку. Неважливо, скільки разів ви перевіряєте свою скриньку; ваші старання залишаються марними, якщо ви відкриваєте скриньку до того, як принесли пошту. Але як тільки пошта принесена, то наступна спроба обов'язково буде нагороджена. Оскільки пошту, як правило, приносять щодня, режим буде мати інтервал у 24 години.
Після того як тварина провела якийсь час, діючи в режимі ФІ, у неї з'являється характерний спосіб поведінки. Відразу ж після підкріплення швидкість реакції дуже мала. Однак поступово збільшується, і реакції усі прискорюються і прискорюються в міру того, як наближається кінець інтервалу.
На малюнку показана крива сумарних реакцій голуба. Діагональні штрихи вказують момент підкріплення. Як видно з малюнка, швидкість реакції надзвичайно висока і паузи після підкріплення відсутні (Fester and Skinner, 1957) 
Манера поведінки тварин зміниться в умовах режиму з довільним інтервалом (ДІ). У принципі, відмінності між режимомДІ і режимом ФІ — такі ж, як між режимами ПС і ФС. У режимі ДІ підкріплення відбувається після якогось визначеного інтервалу, однак цей інтервал непередбачуваний, оскільки змінюється від досвіду до досвіду (мал. 4.16).
Часткове підкріплення і загасання. Різні режими підкріплення, як ми вже бачили, впливають на поведінку. Але один з найважливіших ефектів часткового підкріплення виявляється тільки в процесі загасання. Основний результат можна виразити просто: часткове підкріплення сповільнює процес загасання. Цей феномен іноді називають ефектом часткового підкріплення (Humphreys, 1939; мал. 4.17).
 
На малюнку показана швидкість загасання УР при однаковій кількості проб у двох груп пацюків. Одна група одержувала повне підкріплення (тобто при кожній пробі), інша — тільки в 30% проб. З графіка видно, що група з повним підкріпленням (суцільна лінія) припинила дії значно раніш, ніж група, що одержувала часткове підкріплення (штрихова лінія).
На перший погляд, ефект часткового підкріплення здається парадоксальним. Якщо кожне підкріплення підсилює інструментальну реакцію, тоді більша кількість підкріплень повинна приводити до більшої стійкості поведінки. Ми, природно, очікуємо, що група, яка одержувала повне підкріплення, буде продовжувати свої дії набагато довше тієї, котра одержувала підкріплення протягом тільки 30% проб. Однак у дійсності відбувається саме зворотне. Чому? Виходячи з позиції здорового глузду, можна сказати, що тварина, що частково винагороджується, звикла до того, що не кожне зусилля веде до успіху; вона засвоїло, що «якщо відразу одержати не вдалося, потрібно спробувати знову». Тварина, можливо, спочатку навіть не зауважує, що почалися загасаючі проби, оскільки вона і до цього моменту багато разів здійснювалася реакцію без винагороди.
Границі прояву інструментального умовного рефлексу
Вище ми відзначали, що прояви класичного умовного рефлексу можна спостерігати в самих різних тварин і в самих різних ситуаціях. Те ж справедливо і для інструментального умовного рефлексу. Ми вже згадували пацюків, навчених натискати на педаль, кішок, навчених тягти за дротову петлю, і мавп, що вміють керувати торговельними автоматами. Можна привести безліч інших прикладів, оскільки інструментальний рефлекс зустрічається і серед простих видів (таких, як бджоли) і серед вищих видів (таких, як людина).
Поширеність інструментального рефлексу виявляється в різноманітті застосування його техніки за межами лабораторії. Багато в'язниць використовують інструментальне обумовлювання для корекції поведінки ув'язнених; багато батьків подібні методи використовують у вихованні дітей (правила поведінки діти засвоюють практично винятково цим шляхом). Інструментальні техніки широко застосовуються в клінічній практиці, включаючи метод психотерапії (так звані методи модифікації поведінки) і використання заохочувальних фішок серед пацієнтів клініки. 
Аверсивне обумовлювання
Дотепер ми розглядали такі випадки, коли дія приносить винагороду. А як же покарання? Це інша сторона медалі, коли за реакцією випливає який-небудь неприємний стимул, будь то шум, що лякає, для лабораторних пацюків або суворе «Немає!» для примхливої дитини. Не викликає сумніву, що суб'єкт розуміє, що він повинен мінімізувати цю неприємність; така форма научіння називається аверсивним обумовлюванням.
Покарання. Аверсивні стимули можуть виконувати безліч різних функцій в інструментальному научінні, і найочевидніша з них — покарання. Тут реакція супроводжується неприємним наслідком, що робить цю реакцію менш ймовірною в майбутньому.
Рятування і уникання. При покаранні аверсивний стимул використовується для усунення небажаної поведінки. Але він може використовуватися і для того, щоб закріпити реакцію. Реакція рятування дозволяє тварині виконати дії, що усувають неприємну ситуацію. Реакція уникання є ще більш хорошим виходом: вона запобігає дії негативного стимулу з самого початку. Безумовно, з погляду тварини, і рятування і уникання ведуть до доброго результату; не дивно, що і реакція рятування і реакція уникання швидко засвоюються. Приклад рятування: пацюк швидко вчиться натискати на педаль, щоб виключити електричний струм. Приклад уникання: собака перестрибує з одного вольєра в іншій, як тільки чує звук, що сигналізує про наближення електричного удару. Якщо вона стрибає до витікання визначеного часу, їй удається цілком уникнути удару (мал. 4.18).
Аверсивне обумовлювання і закон ефекту. Розглянемо собаку, що стрибає з вольєра у вольєр, щоб уникнути удару струмом. На ранніх стадіях научіння собака не стрибає доти, поки не почне діяти струм, і кожен стрибок винагороджується припиненням дії струму. Пізніше собака навчається стрибати досить рано, щоб зовсім уникнути удару струмом. Якщо ж підкріплення для стрибків (припинення дії струму) більше не надходить, то це повинно привести до загасання реакції. Однак тварина продовжує стрибати. Чому це відбувається?
Кожен стрибок собаки супроводжується відсутністю дії струму, і це, імовірно, підкріплює реакцію. Але давайте пояснимо, що відбувається: собака повинна знати, що існує реальна загроза удару струмом у цій ситуації, інакше відсутність струму не буде вважатися нагородою. Щоб зрозуміти це, врахуйте такий факт, що кожен стрибок собаки супроводжується відсутністю землетрусу точно так само, як і відсутністю струму. Але, звичайно ж, нерозумно думати, що землетрусу не відбувається тому, що собака продовжує стрибати. І тому що не було причини боятися землетрусу (або навіть просто думати про нього) у цій ситуації,але його відсутність не викликає ні полегшення, ні рятування від страху і, відповідно, не є нагородою.
 
На малюнку показано латентний період реакції собаки (де латентний період — час з моменту включення УС до реакції тварини). Попереджуючий сигнал вказує на те, що удар струмом (УС) піде через 10 секунд. Під час перших дев'яти проб собака тікала пізно. Вона перестрибувала через огорожу, коли струм уже починав діяти. Починаючи з десятої проби і далі собака уникала удару струмом: вона стрибала до того, як минали 10 секунд. Швидкість стрибка зростала доти, поки середній латентний період не склав 1,5 секунди. (Латентний період вираховувався по логарифмічній шкалі. Шкала часу дробилася таким чином, щоб більше уваги приділити розходженням між найкоротшими латентними періодами.)
Отже, не сама відсутність струму є нагородою. Його відсутність бажана тільки тоді, коли струм дійсно загрожує. І тільки в цьому контексті відсутність удару струмом є нагородою. Щоб зрозуміти суть навички уникання, ми повинні якось пояснити те, що тварина знає про існування погрози в даній ситуації і знає, що відбудеться, якщо воно припинить стрибати. Саме ці труднощі вимагають, щоб ми розглянули питання більш повно, ніж це дозволяє простий закон ефекту. Розробка даної проблеми научіння проводилася й у рамках когнітивного підходу.
 
КОГНІТИВНЕ НАУЧІННЯ
 
• Що таке когнітивна концепція рефлексу?
• Чим підтверджується той факт, що когнітивна концепція застосовна і до класичного і до інструментального умовним рефлексам?
• Що таке вивчена безпорадність і як вона може пояснити деякі аспекти депресії?
На думку перших розроблювачів даного напрямку, основним у класичному й інструментальному обумовлюванні було те, що обоє вони змінюють поведінку. При класичному обумовлюванні створюється нова умовна реакція. При інструментальному обумовлюванні реакція закріплюється або слабшає внаслідок механічної дії нагороди або покарання.
З перших днів теорії научіння існував альтернативний погляд на обумовлювання, прихильники якого стверджували, що научіння — це не зміна поведінки як така, а набуття нового знання. Одним з видатних представників цієї концепції був Едвард С. Толмен (1886-1959). Згідно Толмену, реакція, яку засвоює тварина в процесі навчальних експериментів, є вирішальною, оскільки свідчить про набуття знання. Але саме пізнання, а не реакція є змістом научіння (Dickinson, 1987).
Теза Толмена була підтверджена результатами численних досліджень. Наприклад, в одному з експериментів пацюків возили по великій кімнаті з одного кінця в іншій у прозорих рейкових машинках. Під час цих поїздок поведінка пацюків не змінювалася; проте, мало місце научіння: наступні тести показали, що пацюка вивчили планування і приблизну обстановку кімнати (Gleitman, 1963). Вони засвоїли те, що Толмен називав «когнітивною картою», яка представляє, що де знаходиться і що до чого веде (Tolman, 1948). Отже, научіння не може бути прирівняне до зміни поведінки, оскільки перевезені пацюки продемонстрували перше, але не друге.
КОГНІТИВНИЙ ПІДХІД ДО КЛАСИЧНОГО ОБУМОВЛЮВАННЯ
Класичний умовний рефлекс також може бути розглянутий у рамках когнітивного підходу: з погляду того, що тварина знає, а не того, що вона робить. Павлов вважав, що умовні стимули поступово підмінюють безумовні, так що тварини починають реагувати на УС так само, як на БС. Але навіть у вихідному експерименті Павлова БР і УР не ідентичні, а для умовної реакції страху вони зовсім різні. Схоже, що УС у дійсності не підмінюють БС, а стають знаком того, що УС незабаром піде, змушуючи тварину зробити необхідну підготовку до БС. Іншими словами, зв'язок між двома стимулами — це те, що засвоює тварина в класичному умовному рефлексі (Tolman, 1932).
Тимчасові зв'язки між УС і БС
Когнітивний підхід виявився корисним і для вирішення ще одного важливого питання: який механізм умовного рефлексу? Які причини встановлення зв'язку між УС і БС у свідомості тварини? Павлов вважав, що це тимчасовий зв'язок, тобто сумісність у часі. УС і БС з'являються разом, тому встановлюється асоціація. Але, як ми побачимо нижче, усе не так просто.
Безліч досліджень були присвячені вивченню ролі сумісності; у них варіювався інтервал між УС і БС, а також порядок їхньої появи. В одних експериментах УС передував БС (випереджальне сполучення), в інших — випливав за БС (наступне сполучення), а інших два стимули з'являлися одночасно (одночасне сполучення) (рис 4.19).
 
Ці досліди показали, що найкращим є випадок, коли УС випереджає БС на деякий оптимальний часовий інтервал (мал. 4.20).
Якщо інтервал між УС і БС перевищує оптимальний, ефективність їхнього сполучення різко падає. Одночасна поява УС і БС набагато менш ефективна, а наступний зв'язок між УС і БС ще слабший (Rescorla, 1988).
 
На малюнку показаний вплив на УР різних тимчасових інтервалів між УС і БС. УС — попереджуючий звук, БС — удар електричним струмом, УР — відсмикування руки. Час між УС і БР відзначений на горизонтальній осі. Нульовий інтервал означає, що УС і ВР були пред'явлені синхронно (одночасне сполучення), а позитивний інтервал означає, що УС був пред'явлений до БС (випереджальне сполучення) (Spooner and Kellogg, 1947)
Ці факти стають цілком зрозумілими, якщо ми згадаємо, що УС — це сигнал, який дозволяє тварині приготуватися до БС. Уявіть собі водія, що виїхав на невідому йому дорогу, що веде від Денвера до Солт-Лейк-Сити. Через 150 кілометрів від Денвера крутий поворот. Як попередити водія про майбутній віраж? В ідеалі дорожня служба помістить знак «Небезпечний поворот» на деякій відстані до повороту (аналогічно випереджальному зв'язку з коротким інтервалом). Це дасть водієві інформацію і час, щоб приготуватися до відповідного маневру. Важливо, щоб знак не з'явився занадто рано, тому що тоді водій не побачить зв'язку знака з дорогою. Природно, він не повірить дорожній службі, якщо вони встановлять знак відразу на виїзді за межі Денвера, тоді як сам поворот знаходиться в трьох годинах їзди від нього (випереджальний зв'язок з довгим інтервалом). Однак справа може виглядати ще гірше, якщо знак буде розміщений у самій середині віражу, тому що тепер він з'явиться занадто пізно, щоб бути корисним (одночасний зв'язок). І, нарешті, водій явно запідозрить злий намір, якщо знайде попереджуючий знак, що скромно стоїть біля дороги за 40 метрів після повороту (наступний зв'язок), хоча він повинен бути вдячний уже за те, що не знайшов його на дні яру.
Збіг
Відповідно до когнітивної теорії научіння, при класичному обумовлюванні тварина вчиться тому, що один стимул сигналізує про появу іншого. В одному з дослідів собака кілька разів чула, як починав стукати метроном, після чого вона одержувала м'ясний фарш. Але, безумовно, існувало і безліч інших стимулів. Одночасно з ударами метронома собака чула ляскіт дверей і звук голосів. Вона бачила стіни лабораторії й освітлювальні лампи, що звисають зі стелі. У той же час вона могла відчувати з десяток різних запахів.
І що ж повинна була вивчити собака? Якщо вона покладається на чисту випадковість, збіг, тоді вона буде зв'язувати їжу з усіма цими стимулами — метрономом, лампами і всім іншим. Зрештою, усі вони були одночасно з БС.
Але ми вже говорили, що умовна реакція — це процес підготовки до появи БС. І цілком ймовірно, тварині потрібна саме здатність пророкувати БС, щоб вона знала, коли починати підготовку, а коли не турбуватися. Наприклад, зв'язок між БС і лампами не має цінності: лампи, хоча і освітлювали приміщення перед подачею їжі, але вони були там і в той час, коли їжі не було й у згадці. Те ж саме відноситься і до запахів, і до більшості звуків у лабораторії: вони пов'язані з їжею, але вони точно так само пов'язані і з відсутністю їжі. Отже, жоден з цих стимулів не дає інформації про те, коли повинна з'явитися їжа, жоден з них не дозволяє собаці пророчити її наближення.
Тварині, мабуть, потрібна якась подія, яка обов'язково відбувалася перед появою їжі, а іншим часом була відсутня. І, звичайно, удари метронома в нашому прикладі були тим стимулом, що відповідав усім цим вимогам, оскільки вони ніколи не звучали в перервах між дослідами, коли їжа не з'являлася. Отже, коли тварина чує метроном, це вірна ознака того, що їжа на підході. Якщо тварині потрібний сигнал, вона повинна довідатися метроном, а не інші стимули, хоча вони і збігаються з бажаною подією.
Збіг і сполучення. Попередній приклад ілюструє аналітичну концепцію класичного обумовлювання, розроблену Робертом Рескорлой (Rescorla, 1967). Відповідно до цієї концепції, класичний умовний рефлекс зв'язаний не тільки зі сполученням УС-БС, але і з тими випадками, коли відсутність УС супроводжує відсутності БС. Ці два досвіди: «метроном / м'ясо» і «немає метронома / немає м'яса» — дозволяють собаці знайти, що наявність БС збігається з наявністю УС (тобто залежить від нього). Саме збіг, а не сполучення дозволяє тварині прогнозувати, яке подія буде наступної, і, згідно Рескорле, саме збіг є вирішальним для умовного рефлексу.
Збіг повиннен бути постійним, але в природі так буває не часто. Чорні хмари звичайно передують бурі, але не завжди. Хоча провісники погоди дуже недосконалі, проте вони інформативні, оскільки більш імовірно, що дощ піде, коли на небі темні хмари, а не яскраве сонце. Чи можуть тварини засвоїти ці відносні зв'язки? Як видно, можуть. Щоб продемонструвати це, Рескорла перевірив на пацюках різні комбінації звуку (УС) і удару струмом (БС). Для однієї групи пацюків поява звукового сигналу означала 40 % імовірність удару струмом, але струм пускався й у 40 % випадків без звукового попередження. У цій групі рефлекс не був встановлений. Для іншої групи пацюків імовірність ударів струмом після сигналу залишилася рівною 40 %, а от кількість ударів струмом без попередження було знижено, так що імовірність появи струму була нижча, коли сигналу не було, ніж коли він звучав. В другій групі рефлекс був встановлений. І чим більша різниця між цими імовірностями, тим сильніша встановлена реакція.
Відсутність збігу. Що ж відбувається, коли взагалі відсутній який-небудь збіг? У цьому випадку імовірність ударів струмом, про які попереджав сигнал, дорівнює імовірності ударів струмом без нього, тобто звуковий сигнал не несе інформації. Але тварина вчиться й у даному випадку: вона засвоює, що в цій ситуації є небезпека і вона не може почувати себе спокійно.
Щоб зрозуміти механізм цієї дії, розглянемо дві ситуації: у першої УС свідчить про те, що, імовірно, незабаром піде струм. Коли звучить УС, тварина лякається. Але коли УС ніемає, тварина може розслабитися, тому що зараз струм малоймовірний. Відсутність УС стає сигналом безпеки, інгібітором страху. В другій ситуації ніяка інформація не може пророчити появи струму. Тепер немає УС, що викликають страх, але з погляду тварини справи йдуть ще гірше. Без УС немає сигналу безпеки, і в результаті тварина постійна відчуває страх.
Розходження між тим ударом струму, коли є попередження, і ударами струму, що не попереджаються, можна віднести до розходження між страхом і тривожністю. Страх викликається конкретною ситуацією або конкретним об'єктом, тоді як тривожність постійна, безпредметна і відноситься до багатьох ситуацій. Багато авторів вважають, що така дифузійна тривожність частково викликається непередбачуваністю ситуації при відсутності сигналів безпеки (Seligman, 1975; Schwartz and Robbins, 1995).
КОГНІТИВНИЙ ПІДХІД ДО ІНСТРУМЕНТАЛЬНОГО ОБУМОВЛЮВАННЯ. Когнітивна теорія сприяла подальшому розвиткові концепції класичного обумовлювання, допомагаючи зрозуміти, що засвоюється і що забезпечує научіння. Подібний когнітивний підхід був застосований і до інструментального рефлексу. Тут научіння також має на увазі щось більше, ніж просто посилення чи послаблення реакції. У тварини з'являється внутрішня картина відносин між підкріпленням і реакцією, за якої воно випливає. Воно не просто учиться натискати на педаль, воно засвоює, що натискання на педаль приносить смачну їжу. У підсумку тварина учиться зв'язувати дія з одержуваним результатом; встановлювану в такий спосіб зв'язок прийнятий називати причинно-наслідковою (Tolman, 1932).
Докази існування причинно-наслідкових зв'язків
Результати багатьох досліджень показують, що набуття нових знань може і не викликати супровідних змін у поведінці. Тварина виявить свої нові знання тільки у тому випадку, якщо вони набувають значимості для організму. Для опису цього поведінкового феномену психологи використовують термін «латентне научіння» — научіння, що ще не проявилося у поведінці тварини.
Латентне научіння можна продемонструвати на різних прикладах. Класичним прикладом є експеримент, у якому пацюки досліджували лабіринт протягом десяти днів, не одержуючи ніякої винагороди. За цей час у їхній поведінці не відбулося яких-небудь помітних змін, але латентне научіння мало місце: пацюки навчилися орієнтуватися в коридорах лабіринту. Це стало очевидним на одинадцятий день, коли вперше була покладена їжа у виходу з лабіринту. Пацюки навчилися добігати до виходу майже миттєво і практично без помилок. Знання, які вони набули раніше, набули мотиваційного значення, і в такий спосіб пацюки швидко продемонстрували те, що вони вже знали.
ДОСЛІДЖЕННЯ СУЧАСНОЇ ПСИХОЛОГІЇ
ЗАБАВА
Соллі провів весь день, граючись з конструктором «Лего». Ніхто не спонукував його до цьому, і ніхто не заохочував його за це. Він грав з «Лего» просто тому, що це заняття його забавляло. Але що ми маємо на увазі, коли говоримо, що «робимо це просто заради забави»? Чи є забава чимось схожим на нагороду, як, наприклад, їжа чи грошова виплата?
Багато дослідників думають, що ми можемо розглядати поведінку Соллі відповідно до тих же принципів, які ми використовуємо для пояснення поведінки пацюка, що натискає на педаль. Нагорода не падає в око просто тому, що ми її поки не знайшли. Можливо, мама Соллі побачила його зайнятим, і її посмішка стала йому нагородою. Або, можливо, Соллі перед цим весь день нудьгував, і конструктор став для нього рятуванням від нудьги. З цього погляду, його гра це не що інше як реакцію уникання і мало чим відрізняється від поведінки собаки, яка стрибає через стінку вольєра, щоб уникнути удару електричним струмом.
Інші вчені заперечують: гра з «Лего» — це не те, що робиться заради якогось зовнішнього заохочення; навпроти, людина включається в гру через свій власний інтерес, гра і є її нагородою. І багато інших видів діяльності підтримуються такого ж роду внутрішньою винагородою. Уявіть собі художника, що малює картину за картиною, хоча б навіть його картини ніколи не виставлялися, їх залишала без уваги критика й у них не було покупців; або вченого, що наполягає у доказі сумнівної гіпотези, незважаючи на критику колег. У цих випадках поводження людини направляється тільки внутрішньою мотивацією, тому вчений продовжує свою роботу незважаючи на те, що зовнішнє заохочення залишається за іншим родом діяльності.
Але чи дійсно внутрішня нагорода кардинально відрізняється від зовнішньої? І чи виправданий поділ між поведінкою, мотивованою внутрішніми причинами, подібним тільки що описаним випадкам, і оперантною поведінкою, вивченою у лабораторних умовах? Авторитетні дослідження говорять, що так. В одному з експериментів дітям у дитячому садку спочатку дали можливість малювати картинки. Дітям явно сподобалося це заняття, і вони малювали постійно, при цьому не одержуючи ніякої іншої нагороди, крім задоволення від самої діяльності.
Потім експеримент був доповнений зовнішнім заохоченням: за малюнки дітей нагороджували барвистими грамотами «Гарний Майстер». Потім, через якийсь час, діти знову мали можливість малювати, але без нагородження грамотами. Тепер діти виявляли значно менший інтерес до малювання, чим спочатку, переважаючи проводити час за іншими заняттями .
Що ж відбулося? Одне з припущень зводиться до того, що грамоти «Гарний Майстер» змусили дітей по-іншому думати про малювання: вони вирішили, що малювання — це щось, за що дають нагороду. Сприймати його як забаву тепер стало недоречно. По суті справи, малювання перестало бути забавою і стало роботою. І тепер не було причини продовжувати малювання, не одержуючи за це нагороду.
При такій інтерпретації зовнішні винагороди (такі, як грамоти «Гарний Майстер») дійсно можуть затьмарити внутрішні нагороди. Якщо це вірно, то така тенденція насторожує. Призи часто використовуються для того, щоб стимулювати дітей, початківців читати. Чи можливо, що ці призи замінять те задоволення, що діти одержують від читання? Чи можливо, що діти будуть читати тільки заради призів і припинять читання, якщо їм не запропонувати за це нагороду? Деякі вчені вважають, що дослідження внутрішньої мотивації підтверджують ці пророцтва.
Інші по-іншому інтерпретують ситуацію: задоволення, стверджують вони, — це таке ж підкріплення, як всі інші, і експеримент із «Гарним Майстром» просто продемонстрував розповсюджений закон, відомий як ефект контрасту. Якщо пацюк, наприклад, звик отримувати дванадцять кульок корму за натискання педалі і раптом став одержувати тільки п'ять, менша нагорода буде видаватися йому образливою і реакція пацюка на цю незначну нагороду буде набагато слабшою. Однак якщо пацюк звик одержувати тільки одну кульку, тоді п'ять кульок покажуться йому бенкетом і її реакція стане швидшою і сильнішою. Результат експерименту з грамотою «Гарний Майстер», можливо, відбиває той же ефект: на початку дослідження для мотивації дітей було досить внутрішньої нагороди, укладеної в малюванні. Пізніше, однак, ця ж нагорода показалася незначної в порівнянні з більшої: внутрішнім задоволенням від малювання плюс грамота «Гарний Майстер». У результаті тепер нагороди, що здається менше, стало недостатньо для мотивації до продовження малювання.
Відповідно до даної точки зору, дія внутрішньої нагороди не відрізняється кардинальним образом від дії зовнішньої, вивченої в оперантної лабораторії. Вона діє точно так само, як діють смачна кулька для пацюка, похвала «Молодець!» або десятидоларові купюри — для людини.
Суперечка між прихильниками цих двох інтерпретацій продовжується; одні вважають, що внутрішнє задоволення має ту ж природу, що й зовнішнє заохочення; інші упевнені в тім, що це зовнішнє заохочення різні. Дискусія іноді стає гарячою, оскільки правильна відповідь дасть відповідь на питання: чи допоможе вивчення оперантного рефлексу зрозуміти, яке заохочення керує поведінкою? Або це всього лише дослідження того, як деяке заохочення керує деякими видами поведінки, а інша діяльність людини (творчість художника, радісна гра дитини) керується іншими механізмами? Ці питання мають велике значення для нашої роботи і для її практичного застосування (наприклад, у класі). Не дивно, що вони залишаються предметом напруженої, і — на жаль — дотепер не завершеної суперечки.
Збіг в інструментальному обумовлюванні
Ми вже знаємо, що класичний умовний рефлекс залежить від збігу між УС і БС, а не від простого їх сполучення. Подібне відношення зберігається і при інструментальному обумовлюванні. Тут відповідний збіг існує між дією і її результатом. Якщо дія — це натискання педалі, а результат — це харчова кулька, тоді збіг визначається імовірністю одержання кульки при натисканні педалі в порівнянні з імовірністю його одержання без натискання педалі. Якщо перша імовірність більша другої, одержання їжі збігається з натисканням педалі. Якщо обидві імовірності однакові, тут немає збігу — одержання їжі і натискання педалі не залежать одне від одного.
Реактивний контроль у дитини. Один з напрямків, що підтверджує важливість збігу при інструментальному научінні, — це дослідження дітей. В одному дослідженні новонароджені були поміщені в колиски, над якими були прикріплені каруселі з різнобарвними іграшками. Як тільки дитина рухала головою, вона замикала контакти реле у своїй подушці, і це запускало карусель у неї над головою, що весело кружляла кілька секунд. Діти незабаром навчилися вертіти головою і включати карусель. Явно одержуючи від цього задоволення, вони посміхалися, агукали і з захопленням дивилися на рух іграшок.
Для другої групи дітей була створена аналогічна ситуація, але з однією істотною різницею: їхні каруселі оберталися точно так само, як і в дітей першої групи, але вони включалися ззовні, а не самими дітьми. І це виявилося вирішальним фактором: кілька днів потому малята другої групи більше не сміялися і не агукали, дивлячись на карусель; схоже, їх зовсім не цікавило її обертання. Це наводить на думку, що малятам з першої групи подобалося не обертання каруселі саме по собі, а той факт, що вони могли її включати. Отже, діти можуть проводити поділ між реактивно-контрольованим і реактивно-незалежним результатом, вони можуть розрізняти ситуації, коли залежність присутня і коли вона відсутня. Дитина нітрохи не менше, ніж дорослі, хоче здійснювати деякий контроль над навколишнім світом. Навіть двомісячне маля хоче бути хазяїном своєї долі.
Вивчена безпорадність. Діти, що включають карусель, ілюструють радість керування. Ще одна дуже важлива серія досліджень показує розпач при повному неволодінні ситуацією. Вони присвячені вивченню ефекту вивченої безпорадності, придбаного відчуття того, що ти більше не можеш контролювати навколишнє, що приводить до сумного наслідку у вигляді відмови від подальших спроб змінити ситуацію.
У класичному експерименті, що демонструє вивчену безпорадність, використовуються дві групи собак, А і Б, що одержують сильний удар струмом, знаходячись у спеціальній запряжці і будучи стягнутими ременями. Собаки в групі А мають можливість контролю над ситуацією. Вони можуть виключити струм, натиснувши на панель, розташовану поруч з їхнім носом. Собаки в групі Б не мають такої можливості. Для них удар струмом — неминучий.
Кількість і тривалість електричних розрядів зовсім однакова для обох груп. Це гарантується тим, що для кожного собаки в групі А є відповідний собака в групі Б, що сполучена з даною. Як тільки собака в групі А відключає струм, він відключається і для другої собаки. Це забезпечує рівний розподіл фізичного страждання між тваринами в обох групах. Що їх розрізняє, так це можливість щось зробити в даній ситуації. Група А може здійснювати контроль над ситуацією, група Б може тільки терпіти.
Чому ж навчилися собаки групи Б в першій фазі цього експерименту? Щоб з'ясувати це, у другій фазі експерименту обидві групи були піддані стандартному тестові научіння униканню, у якому вони повинні були перестрибнути з одного вольєра в іншій, щоб уникнути ударів струму. Собаки в групі А легко засвоїли це завдання. Протягом декількох перших проб вони бігали як божевільні при подачі струму, але потім стрибали через перегородку в інший вольєр. Навіть більше — незабаром вони навчилися стрибати до того, як подавався струм, цілком уникаючи його в такий спосіб. У групі Б, групі, у якій собаки випробували неминучість ударів струму, усе було по-іншому. Спочатку ці собаки поводилися, як і собаки групи А: вони бігали, гавкали і т.д. Але незабаром вони стали набагато пасивнішими. Вони лягали, тихо скиглили і просто терпіли, коли подавався струм. Вони і не намагалися бігти від струму; вони просто припинили всякі спроби. У першій фазі експерименту вони дійсно об'єктивно були безпомічні, вони не могли нічого поробити. Але у вольєрі їхня безпорадність була суб'єктивною, оскільки тепер у них був спосіб полегшити свою долю. Але вони так і не знайшли її. Вони вивчилися бути безпомічними.
 
На малюнку показаний хід експерименту в загоні в двох груп собак. У кожній пробі тварина могла уникнути удару струмом або утекти від нього. Якщо собака стрибала протягом 10 секунд після УС, вона цілком уникала струму; якщо вона не стрибала протягом 60 секунд, дослід припинявся. Лінії показують, як часто стрибали собаки. Тварини в групі А (лінія I) попередньо одержували удар струмом, якого вони могли уникнути, використовуючи інструментальну реакцію. Тварини в групі Б (лінія II) одержували такий же удар струмом, але вони не могли нічого зробити в цій ситуації.
Безпорадність і депресія. Мартін Селігман, один з відкривачів ефекту виученої безпорадності, стверджував, що подібні механізми лежать в основі розвитку деяких видів депресії в людей. Подібно тваринам, що піддалися депресії, вони «просто сидять на місці». І ті й інші неохоче приймають той факт, що те, що вони роблять, може привести до успіху; і ті й інші худнуть і втрачають інтерес до навколишнього. Для Селігмана і його помічників ці паралелі означають, що причини, які лежать в основі депресії, в обох випадках — ті самі. Подібно безпомічному собаці, пацієнт, що страждає депресією, переконав себе, що його дії не мають сенсу. Селігман довів, що, подібно собаці, такий пацієнт виявлявся в стані хвороби, спочатку пройшовши ситуацію, у якій він був дійсно безпорадний. Якщо собака одержував неминучі удари струмом, знаходячись в упряжці, то хворий зіштовхнувся з важкою втратою, крахом кар'єри чи серйозною хворобою. В обох випадках результат один — впевненість у тому, що між дією і результатом немає ніякого зв'язку, так що варто і намагатися змінити ситуацію.
 
ВИДИ НАУЧІННЯ
 
• Які біологічні обмеження научіння, які приклади можна привести на основі наукових дослідів і повсякденного життя?
• Чому деякі види научіння вважаються механізмами адаптації і які можна привести приклади?
До останнього часу дослідники цікавилися в першу чергу відкриттям загальних законів научіння — законів, які застосовувалися до усіх видів, до будь-яких типів поведінки і будь-яких ситуацій. Ми, звичайно, знаємо, що люди і примати здатні до здійснення поведінки і пізнання на більш високих рівнях, ніж інші тварини, але все-таки цілком імовірно, що така поведінка засвоюється і підтримується тими самими загальними правилами.
Деякі принципи научіння дійсно здаються універсальними. Усвідомлення цієї спільності дозволило виробити нове уявлення про депресії на основі вивчення ефекту вивченої безпорадності в собак; завдяки дослідженню класичного умовного рефлексу в пацюків розширилося наше розуміння наркоманії. Різні види мають загальні біологічні риси і, імовірно, психологічні теж.
Протягом декількох останніх десятиліть дослідники почали приділяти усе більше і більше уваги розходженням між видами у щодо процесу научіння. На такому підході, зокрема, наполягають дослідники, що дотримують еволюційної точки зору на процес научіння.
БІОЛОГІЧНІ ОБМЕЖЕННЯ АСОЦІАТИВНОГО НАУЧІННЯ: СУМІСНИЦТВО
На зорі теорії научіння існувало розповсюджене переконання, що тварини здатні встановлювати зв'язок між будь-якими УС і БС (у класичному рефлексі) і проводити асоціації між будь-якою реакцією і підкріпленням (в інструментальному рефлексі). Собаку можна навчити, що звук, світло чи певний запах сигналізують про прибуття їжі. Подібним чином пацюка можна навчити натискати на педаль для одержання їжі або води або проходу до потенційного сексуального партнера.
 
За допомогою оперантних методів тварин можна навчити виконувати будь-як довільні дії, як у випадку з цією кішкою, що грає на піаніно.
Однак існують важливі біологічні обмеження, які роблять деякі реакції більш важкими для научіння, ніж інші. Кішка засвоїла складне для неї натискання клавіш піаніно заради їжі, завдяки своїй природній схильності випрошувати корм у людей (або, будучи кошеням, у своєї матері)
Цей підхід іноді називають принципом рівнопотенційності, вважаючи, що існує рівний потенціал для встановлення будь-якої асоціації, яку б ми не вибрали. Однак багато фактів суперечать такому підходові. Кожен вид має визначені схильності до формування одних асоціацій і не має їх щодо інших. Це накладає біологічні обмеження на видове научіння, диктуючи, чому вид може навчитися легко і чому не зможе навчитися взагалі. Ці обмеження, імовірно, мають генетичну природу і дозволяють кожному видові легко пристосуватися до вимог того середовища, у якій він живе.
Взаємозв'язку між УС і БС при класичному обумовлюванні
Біологічні обмеження в научінні з'являються внаслідок того, що, з погляду тварини, деякі стимули сполучаються, а деякі — ні; це правило явно суперечить принципові рівнопотенційності. Докази цього явища сумісності в основному виникають з досліджень вивченої харчової аверсії.
Сумісництво і вивчена харчова аверсія. Пацюки — явні експерти в тому, що стосується вміння уникати їжі, яка у минулому стала причиною хвороби. Саме тому так важко винищити їх отрутою: пацюк куштує маленький шматочок отруєної їжі, занедужує, потім видужує і, з тих пір уникає конкретного смаку: тварина стала обережнішою. Подібний ефект можна спостерігати й у лабораторії. Досліджуваній тварині (зазвичай пацюкам) дають речовину з визначеним смаком, наприклад, воду зі штучним підсолоджувачем, сахарином. Після того як пацюки вип'ють цю воду, їх опромінюють рентгенівськими променями, не смертельно, але достатньо, щоб пацюки занедужали. Після видужання, якщо дати їм вибір між звичайною водою і сахариновим розчином, вони відмовляться пити солодку воду, хоча явно віддавали перевагу їй до хвороби.
Цей вид вивченої харчової аверсії, швидше за все, заснований на класичному умовному рефлексі. УС — це визначений смак (у даному випадку, солодкий), а БС — це відчуття хвороби. Класичний умовний рефлекс встановлюється надзвичайно швидко й одного сполучення УС-БС досить, щоб закріпився зв'язок. Учені називають це разовим научінням.
Виучена харчова аверсія характеризується ще одною чудовою особливістю. В одному з ранніх дослідів голодним пацюкам дали пити солодку воду через питну трубочку. Варто було пацюку лише лизнути отвір цієї трубочки, як спалахувало яскраве світло і лунав голосний звук. Таким чином, відчуття солодкого смаку, яскравого світла і голосного звуку згрупувалися в єдине ціле; якщо з'являлося одне з них, виходить, з'являлися усі. Якийсь час потому одна група цих пацюків одержала удар струмом по лапах, інша група одержала дозу опромінення, достатню, щоб викликати променеву хворобу.
Помітьте, що ми маємо дві різних БС: хвороби для однієї групи й удар струмом по лапах в іншої. До цього ж, обидві групи одержали ще потрійний УС: підсолоджена вода + яскраве світло + голосний звук. Виникає питання: як тварини сполучають ці умовні стимули? Що з чим асоціюється? Щоб знайти це, експериментатори помістили пацюків у нові дослідні умови. Вони дали деяким пацюкам підсолоджену сахарином воду, але без супроводу світла або звуку. Пацюки, які одержали удар струмом, продовжували пити цю воду: очевидно, вони не пов'язували цей БС із солодким смаком. Однак пацюки, які занедужали після опромінення їх рентгенівськими променями, відмовилися пити цю воду, хоча світло і звук також були відсутні. Вони пов'язали свою хворобу саме із солодким смаком (табл. 4.1).
 
Іншим пацюкам пропонувалася чиста несмачна вода, супроводжувана світловими і звуковими стимулами, використаними при тренуванні. Цього разу поведінка було оберненою: пацюки, які перенесли хворобу, не відмовлялися від води; вони не асоціювали хворобу зі світлом і звуком. Пацюка, що одержали удар струмом, відкинули воду. У їхній свідомості біль пов'язувався з яскравим світлом і голосним звуком.
Ці факти спростовують принцип рівнопотенційності. Для пацюків солодкий смак пов'язаний з хворобою, світло і звук — із зовнішнім болем. І для даного виду такий зв'язок має глибокий біологічний зміст. Причиною хвороби для багатьох живих організмів, імовірніше всього, є якась нова або зіпсована їжа. І на волі пацюка найчастіше перевіряють свою їжу по запаху. У зв'язку з цим пацюки уникають смак, пов'язаний з хворобою, прагнучи не занедужати ще раз від отруйних ягід чи зіпсованого м'яса. У звичці пацюка щоразу після болю в животі запитувати себе: «А що я їв?» — вкладена життєво важлива цінність.
Відзначимо, однак, що закономірності асоціювання стимулів варіюють від виду до виду. Птахи звичайно схильні пов'язувати хвороби з зоровими стимулами. Пацюки (і багато інших ссавців) пов'язують хворобу зі смаковими стимулами. У кожному конкретному випадку цей шаблон схиляє тварину до встановлення зв'язків визначеного роду.
Виучена харчова аверсія й інтервал між УС і БС. Вивчена харчова аверсія помітна ще по одній причині. У більшості прикладів класичного обумовлювання інтервал між УС і БС повинен бути відносно коротким; якщо ці дві події розділяє більше, ніж кілька секунд, процес научіння протікає дуже повільно. А от для вивченої харчовий аверсії оптимальний період — біля години. Якщо інтервал між УС і БС набагато коротший, засвоєння рефлексу сповільнюється; але харчова аверсія все-таки встановлюється, якщо інтервал досягає 24 годин.
Дотепер не вщухають суперечки з приводу того, як тварині вдається пов'язувати між собою події, що так далеко знаходяться за часом одна від одної. Але який би не був механізм, біологічний зміст цього феномену досить зрозумілий: тільки що з'їдена їжа не впливає на організм тварини протягом багатьох хвилин (або годин) через дуже повільний процес травлення й всмоктування. За таких обставин механізм, який дозволяє тварині пов'язувати внутрішній розлад зі смаком, випробуваним давно, має величезне адаптивне значення.
Харчова аверсія в людей. Уявіть собі людину, яка насолоджується після сімейного обіду найсмачнішою кулькою полуничного морозива. На жаль, ця людина занедужала грипом, і пізніше, увечері, у неї починається сильна нудота. Вона знає, що в неї грип (існує безліч інших симптомів). І вона знає, що морозиво тут ні до чого (зрештою, інша родина з'їла той же десерт зовсім без наслідків). Але, незважаючи на цю впевненість, у цієї людини, точно так само як і в пацюка, напевно сформується смакова відраза. Одне згадування про полуничне морозиво буде викликати неприємний спогад, і ця реакція може тривати роками.
Харчова аверсія в людей подає важливу інформацію про научіння, але вона має і практичне значення. Онкологічні хворі, які піддаються хіміотерапії, часто страждають від сильної нудоти як побічного ефекту ліків. Ця нудота може привести до відрази до їжі, яка вживалася перед лікуванням, а це в окремих випадках може призвести до повного відмовляння від їжі. Це було продемонстровано в дослідженнях, у яких хворим перед сеансом хіміотерапії було запропоноване морозиво з новим смаком. У багатьох пацієнтів розвилася сильна аверсія по відношенню саме до цього смаку, незважаючи на те, що вони знали: нудота викликана хіміотерапією, а зовсім не морозивом. Ці дослідження наводять на думку, що небажання таких хворих їсти можна зменшити, уникаючи вживання їжі - особливо нових продуктів — безпосередньо перед сеансом лікування.
Причинно-наслідкові зв'язки у інструментальному обумовлюванні. Очевидно, що взаємозв'язки між УС і БС під час  класичного обумовлювання не є довільними. УС сполучається з визначеними БС і не сполучається з іншими. Подібне спостерігається і під час інструментального обумовлювання: з точки зору тварин, визначені реакції сполучаються з одними підкріпленнями і не сполучаються з іншими.
Розглянемо голуба, що стукає дзьобом у Скіннерівській шухляді. Голуба легко навчити клювати світлу виїмку для того, щоб одержати в нагороду їжу або питво. Але надзвичайно важко навчити голуба робити це для того, щоб уникнути електричного струму. І навпаки, дуже легко навчити його стрибати і махати крилами для того, щоб уникнути удару струмом, але важко змусити голуба робити цей же руху, щоб одержати їжу або питво.
На думку Роберта Боллеса, ці спостереження відбивають той факт, що більшість тварин у ситуації небезпеки демонструють вроджені реакції. Для голуба специфічною вродженою видовою захисною реакцією є швидка локомоція. Тобто не потрібно учити голуба летіти, коли йому загрожує небезпека; це — природна реакція птаха. Точно так само птахи легко вчаться підстрибувати і махати крилами, наражаючись на небезпеку, оскільки ці рухи дуже близькі до вродженої захисної реакції. А от реакція клювання дуже далека від захисної, тому голубові дуже важко навчитися клювати, прагнучи уникнути небезпеки.
Подібна логіка добре пояснює, чому голубові легко навчитися клювати світлу виїмку в шухляді, щоб одержати їжу. Клювання — це природна дія голуба при споживанні їжі, так що реакція на цю виїмку всього лише відбиває його нормальну поведінку. По суті, голуб реагує на виїмку точно так само, як він реагує на винагороду. І фактично його клювання заглибини в шухляді подібне до клюванню зерна під час годування.
«Неправильна» поведінка тварин
Подальші спростування принципу рівнопотенційності можна знайти в спостереженнях психологів, які навчають тварин для рекламних виступів. Вище ми згадували про ці випадки, говорячи про дресирування, і в загальному таке тренування може дати дуже багато. Однак у деяких випадках тварини поводяться «неправильно» дуже цікавим чином. Прикладом може служити єнот, який повинен був підібрати кілька розсипаних монет і потім помістити їх у маленький контейнер. Спочатку за виконану дію — збирання монет — тварина винагороджувалася шматочком їжі. Як тільки цього було досягнуто, єнота почали заохочувати тільки в тому випадку, якщо він не просто збирав монети, але і кидав їх у контейнер. Це було нелегко, тому що єнот не хотів опускати монети. Він тер монети об контейнер, витягав їх назад, стискав і опускав у контейнер тільки після помітного вагання.
Наступний крок був ще важчий. Тепер від тварини вимагалася поведінка зразкового вкладника банку, він тер монети одну об одну, опускав у контейнер, витягав знову, тер їх і т.д. Єнот повертався до специфічної видової поведінки: на волі єноти звичайно труть шматки їжі один об другий, вмочають їх у воду або «полощуть». Така ж поведінка проявилася під час навчання, незважаючи на заохочення протилежного. Тут, як і в інших прикладах, відносини між інструментальною реакцією і підкріпленням не довільні. Тренери хотіли навчити єнота виконувати нову дію (опускання двох монет), але єнот завзято виконував ті дії, які біологічно закріплені для даної ситуації (Вгеіапсі аші Вгеіапсі, 1961).
НАУЧІННЯ ЯК АДАПТАЦІЯ
Отже, тварини біологічно схильні до виконання одних дій і не готові до виконання інших. Ясно, що методи научіння повинні бути певним чином модифіковані, щоб включати відносини між конкретним УС і конкретним БС або визначеним підкріпленням і визначеною реакцією. Деякі вчені йдуть ще далі. Вони вважають, що недостатньо просто модифікувати існуючі методи научіння і що нам, імовірно, просто потрібні нові. Причина цього, на їх думку, полягає в тому, що деякі форми научіння не універсальні, а досить специфічні для виду, що проходить научіння (так само як і те, що складає предмет научіння).
Розходження в научінні  різних видів.Різні види мають надзвичайно різну анатомію і настільки ж різну поведінку: леви підкрадаються, антилопи тікають, а гієни чекають віддалік, щоб підібрати залишки. Така ж варіативність виявляється, коли ми розглядаємо процес научіння. Прихильники еволюційної теорії вважають, що одні тварини вчаться таким чином, яким інші вчитися не можуть.
Часто використовуваний приклад — це лускунчик Кларка, птах, який гніздиться на американському Південно-Заході і є далеким родичкем ворони і сойки. Влітку цей птах ховає тисячі кедрових горіхів у рівних затишних місцях на площі в кілька квадратних кілометрів. Потім, взимку і напровесні, лускунчик повертається знову і знову, щоб відкопувати тисячі своїх схованок. Птах не позначає таємні місця якимось спеціальним чином. Він покладається на свою дивну пам'ять — здатність, якою багато хто з нас хотів би володіти.
Ми знаємо, що лускунчик Кларка має безліч анатомічних особливостей, яких немає в інших птахів і які допомагають йому ховати їжу. Наприклад, цей птах має спеціальний мішечок під язиком, який він наповнює горіхами, коли летить, щоб знайти місце для схованки. Прекрасна просторова пам'ять птаха і його незвичайна здатність впізнавати величезну кількість географічних об'єктів, імовірно, є продуктом еволюційної адаптації. І так само як мішечок під язиком, ця здатність до научіння є особливістю даного виду: родинні птахи, такі як сойки і голуби, не зберігають їжу подібним чином і в тестах демонструють біднішу просторову пам'ять.
Багато явищ научіння тварин - птахів, риб і ссавців — таять у собі подібні особливості. У кожному конкретному випадку тварина володіє певною незвичайною здатністю, якої немає навіть у родинних тварин, причому ця здатність має величезну цінність для виживання. І в кожному випадку ця здатність дивно вузька: лускунчик не має спеціальної навички для запам'ятовування зображення або форми; його дивна пам'ять виявляється тільки у відповідній дії — у перебуванні схованок горіхів. Подібним чином багато птахів виявляють яскравий талант у розучуванні конкретних пісень, які виконуються їхнім видом, але ця навичка не може бути використана для інших цілей: смугастий зяблик легко засвоює ноти пісні смугастого зяблика, але зовсім не здатний вивчити будь-яку іншу послідовність звуків такої ж довжини і складності.
Таким чином, існують особливі здібності до научіння, якими володіють визначені види і які застосовуються до конкретних задач, які мають першорядну важливість для виживання цих видів.
 
ПОДІБНІСТЬ СПОСОБІВ НАУЧІННЯ В РІЗНИХ ВИДІВ
 
Еволюційний підхід неминуче приводить до наступного питання. Різні види живуть у різних умовах і мають різні життєві потреби. Вони мають потребу в різних навичках і, ймовірно, навчаються різними способами. Але якщо це так, чому ж так багато загального в процесі научіння між видами? Тобто, більш конкретно, пацюки і голуби не збирають їжу так, як бджоли, у них інший спосіб спілкування з родичами, вони мають нервову систему, зовсім іншу, ніж у бджіл, і пройшли зовсім інший еволюційний шлях. Тому було б природно вважати, що в них і зовсім різні способи научіння. І все-таки, як ми неодноразово зауважували, основні явища умовного рефлексу в бджіл виявляються точно так само, як у пацюків або голубів.
Ми можемо пояснити спеціальні способи научіння, якщо звернемося до еволюційної історії виду і його еволюційної ніши. Але як пояснити не менш важливий факт, що існує стільки загальних для усіх видів способів научіння?
Відповідь на питання криється в тому, що хоча різні тварини живуть у різних умовах, усі вони, проте, живуть в одному фізичному світі. Тому усі вони підкоряються законові всесвітнього тяжіння. Усім потрібна енергія, щоб вижити. І всім потрібно знати деякі речі: у нашому загальному світі варто бути готовим до подій, які наближаються, і ця підготовка стає можливою завдяки тому, що деякі події передбачувані за рахунок інших подій (або залежать від них). У нашому загальному світі на результат часто впливає також наша систематична поведінка. В кінцевому підсумку всім тваринам корисно знати про наслідки своїх дій і відповідним чином змінювати свою поведінку в майбутньому.
Багато способів научіння є загальними для усіх видів, тому що фізичний світ до всіх висуває аналогічні вимоги. Лосі, коні, люди — всі підвищують свої шанси на виживання, коли вчаться передбачати наступаючі події і готуватися до них. Не дивно, що в кожного є здатність до вироблення класичного умовного рефлексу. Специфічні психічні процеси, які забезпечують таке научіння, можуть розрізнятися між видами, але характеристики научіння ті ж самі, оскільки вони— природний наслідок зв'язку подій у світі. Як приклад можна привести переваги випереджального обумовлювання в порівнянні з наступним — природний результат того факту, що в нашому світі час тече в одному напрямку і причина завжди визначає наслідок.
Те ж саме відноситься і до інструментального обумовлювання: будь-який вид намагається повторювати дії, які добре показали себе в минулому, і відмовлятися від дій, що не привели до успіху. Отже, ми можемо очікувати природного добору у відношенні механізмів, що дозволяють тварині визначати зв'язок між своїми діями і їх наслідками. Саме ці механізми забезпечують інструментальний умовний рефлекс.
Таким чином, існують прагматичні причини того, чому основи научіння є (і, імовірно, повинні бути) загальними для усіх видів. І оскільки наш підхід до научіння повинний враховувати деякі важливі видоспецифічні розходження в тому, як научіння здійснюється, він також повинен відбивати і деякі загальні принципи, наприклад, ті, які лежать в основі класичного й інструментального рефлексів. Тварини дійсно розрізняються в тому, як і чому вони вчаться, але ми також можемо виявити важливі основи, часто досить специфічні, котрі описують научіння в рамках видів і ситуацій, що виходять за межі звичайних.
 
Нейрофізіологічні основи научіння
 
У попередньому розділі ми задавалися питанням, чому багато тварин демонструють здатність до того, що ми називаємо класичним і інструментальним рефлексами. Схоже питання полягає в тому, як вони забезпечують появу цих форм научіння. Які механізми роблять таке научіння можливим?
Майже напевно научіння полягає в зміні функціонування нервової системи, її стану і міжнейронних зв'язків. В окремих випадках научіння появляється в рості нових синапсів чи дезактивації існуючих. В інших випадках у нейронів може змінюватися чутливість до стимуляції або кількості виділюваного нейротрансміттеру, яка виділяється під час стимуляції. У будь-якому випадку, однак, научіння пов'язано з пластичністю нервової системи — здатністю нейронів до функціональної зміни внаслідок отриманого досвіду. Але як відбувається ця зміна?
Щоб з'ясувати, яка фізіологічна основа процесу научіння, учені звернулися до поширеної дослідницької стратегії: спочатку вивчили функції відносно простої системи, а потім доповнювали її новою інформацією, щоб пояснити більш складні випадки. Велика частина з того, що ми знаємо про пластичність нервової системи, почерпнута з вивчення морського молюска Aplisia.
Цей молюск має дуже просту нервову систему з усього лише двадцятьма тисячами нейронів або біля того (для порівняння: мозок людини містить приблизно мільярд клітин). Поведінка Aplisia також досить проста. В основному вони просто повзають і харчуються водоростями. У випадку погрози при торканні або поштовху Aplisia втягує обидва свої зябра, зазвичай розгорнуті вздовж спини, і свій трубчастий сифон, що всмоктує воду і пропускає її через зябра.
Що робить Aplisia особливо цінним для дослідників, так це здатність тварини до простої форми класичного рефлексу: у кожній навчальній пробі до тварини спочатку злегка доторкалися в районі його сифона (УС), а через якийсь час випливав удар по хвосту (БС). Спочатку дотику було недостатньо, щоб запустити реакцію, її викликав удар по хвосту. Але після декількох сполучень УС і ВР тварина стала реагувати і на УС, що привело до появи нової реакції — УР.
Учені виділили два механізми, що забезпечують цю УР. По-перше, що певний досвід може змусити пресинаптичний нейрон (нейрон, що відправляє сигнал) змінити кількість виділюваного нейротрансміттера. По-друге, постсинаптичні нейрони (нейрони, що приймають сигнал) можуть змінити свій рівень реагування, ставши більш чуттєвими до сигналів, що надходять, — феномен, відомий як довгостроковий потенціал. Він називається довгостроковим тому, що зміни, які відбулися, тривають довго: їх можна розпізнавати через кілька днів чи навіть тижнів після «научіння».
Уточнимо, що те, чому учиться Aplisia, надзвичайно просто, і можна бути впевненим, що інші організми використовують механізми, відмінні від того, що використовує Арlіsіа. Але, незважаючи на це, наше розуміння простих механізмів, безсумнівно, означає великий крок уперед. Дослідники тепер можуть детально описати, як досвід змінює функціонування нейронів, і результат досвіду, отриманий при спостереженні за поведінкою молюска, є важливою ступінню до розуміння пластичності більш складних нервових систем.
 
СКЛАДНІ ФОРМИ ПІЗНАННЯ У ТВАРИН
 
• Що таке когнітивні карти і які докази того, що деякі види створюють такі карти?
• Які докази того, що деякі тварини можуть демонструвати інсайт і вирішувати абстрактні задачі?
Як ми вже з'ясували, тварини часто знають що-небудь, не виявляючи своїх знань у поведінці. Але яка природа цих знань? Як вони зберігаються і використовуються? 
КОГНІТИВНІ КАРТИ
Вище, розглядаючи латентне научіння, ми згадували тезу Толмена про те, що тварина може створювати когнітивну карту (уявлення про просторове розташування, щяке показує, що де знаходиться і що до чого веде). Виявилося, що такі знання про простір можуть бути дуже складними. Деякі факти були отримані при дослідженні поведінки пацюків у зіркоподібному лабіринті з центральною платформою посередині, від якої розходилися 8 доріжок, подібно до спиць у колесі (мал. 4.24). В одному з експериментів в кінці кожної доріжки поклали їстівну кульку. Голодний пацюка помістили на центральну платформу, дозволивши йому вільно рухатися. Він небагато озирнувся, потім вирушив по одній з доріжок, дійшов до її кінця, знайшов там кульку і з'їв її. Через якийсь час пацюк повернувся в центр лабіринту.
 
Їстівна кулька розташована в кінці кожної доріжки, так що пацюк зможе отримати нагороду при найменших зусиллях, вибравши кожну з доріжок тільки один раз
Що він повинен був робити далі? Оптимальною стратегією для пацюка було не повертатися на ту доріжку, де він вже з'їв кульку, тому що тепер там нічого не було. Отже, пацюк повинен був йти по кожній доріжці лише один раз, одержавши в такий спосіб максимум їжі при мінімумі витрат. Щоб домогтися цього, пацюку потрібно було вивчити планування лабіринту і запам'ятати, де він був, а де ні. Для пацюка це не склало великих труднощів, і завдання було виконане практично ідеально: у даному восьмиконечному лабіринті пацюки вибирали в середньому 7,9 доріжки з 8 можливих.
 
ІНСАЙТНА ПОВЕДІНКА
 
Схоже, що термін «когнітивна карта» — це щось набагато більше, ніж просто мовний образ: деяке просторове уявлення території дійсно існує у свідомості тварини. І знову наше дослідження форм научіння не може бути зведено тільки до опису поведінки і змін у поведінці. У першу чергу нам варто звернутися до процесу пізнання (і, ймовірно, складного пізнання), здійснюваного твариною. Роль пізнання виступає на перший план і при вивченні інсайтної поведінки.
Торндайк стверджував, що тварини вирішують свої проблеми методом проб і помилок: закон ефекту закріплює поведінку, яка привела до успіху, і послабляє поведінку, яке привела до невдачі. Однак це твердження було спростовано німецьким психологом Вольфгангом Кьолером (1887-1968).
Кьолер вважав, що принаймні деякі тварини здатні до інтелектуальної поведінки. Безумовно, кішки Торндайка виявляли мало ознак розуміння проблемної шухляди, але, імовірно, кішки — не кращі випробувані для визначення вищих досягнень тваринного інтелекту. Більш близькі до людини тварини, такі як шимпанзе, можна вважати кращим вибором. Що ще важливіше, Келер вважав, що Торндайк спровокував використання методу проб і помилок, пропонуючи своїм кішкам вирішувати проблеми, які неможливо було вирішити ніяк інакше. Так, навіть суперінтелектуальний кіт міг додуматися смикнути за петлю, що витягає дверну клямку, лише випадково; іншого шляху рішення цієї проблеми не було, тому що всі потрібні мотузки і блоки були заховані від його погляду. Для Келера більшу важливість мають питання про те, чи буде виявлятися інтелект у поведінці тварин за таких умов, коли усі варіанти рішення будуть представлені наочно.
Метод Келера був простий. Шимпанзе поміщали на обгороджену ігрову площадку. За межами цієї площадки клали бажану принаду (звичайно банани); щоб дістати цю принаду, мавпі приходилося використовувати який-небудь прилеглий предмет як інструмент. У тварин не виникало проблем з цим завданням. Вони навчилися використовувати ціпки як граблі, щоб витягати банани, що лежать на землі поруч з огорожею, але поза досяжністю руки. Вони також навчилися використовувати ці ціпки як кийка, щоб збивати банани, що висять занадто високо над їх головою. Деякі шимпанзе використовували ціпок як шест. Вони ставили його прямо під бананом, вертикально піднімалися по всій його пятиметровій висоті і хапали свою нагороду саме в той момент, коли шест починав падати (разюча інтелектуальна, а також гімнастична вправність, що „показує силу здорової свідомості в здоровому тілі). Шимпанзе також навчилися використовувати шухляди, які вони переносили, щоб, стаючи на них, схопити свій приз. По суті, вони навіть ставали будівельниками, ставлячи шухляди одну на одну. У результаті вони споруджували споруду з чотирьох (досить хибких) ярусів, оскільки Келер спонукав їх до усе більших архітектурних досягнень, збільшуючи висоту розташування принади над землею.
Іноді мавпи випадково ставали виробниками знарядь, так само як і їхніми користувачами: наприклад, коли їм потрібна була палиця, вони ламали гілку найближчого дерева. Ще більш вражаючою була кмітливість одного дуже талановитого шимпанзе по імені Султан, який побачив банан на дуже великій відстані від огорожі. На його площадці лежали два бамбукові ціпки, але жоден з них не був достатньо довгим, щоб дістати банан. Після безлічі безуспішних спроб підсунути банан як-небудь одним ціпком Султан нарешті знайшов рішення. Він вставив тонший з двох ціпків в отвір товстішого і все-таки підсунув до себе банан.
Кьолер довів, що ці досягнення не були результатом ні використання методу проб і помилок, ні механічного закріплення тенденцій, що намітилися, у поведінці. Навпаки, тварини поводилися так, начебто досягли інсайту щодо рішення проблеми. Кьолер запропонував кілька зауважень у підтримку цього висновку. По-перше, інсайт-рішення часто приходило зовсім зненацька, іноді після паузи, протягом якої шимпанзе рухало тільки головою й очима, начебто вивчало ситуацію. По-друге, після того як кожна з проблем вирішувалася, тварини могли легко і просто вирішувати її знову і знову, немов знаючи, що вони роблять. Поведінка шимпанзе разюче відрізнялася від поведінки торндайнівських кішок, які продовжували зазнавати невдач протягом багатьох дослідів, навіть після свого першого успіху.
Цілісні категорії сприйняття у тварин
Кьолера вразив інсайт, який продемонстрували його шимпанзе. Його також вразила їхня здатність розпізнавати цілісні категорії сприйняття; усі шимпанзе використовували шухляди і ціпки, а Султан «задіяв» навіть самого Кьолера: один раз він тяг Кьолера доти, поки той не став під бананом, і потім виліз по ньому, щоб узяти фрукт. Але цілісні категорії сприйняття можуть виявлятися й у інших тварин. Наприклад, голубів в одному дослідженні навчали стукати дзьобом по виїмці при пред'явленні картинки з водою і не стукати в інших випадках. На деяких картинках з водою була зображена проточна вода, на інших — нерухома; деякі зображували великі водойми, зняті здалеку, інші — калюжі, сфотографовані зблизька. Незважаючи на ці розходження, голуби швидко освоїли це завдання на розрізнення і, схоже, вловили категорію води. Подібні досліди показали, що голуби можуть розрізняти картинки з деревами і без них, зі значною варіативністю дерев на картинках. Так, голуби можуть навчитися клювати у відповідь на пред'явлення картинки з деревом, покритим листям, і деревом без листя, але вони не будуть клювати, побачивши зображення телеграфного стовпа або стебла селери.
На основі цих дослідів деякі дослідники прийшли до висновку, що в голубів існують поняття води, дерева і т.п. Якщо навіть це і так, то, безумовно, ці поняття — зовсім інші, ніж у людей. Люди, так само як і голуби, впізнають зображення води, але вони мають безліч знань щодо того, що стосується води і зв'язків води з іншими поняттями. Те, що засвоюють голуби, — це комплекс відмінних ознак, але він дуже далекий від тих знань, якими володіє людина.
Абстрактні поняття у тварин
Як же у тварин виглядають справи з абстрактними поняттями й абстрактними відносинами? Дуже багато досліджень присвячено цій проблемі, причому особливий акцент робився на виявленні відносин подібності і відмінності.
Деякі факти були почерпнуті з досліджень Анни і Девіда Премак, що намагалися задокументувати когнітивні здібності декількох шимпанзе, у тому числі і своєї видатної учениці — Сари. В одному з експериментів мавпам показували три предмети. Один з них служив зразком, два інших — альтернативами. Задачею тварини було вибрати ту альтернативу, що відповідала зразкові. Припустимо, альтернативами є трикутник і квадрат. Якщо зразок теж трикутний, то трикутник — це правильний вибір. Якщо зразок квадратний, тоді правильний вибір — квадрат. Ця методика зветься підбор пари (мал. 4.27). Шимпанзе досить легко справилися з цим завданням. Усього лише після декількох проб Сара і деякі з її подруг цілком усвідомили, що це було завдання, що включає відносини тотожності. Це було видно з того факту, що вони з легкістю вирішували нові варіанти задачі, безпомилково виконуючи них з першої спроби.
А що можна сказати про голубів? Чи можуть вони так само легко справлятися з подібним завданням? Відповідь: так, але після достатнього тренування. Наприклад, голуба можна навчити клювати в зелене віконечко, а не в жовте, якщо зразок зелений, і клювати в жовте, якщо зразок жовтий. Але чому саме учиться голуб у цій ситуації? Чи розуміє він це як спеціальне правило: «Коли бачиш жовтий, клюй жовтий, коли бачиш червоний, клюй червоний»? Або він засвоює це трохи ширше: «Клюй у те віконечко, що має той же колір, що і зразок»?
Щоб зрозуміти це, спробуємо видозмінити тренувальний тест. Візьмемо голуба, який навчили збирати зелене до зеленого і жовте до жовтого. Практика показує, що цей голуб може зробити правильний вибір, якщо тепер його попросити зібрати червоне до червоного. Але птах не справиться, якщо завданням буде зібрати трикутник до трикутника. Це доводить, що птах засвоює не широке поняття подібності, а більш вузьку ідею подібного кольору.
Як шимпанзе виконують такий перенос із тренувального тесту? Принаймні, деякі з них справляються з цією роботою цілком успішно. Сара, наприклад, навчилася використовувати два спеціальних пластикових жетони для встановлення подібності і відмінності. Спочатку їй показували два однакових предмети, наприклад два кружки, і потім давали жетон, що означає подібність. Її задачею було покласти цей жетон між двома кружечками. Потім їй показували два різних предмети, таких, як кружка і ложка, і давали ще один жетон, що допускає відмінність. Тут від неї вимагалося покласти жетон для поділу кухля і ложки. Після декількох таких проб вона була протестована з декількома парами різних і однакових предметів. Сара повинна була виявити їхню подібність або відмінність, поклавши відповідний жетон між ними. Начебто експериментатор запитував неї: «Однакове або різне?», і Сара відповідала за допомогою правильного пластикового «слова». Сара виконувала завдання цього тесту безпомилково.
Не дивно, що понятійні операції голубів обмежені в порівнянні із шимпанзе, так само як досягнення шимпанзе обмежені в порівнянні з нашими. Однак ці експерименти дозволили нам простежити відмінності між видами, завдяки міцній основі фактів, з яких ми змогли зробити висновки про відмінності форм пізнання серед видів і про те, як відбувається пізнання тварин і людей.
 
ПІДВЕДЕННЯ ПІДСУМКІВ
 
Наукові дослідження научіння у тварин почалися з робіт І. П. Павлова і Е. Л. Торндайка біля ста років тому; вони і їхні ідейні спадкоємці, безперечно, відкрили багато фундаментальних феноменів процесу научіння. Однак чи були ці дослідники праві у своїй впевненості, що відкриті ними принципи лежать в основі усіх форм научіння? Це все ще предмет наукових досліджень. Багато інтелектуальних досягнень у людини і тварин: інсайт-рішення, абстрактні поняття й особливо людська мова, — імовірно, вимагають іншого пояснення. Але немає сумніву в тому, що дослідження процесів встановлення і відображення зв'язків між УС і БС, а також між реакцією і підкріпленням є ключем до розуміння фундаментальної природи процесу научіння як у тварин, так і в людей.
У центрі уваги перших дослідників знаходилася дія, те, як класичний і інструментальний рефлекси змінюють поведінку тварини: собаки Павлова виділяли слину під удари метронома, кішки Торндайка виконували всілякі нові трюки. Але, як ми побачили, ці зміни зовнішнього поведінки — тільки один аспект того, що відбувалося з цими тваринами; вони є проявами скоріше навички, ніж суті научіння. Тому, на відміну від Павлова і Торндайка, які займалися зовнішньою поведінкою, сучасні дослідники поведінки тварин показали, що у своїй основі класичне й інструментальне обумовлювання (і багато інших форм научіння) залежать від пізнання. Пацюка, риби, голуби, навіть молюски — всі вчаться визначати, які події можуть викликати інші події і яка дія до якого результату призведе. Це й інші явища свідчать про те, що психічні функції поширюються не тільки на те, що тварини роблять, але і на те, що вони знають.
Психологія обов'язково повинна займатися і дією і знанням. Під час дослідження научіння в тварин ми приділили увагу і тому й іншому, оскільки ця тема є мостом між цими двома важливими проблемами. 
 
ПИТАННЯ ДЛЯ КРИТИЧНОГО МІРКУВАННЯ
 
1. Чим звикання відрізняється від нудьги?
2. Наскільки важливий класичний умовний рефлекс у повсякденному житті?
3. Чому научіння униканню зберігається автоматично?
4. Яке відношення можуть мати класичні й інструментальний умовні рефлекси до хронічних шкідливих звичок, таких, наприклад, як обгризання нігтів і смикання волосся?
 
ВИСНОВКИ
 
1. Найпростішою з усіх форм научіння є звикання, тобто загасання реакції на стимул, що став знайомим внаслідок частого повторення. Звикаючи, суб'єкт вчиться визначати стимул як те, що вже зустрічалося раніше.
2. При класичному обумовлюванні, вперше систематично дослідженому І.П.Павловим, тварини вчаться пов'язувати один стимул з іншим. До встановлення рефлексу безумовний стимул (БС, — наприклад, їжа) викликає безумовну реакцію (БР, — наприклад, слиновиділення). Після повторюваних ситуацій, коли за умовним стимулом (УС, — наприклад, дзвоником) випливає БС, цей УС самостійно починає викликати умовну реакцію (УР — знову ж слиновиділення).
3. Сила рефлексу визначається готовністю, з якою УС викликає УР. Ця сила зростає зі збільшенням кількості закріплюючих проб, тобто ситуацій, у яких БС випливає за УС. Коли зв'язок УС-БС міцно закріплений, появі УС може передувати другий, нейтральний стимул, який встановлює умовний рефлекс другого порядку.
4. Непідкріплені проби (коли УС з'являється без БС) призводять до загасання, тобто зниженню тенденції УС викликати УР.
5. УР може викликатися не тільки УС, але і стимулами, схожими на нього. Це явище, генералізація, стимулу, виявляється тим сильніше, чим більше подібності між УС і новим стимулом. Щоб навчити тварину реагувати саме на УС, а не на інші стимули, УС+ пред'являється з БС, а УС- пред'являється без БС. Чим більш схожі УС+ і УС-, тим важчою буде їх диференціація.
6. Класичне обумовлювання може задіяти крім слиновиділення ще безліч реакцій, включаючи страх, зумовлений як умовна емоційна реакція (УЕР). УР ніколи не буває тотожної, а іноді навіть подібної БР, що доводить, що УС являє собою сигнал, а не замінник БС. У деяких випадках УР не просто відмінна, а протилежна БР.
7. При встановленні у тварин класичного умовного рефлексу БС з'являється поза залежністю від виконання УР. При формуванні інструментального (оперантного) умовного рефлексу нагорода (підкріплення) видається тільки за умови правильного виконання інструментальної реакції (операнти).
8. Ранні дослідження інструментального умовного рефлексу проводилися Е. Л. Торндайком за допомогою кішок, які вчилися виконувати яку-небудь довільну дію, щоб вийти з проблемної шухляди. Торндайк вважав, що їх научіння засновано не на розумінні, а на поступовому закріпленні конструктивних дій і ослабленні деструктивних. Приймаючи це до уваги, він сформулював закон ефекту, що говорить, що тенденція до виконання дії закріплюється, якщо за нею випливає нагорода (підкріплення), і послабляється, якщо її немає.
9. Протягом більшої частини XX століття головною фігурою в області досліджень інструментального умовного рефлексу залишався Б. Ф. Скіннер — учений, що першим провів чітку границю між класичним рефлексом, при якому УР викликається УС, і інструментальним рефлексом, при якому інструментальна реакція, або операнта, виходить зсередини. Операнти підсилюються за допомогою підкріплення, а їхнє засвоєння вимагає певного дресирування за допомогою методу поступового наближення.
10. Одна група підкріплень складається зі стимулів з імманентно властивою їм підкріплювальною силою, інша група — умовні, підкріплення, які набувають цієї властивості після сполучення зі стимулами, які вже мають таку здатність. Одним з факторів, що визначає силу інструментального рефлексу, є час одержання підкріплення: чим швидше підкріплення випливає за реакцією, тим сильніше вона закріплюється.
11. При частковому підкріпленні реакція закріплюється тільки в деяких випадках. Реакція, засвоєна в умовах часткового підкріплення, усувається сутужніше, ніж при повному підкріпленні. Правило, що визначає, коли з'являється підкріплення, називається режимом підкріплення. При режимах пропорційного підкріплення реакція закріплюється після деякої кількості дій, що може бути довільним або фіксованим. При інтервальних режимах підкріплюється перша реакція, виконана після визначеного проміжку часу, що пройшов з моменту останнього підкріплення. Цей проміжок також може бути довільним або фіксованим.
12. Підкріплення може полягати в появі привабливих стимулів або в припиненні неприємних стимулів. Аверсивні стимули можуть підсилювати або послабляти інструментальну реакцію в залежності від відносин між стимулом і реакцією. У научінні за допомогою покарання за реакцією випливає аверсивний стимул; у результаті реакція слабшає або припиняється. При тренуванні рятування від стимулу реакція веде до припинення дії аверсивного стимулу, при тренуванні уникання стимулу реакція веде до повної відсутності його дії. В обох випадках інструментальна реакція буде закріплюватися (таким чином, тварина навчиться виконувати необхідну реакцію).
13. Павлов, Торндайк і Скіннер вважали, що сутність класичного й інструментального рефлексів полягає в тому, що вони змінюють поведінку. Прихильники когнітивного напрямку, такі, як Толмен і Кьолер, вважали, що при научінні і тварин, і людей відбувається засвоєння нових одиниць знання — когніцій. На думку багатьох учених, при класичної умовному рефлексі закріплюється асоціація між двома подіями, УС і БС, де УС служить сигналом для БС. Деякі дані отримані при дослідженні впливу інтервалу між УС і БС. Основний висновок полягає в тім, що рефлекс найбільш ефективний, якщо УС випереджає БС із деяким оптимальним, звичайно досить коротким, інтервалом.
14. Багато дослідників задаються питанням, як тварина дізнається, що УС — це сигнал для БС. Практика показує, що просто сполучення УС-БС недостатньо; повинні бути досліди, у яких відсутність УС означає відсутність БС. Це дозволяє тварині відкрити збіг (залежність) між УС і БС.
15. На відміну від Торндайка і Скіннера, що стверджували, що інструментальне научіння полягає в посиленні інструментальної реакції, прихильники когнітивного підходу вважають, що научіння базується на асоціації між дією і результатом, що підтверджується латентним научінням.
16. Збіг має вирішальне значення як при інструментальному рефлексі, так і при класичному. У першому випадку відповідний збіг відбувається між реакцією і наслідком. Якщо такого збігу немає, тварина сприймає це як свідчення того, що в неї немає контролю над ситуацією. Загрозливі обставини, у яких відсутній операційний контроль, можуть породити виучену безпорадність, що часто переноситься на інші ситуації.
17. Відповідно до Павлова, Скіннера й інших родоначальників теорії научіння, зв'язки, встановлювані класичним і інструментальним рефлексами, у сутності довільні: будь-який УС може стати зв'язаним з будь-яким БС, і майже кожна реакція може бути посилена будь-яким підкріпленням. Принцип рівнопотенційності був похитнутий тим фактом, що визначені УС легше асоціюються з конкретними БС, чим з іншими, що доводиться ефектом виученої харчовий аверсії. Велика легкість встановлення тваринами одних зв'язків, ніж інших, обумовлена біологічно. Подібний ефект спостерігається й в інструментальному рефлексі, де визначені реакції легше закріплюються за допомогою одних підкріплень, а не інших.
18. Як стверджують деякі дослідники, багато форм научіння мають видову специфіку. Вони приводять докази того, що деякі тварини з легкістю вчаться тому, чому інші навчитися не можуть. Наприклад, деякі птахи в процесі адаптації розвинули чудову пам'ять, щоб знаходити заховані ними харчові запаси, тоді як інші, навіть родинні їм птахи, не мають таких здібностей.
19. В останні роки дослідники значно просунулися в розумінні феномена пластичності нервової системи. Вивчення молюска Aplisia показало, що научіння відбувається за допомогою нервових механізмів, що змінюють кількість нейротрансміттера, який виділяється пресинаптичним нейроном, а також чутливість до стимулу в постсинаптичного нейрона. Ці механізми, можливо, є основними для більш складного научіння.
20. Психологи когнітивного напрямку вказують на те, що тварини здатні до досить складного пізнання. Докази отримані в результаті досліджень просторової пам'яті в пацюків, свідчать про те, що ці тварини можуть формувати докладні когнітивні карти. Подальші роботи стосуються здібності до абстрактних понятійних зв'язків. Перші дані на цей рахунок були отримані в дослідженнях Кьолера і стосуються інсайтної поведінки в шимпанзе. Наступні роботи показали, що шимпанзе здатні засвоювати деякі поняття вищого порядку, наприклад, такі, як подібність і розбіжність.
Фото Капча