<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>Sławomir Jasiński &#187; Przedruki</title>
	<atom:link href="http://www.jasinski.us/category/przedruki/feed/" rel="self" type="application/rss+xml" />
	<link>http://www.jasinski.us</link>
	<description>blog webdevelopera</description>
	<lastBuildDate>Sun, 05 Sep 2010 10:15:13 +0000</lastBuildDate>
	<language>en</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
	<generator>http://wordpress.org/?v=3.0.1</generator>
		<item>
		<title>Apache PHP MySQL na Mac OS X</title>
		<link>http://www.jasinski.us/2009/09/apache-php-mysql-na-mac-os-x/</link>
		<comments>http://www.jasinski.us/2009/09/apache-php-mysql-na-mac-os-x/#comments</comments>
		<pubDate>Sat, 19 Sep 2009 19:52:31 +0000</pubDate>
		<dc:creator>admin</dc:creator>
				<category><![CDATA[Artykuły]]></category>
		<category><![CDATA[Przedruki]]></category>
		<category><![CDATA[Serwery]]></category>
		<category><![CDATA[apache]]></category>
		<category><![CDATA[Mac]]></category>
		<category><![CDATA[mysql]]></category>
		<category><![CDATA[php]]></category>

		<guid isPermaLink="false">http://www.jasinski.us/?p=334</guid>
		<description><![CDATA[Z racji nadmiaru pracy i niedomiaru czasu który mogę spędzić w biurze, pojawiła się potrzeba odpalenia zestawu opisanego w tytule postu. Wcześniej korzystałem z MAMPa, ale tym razem postanowiłem wykorzystać dobrodziejstwa Snow Leoparda. Okazuje się, że Apache jest standardowo zainstalowany w systemie &#8211; trzeba go jedynie lekko skonfigurować żeby pracował tak jak chcemy. Do dzieła&#8230; [...]]]></description>
			<content:encoded><![CDATA[<p>Z racji nadmiaru pracy i niedomiaru czasu który mogę spędzić w biurze, pojawiła się potrzeba odpalenia zestawu opisanego w tytule postu. Wcześniej korzystałem z <a href="http://www.mamp.info/">MAMPa</a>, ale tym razem postanowiłem wykorzystać dobrodziejstwa Snow Leoparda. Okazuje się, że Apache jest standardowo zainstalowany w systemie &#8211; trzeba go jedynie lekko skonfigurować żeby pracował tak jak chcemy. Do dzieła&#8230;</p>
<p><span id="more-334"></span></p>
<h2>Apache</h2>
<p>Linia poleceń zawsze była szybsza niż klikanie, więc przejdziemy od razu do rzeczy:<br />
<code><br />
sudo apachectl start<br />
sudo apachectl stop<br />
sudo apachectl restart<br />
</code><br />
Polecenia, które uruchamiają, zatrzymują lub restartują Apacha &#8211; widoczny pod domeną http://localhost w naszej przeglądarce. Niestety domyślnie DocumentRoot wskazuje na <code>/Library/WebServer/Documents</code>, co nijak nie pasuje do naszej koncepcji wygodnego posługiwania się Apachem. Edytujemy więc konfiguracje Apacha:<br />
<code><br />
sudo nano /etc/apache2/httpd.conf<br />
</code><br />
Szukamy linii:<br />
<code><br />
# Virtual hosts<br />
Include /private/etc/apache2/extra/httpd-vhosts.conf<br />
</code><br />
zdejmujemy komentarz z drugiej linii i edytujemy <code>sudo nano /private/etc/apache2/extra/httpd-vhosts.conf</code><br />
Interesuje nas fragment:<br />
<code><br />
&lt;VirtualHost *:80&gt;<br />
ServerAdmin nasz@adres.email.pl<br />
DocumentRoot "/Users/<strong>slav</strong>/Sites"<br />
ServerName test.localhost<br />
ServerAlias www.test.localhost<br />
ErrorLog "/private/var/log/apache2/dummy-host.example.com-error_log"<br />
CustomLog "/private/var/log/apache2/dummy-host.example.com-access_log" common<br />
&lt;/VirtualHost&gt;<br />
</code><br />
gdzie zamiast <strong>slav</strong> wstawiacie nazwę użytkownika pod którym pracujecie, dzięki temu pod nazwą <code>test.localhost</code> będziemy widzieć zawartość katalogu &#8220;Witryny&#8221; w polskiej wersji systemu.<br />
Jeszcze trzeba tylko dopisać odpowiednią linijkę do <code>nano /etc/hosts</code> tak aby system rozpoznawał <code>test.localhost</code><br />
<code><br />
127.0.0.1       localhost test.localhost<br />
</code><br />
Teraz wystarczy tylko zrobić restart <code> sudo apachectl restart</code> Apacha i&#8230; powinno działać. Ok. Mamy działającego Apacha, teraz czas na&#8230;</p>
<h2>PHP</h2>
<p>Edytujemy ponownie konfigurację Apacha<br />
<code><br />
sudo nano /etc/apache2/httpd.conf<br />
</code><br />
Dodajemy dwie linijki:<br />
<code><br />
AddType application/x-httpd-php .php<br />
AddType application/x-httpd-php-source .phps<br />
</code><br />
najlepiej w odpowiednim miejscu, żeby nie było bałaganu w konfigu <img src='http://www.jasinski.us/wp-includes/images/smilies/icon_wink.gif' alt=';)' class='wp-smiley' /><br />
Druga linijka, która nas interesuje to<br />
<code><br />
LoadModule php5_module        libexec/apache2/libphp5.so<br />
</code><br />
wystarczy ją odkomentować.<br />
tradycyjnie restart:  <code>sudo apachectl restart</code> i sprawdzamy czy działa PHP&#8230;</p>
<p><img title="LAMP" src="http://www.jasinski.us/wp-content/uploads/2009/09/LAMP-300x64.png" alt="LAMP" width="300" height="64" /></p>
<p>jak widać <a href="http://www.i-slownik.pl/1,2271,soa.html">SOA#1</a>.</p>
<p>Do pełni szczęścia brakuje nam jedynie</p>
<h2>MySQL</h2>
<p>Niestety Snow Leopard nie został wyposażony w MySQLa musimy go więc pobrać ze strony <a href="http://dev.mysql.com/downloads/">MySQL</a>. Ważne jest żeby pobrać sobie paczkę .dmg która zawiera plik .pkg z instalatorem. Oszczędzi nam to zabawy. Istotne jest również to, żeby zainstalować sobie Panel Ustawień.<br />
<img title="mysql" src="http://www.jasinski.us/wp-content/uploads/2009/09/mysql.png" alt="mysql" width="318" height="120" /><br />
Po instalacji wchodzimy do &#8220;Preferencje systemowe&#8221; i pojawia nam się ładne okienko:</p>
<p><img title="mysqls" src="http://www.jasinski.us/wp-content/uploads/2009/09/mysqls.png" alt="mysqls" width="566" height="259" /></p>
<p>Na sam koniec warto zwrócić uwagę, że phpMyAdmin nie połaczy się z naszą bazą danych jeżeli user będzie miał &#8220;puste&#8221; hasło&#8230; także koniecznie trzeba dodać usera z hasłem.</p>
<p>Pisząc ten artykuł korzystałem z informacji zawartych na stronie <a href="http://www.klauskomenda.com/archives/2008/10/07/installing-apache-mysql-and-php-on-leopard/">Building Apache, MySQL, and PHP</a> warto też przeczytać <a href="http://www.devshed.com/c/a/Administration/Building-Apache-MySQL-and-PHP-on-Mac-OS-X/">Installing Apache, PHP and MySQL</a>.</p>
]]></content:encoded>
			<wfw:commentRss>http://www.jasinski.us/2009/09/apache-php-mysql-na-mac-os-x/feed/</wfw:commentRss>
		<slash:comments>5</slash:comments>
		</item>
		<item>
		<title>Tadeusiewicz sieci neuronowe 2</title>
		<link>http://www.jasinski.us/2009/01/tadeusiewicz-sieci-neuronowe-2/</link>
		<comments>http://www.jasinski.us/2009/01/tadeusiewicz-sieci-neuronowe-2/#comments</comments>
		<pubDate>Thu, 15 Jan 2009 12:52:33 +0000</pubDate>
		<dc:creator>admin</dc:creator>
				<category><![CDATA[Przedruki]]></category>
		<category><![CDATA[enter]]></category>
		<category><![CDATA[sieci neronowe]]></category>
		<category><![CDATA[tadeusiewicz]]></category>

		<guid isPermaLink="false">http://www.jasinski.us/?p=170</guid>
		<description><![CDATA[Przy okazji robienia porządków na dysku, znalazłem drugi artykuł Ryszarda Tadeusiewicza z Entera rocznik 1995 ktoś to jesze pamięta ? Poniżej przedruk. Jak to jest zbudowane ? ENTER 2, Styczeń 1995 Ryszard Tadeusiewicz W poprzednim odcinku opisałem główne elementy zjawiska, jakim jest żywiołowy rozwój mody na sieci neuronowe. Dzisiaj proponuję dokładniejsze poznanie budowy i właściwości [...]]]></description>
			<content:encoded><![CDATA[<p>Przy okazji robienia porządków na dysku, znalazłem drugi artykuł Ryszarda Tadeusiewicza z Entera rocznik 1995 <img src='http://www.jasinski.us/wp-includes/images/smilies/icon_wink.gif' alt=';)' class='wp-smiley' />   ktoś to jesze pamięta ? Poniżej przedruk.</p>
<p><span id="more-170"></span></p>
<h2>Jak to jest zbudowane ?</h2>
<p><em>ENTER 2, Styczeń 1995</em></p>
<p><strong>Ryszard Tadeusiewicz</strong></p>
<p>W poprzednim odcinku opisałem główne elementy zjawiska, jakim jest żywiołowy rozwój mody na sieci neuronowe. Dzisiaj proponuję dokładniejsze poznanie budowy i właściwości tych interesujących systemów.</p>
<p>Sieć neuronowa jest systemem dokonującym określonych obliczeń na zasadzie równoczesnej pracy wielu połączonych ze sobą elementów zwanych neuronami. Neurony traktować można jako elementarne procesory o następujących właściwościach:</p>
<ol>
<li>każdy neuron otrzymuje wiele sygnałów wejściowych i wyznacza na ich podstawie swoją &#8220;odpowiedź&#8221;, tzn. jeden sygnał wyjściowy,</li>
<li>z każdym oddzielnym wejściem neuronu związany jest parametr nazywany wagą (ang. weight); wyraża on stopień ważności informacji docierających tym właśnie wejściem,</li>
<li>sygnał wchodzący określonym wejściem jest najpierw przemnażany przez wagę danego wejścia, w związku z czym w dalszych obliczeniach uczestniczy już w formie zmodyfikowanej: wzmocnionej (gdy waga jest większa od 1) lub stłumionej (gdy waga ma wartość mniejszą od 1) względnie nawet przeciwstawnej w stosunku do sygnałów z innych wejść, gdy waga ma wartość ujemną (tzw. wejścia hamujące),</li>
<li>po przemnożeniu sygnały wejściowe są w neuronie sumowane, dając pewien pomocniczy sygnał wewnętrzny, nazywany czasem łącznym pobudzeniem neuronu (net va|ye),</li>
<li>do tak utworzonej sumy sygnałów? cfedaje niekiedy (nie we wszystkich typach sieci) pewien dodatkowy składnik niezależny od sygnałów; wejściowych, nazywany progiem (bias),</li>
<li>suma tak przetworzonych sygnałów może być bezpośrednio traktowana jako sygnał wyjściowy neuronu; w wielu typach sieci &#8211; na przykład ADALINE (ADaptive LINEar) to wystarcza. Natomiast w sieciach o bogatszych możliwościach, na przykład MLP (MultiLayer Percep-tron), sygnał wyjściowy neuronu obliczany jest za pomocą pewnej nieliniowej zależności między łącznym pobudzeniem a sygnałem wyjściowym,</li>
<li>zależność sygnału wyjściowego od łącznego pobudzenia, zwana charakterystyką neuronu (transfer function) pozwala w każdej chwili jednoznacznie określić sygnał wyjściowy neuronu, jeśli znane są jego sygnały wejściowe. W odróżnieniu od tego, co dzieje się w rzeczywistych neuronach, zwykle zakłada się, że proces ten zachodzi bezzwłocznie, tzn. zmiany sygnałów wejściowych praktycznie natychmiast uwidaczniane są na wyjściu.</li>
</ol>
<p>Z przytoczonego opisu wynika, że każdy neuron dysponuje pewną wewnętrzną pamięcią (reprezentowaną przez aktualne wartości wag i progu) oraz pewnymi możliwościami przetwarzania sygnałów wejściowych w sygnał wyjściowy. Neuron jest więc stosunkowo prostym, a więc mało kosztownym procesorem i można zbudować system zawierający setki czy tysiące takich elementów.</p>
<p>Mimo że jego możliwości są dość ograniczone, to jednak okazują się one wystarczające do zbudowania systemów realizujących bardzo złożone zadania przetwarzania danych. Ponieważ zasób informacji gromadzonych przez pojedynczy neuron jest ograniczony, zaś jego możliwości obliczeniowe ubogie, sieć neuronowa może działać wyłącznie jako całość. Jak z tego wynika, wszystkie omówione w poprzednim odcinku możliwości i właściwości sieci neuronowych są wynikiem kolektywnego działania bardzo wielu połączonych ze sobą elementów: całej sieci, a nie pojedynczych neuronów. Tak więc spotykana niekiedy nazwa MPP (Massive Parallel Processing) , z jaką wiąże się cała ta dziedzina informatyki, jest najzupełniej uzasadniona.</p>
<p>Zainteresujmy się teraz funkcjonowaniem całej sieci neuronowej. Jak wynika z przytoczonych wyżej uwag, program działania, informacje stanowiące bazę wiedzy, dane, na których wykonuje się obliczenia oraz sam proces obliczania &#8211; są w sieci całkowicie rozproszone. Nie da się wskazać miejsca, w którym zgromadzona jest w niej taka lub inna konkretna informacja (chociaż sieci bywają wykorzystywane jako pamięci, zwłaszcza tzw. pamięci skojarzeniowe i bardzo dobrze spełniają swoje zadania).</p>
<p>Podobnie niemożliwe jest zlokalizowanie w określonym miejscu sieci jakiegoś wydzielonego fragmentu wykonywanego algorytmu, np. wskazanie, które elementy sieci odpowiedzialne są za wstępne przetwarzanie i analizę wprowadzanych danych, a które dostarczają końcowego rozwiązania. Sieć działa zawsze jako całość i wszystkie jej elementy mają swój wkład w realizację wszystkich czynności, które sieć realizuje.</p>
<p>Podobnie się dzieje np. przy odtwarzaniu hologramu, gdzie z każdego kawałka rozbitej płyty fotograficznej można odtworzyć cały obraz sfotografowanego (sholografowanego?) przedmiotu. Jedną z konsekwencji tej właściwości sieci jest jej niewiarygodna zdolność do poprawnego działania nawet po uszkodzeniu znacznej części wchodzących w jej skład elementów.</p>
<p>Struktura sieci powstaje w ten sposób, że wyjścia jednych neuronów łączy się (według wybranego schematu) z wejściami innych, tworząc łącznie system zdolny do równoległego, w pełni współbieżnego przetwarzania różnych informacji. Oczywiście konkretna topologia sieci, to znaczy liczba procesorów i sposób ich połączenia, powinny wynikać z rodzaju zadania, jakie zamierzamy sieci postawić.</p>
<p>Związek między rodzajem zadania a topolgią sieci nie jest tak jednoznaczny, jak by się mogło wydawać. W bogatej literaturze dotyczącej sieci znaleźć bowiem można prace, w których wykazano, że w istocie decyzje dotyczące struktury sieci wpływają na jej zachowanie znacznie słabiej niż by można było oczekiwać. To paradoksalne stwierdzenie wynika z faktu, że zachowanie sieci w zasadniczy sposób determinowane jest przez proces jej uczenia, a nie przez strukturę czy liczbę użytych do jej budowy elementów. Oznacza to, że sieć mająca zdecydowanie gorszą strukturę, lecz dobrze nauczona może znacznie skuteczniej rozwiązywać postawione zadania niż źle trenowana sieć o optymalnie dobranej strukturze. Znane są doświadczenia, w których strukturę sieci wybierano całkowicie przypadkowo (ustala-</p>
<p><em><strong>Każdy neuron dysponuje pewną wewnętrzną pamięcią oraz pewnymi możliwościami przetwarzania sygnałów wejściowych w sygnal wyjściowy. Neuron jest stosunkowo prostym i tanim procesorem. Można zbudować system zawierający setki czy tysiące takich elementów.</strong></em></p>
<p>jąc na drodze losowania, które elementy należy ze sobą połączyć i w jaki sposób), a sieć mimo to zdolna była do rozwiązywania stawianych jej trudnych zadań! Oznacza to, że proces uczenia mógł tak dostosować jej parametry do realizacji zadanego algorytmu, że proces rozwiązywania zadania przebiegał poprawnie mimo całkowicie losowej struktury sieci. Te doświadczenia, wykonane po raz pierwszy przez Franka Rosenblatta na początku lat 70. i potem wielokrotnie powtarzane, dowiodły, że pochodząca jeszcze od Arystotelesa i rozwinięta potem przez Locke&#8217;a koncepcja tabula rasa &#8211; umysłu rodzącego się jako pusta, nie zapisana karta, zapełniana dopiero w trakcie nauki i gromadzenia doświadczeń &#8211; jest technicznie możliwa do realizacji w formie sieci neuronowej.</p>
<p>Odrębnym zagadnieniem jest próba odpowiedzi na pytanie, czy tak właśnie jest z realnym umysłem konkretnego człowieka? Czy istotnie, jak utrzymywał Locke, wrodzone uzdolnienia są niczym, a zdobyta w procesie nauki wiedza &#8211; wszystkim?</p>
<p>Nie wiemy tego na pewno, ale chyba tak nie jest. Natomiast wiemy z całą pewnością, że sieci neuronowe mogą całą swoją wiedzę zyskiwać wyłącznie w trakcie nauki i nie muszą mieć z góry zadanej, precyzyjnie określonej struktury dopasowanej do stawianych im zadań. Oczywiście sieć musi mieć wystarczający stopień złożoności, żeby w jej strukturze można było w toku uczenia wykrystalizować potrzebne połączenia i struktury.</p>
<p>Zbyt mała sieć nie jest w stanie nauczyć się niczego, gdyż jej &#8220;potencjał intelektualny&#8221; na to nie pozwala &#8211; rzecz jednak nie w strukturze, a w liczbie elementów. Szczura nikt nie uczy teorii względności, chociaż można go wytresować w rozpoznawaniu drogi wewnątrz skomplikowanego labiryntu. Podobnie nikt się nie rodzi &#8220;zaprogramowany&#8221; do tego, by być wyłącznie genialnym chirurgiem lub koniecznie tylko budowniczym mostów &#8211; o tym decydują specjalistyczne studia &#8211; chociaż niektórym ludziom wystarcza intelektu zaledwie do tego, by ładować piasek na ciężarówkę, a i to pod nadzorem. Tak już jest i żadne frazesy na temat równości nie są w stanie tego zmienić. Jedni mają wystarczające zasoby intelektualne, inni nie &#8211; podobnie jak jedni mają okazałą muskulaturę, a inni wyglądają jakby&#8230; zbyt długo przesiadywali przed monitorem komputera.</p>
<p>W przypadku sieci sytuacja jest podobna &#8211; nie można spowodować, by sieć z góry miała jakieś szczególne uzdolnienia, można jednak łatwo wyprodukować cybernetycznego kretyna, który nigdy się niczego nie nauczy, bo ma za małe możliwości. Struktura sieci może więc być dowolna, byle była dostatecznie duża. Wkrótce dowiemy się także, że nie powinna być zbyt duża, bo to także szkodzi &#8211; ale o tym za chwilę.</p>
<p>Niezależnie od przytoczonych uwag jakąś strukturę trzeba sieci nadać, zwłaszcza że wybór rozsądnej struktury, dobrze dopasowanej do specyfiki zadania, może w istotny sposób skracać czas uczenia i polepszać końcowe wyniki &#8211; dlatego pewne uwagi na ten temat muszę tu przedstawić. Zresztą wszyscy wiemy, jak trudne rozterki wiążą się czasem z wyborem dowolnego, nie narzuconego z góry rozwiązania. Postawienie konstruktora sieci w sytuacji, kiedy może przyjąć dowolną jej organizację, jest podobne do dylematów początkujących informatyków, z zakłopotaniem wpatrujących się w komunikat &#8220;Press any key&#8230;&#8221;. Który to jest ten dowolny klawisz?!</p>
<p>Można się z tego śmiać, ale dla mnie podobnie brzmi często zadawane przez moich studentów i doktorantów, pełne rozpaczy pytanie: no dobrze, ale jaka to jest ta &#8220;dowolna struktura sieci&#8221;?</p>
<p class="h3">Rodzaje sieci neuronowych</p>
<p>Powiem teraz kilka słów o możliwych i często spotykanych strukturach sieci, wyraźnie akcentując, że podane niżej informacje i propozycje nie wyczerpują wszystkich możliwości. Przeciwnie, każdy badacz może i powinien być tu swoistym Demiurgiem, twórcą i kreatorem nowych bytów, gdyż właściwości sieci o różnych strukturach nie są jeszcze dostatecznie poznane. Jest to praca, przy której przyda się każda para półkul mózgowych.</p>
<p>Najpierw dokonam pewnego podziału struktur często stosowanych sieci neuronowych na dwie ważne klasy. Z jednej strony będziemy rozważać struktury nie zawierające sprzężeń zwrotnych, a z drugiej &#8211; struktury, które takie sprzężenia zawierają. Pierwsze z wymienionych sieci określane są często terminem feedforward, drugie natomiast bywają wiązane z nazwiskiem Hopfielda.</p>
<p><strong><em>Nie da się wskazać w sieci miejsca, w którym zgromadzona jest taka lub inna informacja. Podobnie niemożliwe jest zlokalizowanie w określonym miejscu sieci wydzielonego fragmentu wykonywanego algorytmu.</em></strong></p>
<p>Sieci <em>feedforward</em> to struktury, w których istnieje ściśle określony kierunek przepływu sygnałów &#8211; od pewnego ustalonego wejścia (na którym podaje się sieci sygnały będące danymi wejściowymi, precyzującymi zadania, które mają być rozwiązywane), do wyjścia, na którym sieć podaje ustalone rozwiązanie. Takie sieci są najczęściej stosowane i najbardziej użyteczne. Ich obszerniejsze omówienie stanowić będzie treść dalszej części tego artykułu i kilku następnych.</p>
<p>Sieci Hopfielda cechują się natomiast tym, że neurony tworzą sprzężenia zwrotne, liczne i skomplikowane zamknięte pętle, w których impulsy mogą długo krążyć i zmieniać się, zanim sieć osiągnie pewien stan ustalony &#8211; o ile go w ogóle osiągnie. Analiza właściwości i możliwości sieci Hopfielda jest znacznie bardziej złożona niż w przypadku sieci feedforward, ale też możliwości obliczeniowe tych sieci są fascynująco odmienne od możliwości innych typów sieci. Na przykład, są one zdolne do znajdowania rozwiązań problemów optymalizacyjnych, czyli szukania najlepszych rozwiązań pewnych klas zadań, czego sieci feedforward z reguły robić nie potrafią. Swojego czasu prawdziwą sensacją było uzyskanie za pomocą sieci Hopfielda rozwiązania słynnego problemu komiwojażera, co otworzyło dla tych sieci obszerną i ważną klasę problemów obliczeniowych NP-zupełnych. Jednak budowa sieci ze sprzężeniami zwrotnymi jest bez wątpienia zadaniem trudniejszym i bardziej skomplikowanym niż korzystanie z sieci feedforward. Ponadto, trudniej zapanować nad siecią, w której kłębi się parę tysięcy równoległych, dynamicznych procesów niż nad siecią, w której sygnały grzecznie i spokojnie przepływają od wejścia do wyjścia. Dlatego warto zaczynać znajomość z sieciami neuronowymi właśnie od sieci z jednokierunkowym przepływem sygnałów, stopniowo i powoli przechodząc do sieci Hopfielda.</p>
<p>Skupiając uwagę na sieciach feedforward możemy stwierdzić, że do opisania ich struktury stosunkowo wygodny jest model warstwowy. W modelu tym zakłada się, że neurony zgrupowane są w pewne zespoły (warstwy), tak zorganizowane, że główne połączenia i związane z nimi przepływy sygnałów odbywają się pomiędzy elementami sąsiednich warstw. Jak już wspominałem, połączenia między neuronami sąsiednich warstw mogą być kształtowane na wiele sposobów, wedle uznania twórcy sieci, jednak najczęściej korzysta się ze schematu połączeń typu &#8220;każdy z każdym&#8221;, licząc na to, że proces uczenia doprowadzi do samorzutnego &#8220;wykrystalizowania się&#8221; potrzebnego zbioru połączeń &#8211; po prostu na wejściach, które okażą się zbyteczne z punktu widzenia rozwiązywanego zadania, proces uczenia ustawi współczynniki (wagi) równe zeru, co w praktyce przerwie niepotrzebne połączenia.</p>
<p>Wśród warstw neuronów budujących sieć neuronową może być wyróżniona warstwa wejściowa. Warstwa ta otrzymuje dane z zewnątrz sieci &#8211; tą drogą wprowadzane są zadania podlegające rozwiązywaniu. Przy projektowaniu tej warstwy twórca sieci ma ułatwioną decyzję, liczba elementów tej warstwy jest bowiem ściśle zdeterminowana przez liczbę danych wejściowych, które trzeba brać pod uwagę przy rozwiązywaniu określonego zadania.</p>
<p>Inna rzecz, że czasem określenie, ile i jakie dane należy wprowadzać do sieci, by poradziła sobie ona ze stawianym zadaniem, nie jest sprawą łatwą, na przykład w zadaniu prognozowania kursów akcji na giełdzie. Wiadomo, że niektórzy badacze osiągają tu zachęcające wyniki przynoszące bardzo duże korzyści inwestorom, którzy w oparciu o produkowane przez sieć prognozy podejmują decyzje o zakupie lub sprzedaży określonych walorów. Jednak publikacje na ten temat są bardzo powściągliwe w ujawnianiu, jakie dane stanowiły punkt wyjścia prowadzonych obliczeń. Owszem, mówi się o tym, że stosowano sieć, że ją uczono (podaje się nawet algorytm uczenia), podaje się wyniki: jak wiele zyskano dzięki trafnym inwestycjom, jak dokładnie sieć prognozowała zmiany kursów akcji &#8211; tu możliwe są bardzo ładne wykresy linii rzeczywistych zmian i linii prognoz. Natomiast w odniesieniu do danych wejściowych mówi się tylko, że podawano informacje dotyczące wcześniejszych zmian notowań akcji oraz wyniki analiz finansowych notowanych na giełdzie spółek. Jak te dane preparowano i w jakim stopniu wykorzystano &#8211; autorzy jakoś zapominają napisać. Takie roztrzepane gapy!</p>
<p>Inna wyróżniona warstwa produkuje sygnały wyjściowe z całej sieci, stanowiące rozwiązania stawianych sieci zadań. Tu sytuacja jest prostsza, gdyż na ogół wiemy, ilu i jakich rozwiązań potrzebujemy. Jest jednak pewna subtelność, na którą warto zwrócić uwagę. Otóż neurony dysponują wprawdzie możliwością dostarczania rozwiązania w postaci pewnej wartości liczbowej, jednak wartość ta podlega pewnym dość istotnym ograniczeniom. Na przykład w większości implementacji sieci sygnały wyjściowe wszystkich neuronów mogą przyjmować wartości z przedziału od O do l, zatem jeśli potrzebne nam wyniki mają mieć wartości z innego (zwykle szerszego) przedziału, konieczne jest pewne skalowanie. Jakby tego było mało, pojawia się inne ograniczenie: wyniki dostarczane przez sieć mają zawsze charakter przybliżony. Jakość tego przybliżenia może być różna, jednak o dokładności wielu cyfr znaczących nie może tu być mowy &#8211; dobrze, jeśli wynik dostarczany przez neuron ma dokładność lepszą niż dwie cyfry, czyli błąd może sięgać kilku procent. Taka jest już po prostu natura tego narzędzia.</p>
<p>Świadomość występowania podanych ograniczeń zmusza do odpowiedniej interpretacji sygnałów wyjściowych, by można było z nich sensownie korzystać. Najwygodniej jest tak interpretować stawiane neurokomputerowi zadania, by odpowiedź mogła mieć charakter zaklasyfikowania do określonej kategorii. Na przykład, można domagać się, by sieć określiła, czy zyskowność inwestycji jest &#8220;mała&#8221; &#8220;średnia&#8221; lub &#8220;duża&#8221;, względnie czy kredytobiorca jest &#8220;pewny&#8221;, &#8220;ryzykowny&#8221; czy</p>
<p><strong><em>Sieć mająca zdecydowanie gorszą strukturę, lecz dobrze nauczona, znacznie skuteczniej rozwiązuje postawione zadania niż źle trenowana sieć o optymalnie dobranej strukturze.</em></strong></p>
<p>&#8220;zupełnie niewiarygodny&#8221;. Natomiast wymaganie dokładnego określenia stopnia ryzyka lub wysokości kwoty, jaką można komuś pożyczyć, prowadzić będzie niezawodnie do frustracji. Dlatego liczba wyjść z budowanej sieci bywa często większa niż liczba pytań, na które poszukujemy odpowiedzi, ponieważ dla wielu sygnałów wyjściowych trzeba sztucznie wprowadzić kilka neuronów obsługujących dane wyjście. Na przykład przewidywany przedział wartości sygnału wyjściowego zostaje podzielony na pewne podzakresy i poszczególne neurony wyjściowe odpowiedzialne są za sygnalizowanie przynależności aktualnego rozwiązania do określonego przedziału. Tworzenie sieci, z której &#8220;wyciska się&#8221; dokładne rozwiązania problemów matematycznych, jest typową &#8220;sztuką dla sztuki&#8221; -czasochłonną zabawą o minimalnej przydatności praktycznej. Trzeba by stosować symulatory sieci dysponujące bardzo dobrą dokładnością numeryczną, lecz zalety sieci neuronowych stają się wówczas co najmniej problematyczne.</p>
<p>Każda sieć feedforward musi mieć przynajmniej dwie wymienione wyżej warstwy: wejściową i wyjściową. Jednak wiele sieci, (zwłaszcza tych rozwiązujących bardziej złożone zadania musi dysponować dodatkowymi warstwami elementów, pośredniczących pomiędzy wejściem i wyjściem. Warstwy te nazywane są zwykle (ze względów, o których będzie mowa) warstwami ukrytymi. Tworzą one dodatkową strukturę przetwarzającą informację w sieciach neuronowych, a ich rolę najłatwiej jest przedyskutować na przykładzie sieci realizujących często pojawiające się zadanie rozpoznawania obrazów.</p>
<p>W sieciach takich na wejście (do pierwszej warstwy) podaje się obraz w postaci zbioru pikseli odczytanych przez skaner lub Frame Grabber. W takim przypadku wejściowa warstwa neuronów odpowiada swymi rozmiarami i organizacją (zgrupowaniem neuronów w odpowiednie wiersze i kolumny) organizacji samego obrazu: do każdego punktu obrazu przypisany jest neuron, który analizuje i sygnalizuje jego stan. Na wyjściu oczekuje się decyzji informujących o tym, co rozpoznano. Na przykład może być ona tak zorganizowana, że do poszczególnych neuronów wyjściowych przypiszemy umownie pewne decyzje &#8211; na przykład &#8220;rozpoznano literę A&#8221;, &#8220;rozpoznano literę B&#8221; itp., a wielkości sygnałów na tych wyjściach interpretować się będzie w kategoriach stopnia pewności odpowiedniej decyzji. Łatwo zauważyć, że możliwe jest w związku z tym podawanie przez sieć odpowiedzi wieloznacznych (&#8220;to coś jest podobne w stopniu 0,7 do litery A, ale w stopniu 0,4 przypomina także literę B&#8221;). Jest to jedna z ciekawych i użytecznych cech sieci neuronowych, które można w związku z tym kojarzyć z systemami o rozmytej (fuzzy) logice działania &#8211; obszerniejsze omówienie tego aspektu znajdzie miejsce w jednym z późniejszych artykułów cyklu.</p>
<p>Neurony warstwy ukrytej pełnią w omawianej tu sieci rolę pośredników &#8211; mają one bezpośredni dostęp do danych wejściowych, czyli oglądają pokazany sieci obraz, a na podstawie ich wyjść dalsze warstwy podejmują określone decyzje o rozpoznaniu takiego lub innego obrazu. Dlatego uważa się, że rola neuronów warstwy ukrytej polega na tym, by pośredniczyły między wejściem i wyjściem oraz wypracowywały zestawy wstępnie przetworzonych danych wejściowych, z których korzystać będą neurony dalszych warstw przy określaniu końcowego wyniku. Przydatność warstw pośrednich wynika z faktu, że na ogół dokonanie pewnych przekształceń danych wejściowych sprawia, że rozwiązanie stawianego przed siecią zadania staje się istotnie łatwiejsze niż w przypadku próby rozwiązywania zadania w sposób bezpośredni. Na przykład w zadaniach rozpoznawania obrazów trudno jest czasem znaleźć regułę pozwalającą ustalić, jaki obiekt pokazano, analizując bezpośrednio same jasne i ciemne pi-ksele obrazu. Ten sam obiekt może bowiem mieć zupełnie inne wartości pikseli w pewnych wybranych punktach (jeśli jest na przykład przesunięty), zaś zupełnie różne obiekty mogą mieć na cyfrowych obrazach bardzo duże zbiory identycznych pikseli. Oczekiwanie, że sieć neuronowa &#8220;jednym skokiem&#8221; pokona wszystkie te trudności jest więc mało realistyczne. Na ogół żaden proces uczenia nie zdoła zmusić prostej dwuwarstwowej sieci do tego, by raz rozumiała te same zestawy pikseli jako należące do różnych obiektów, a innym razem kojarzyła różne zestawy pikseli z tym samym obiektem. Tego po prostu nie da się zrobić.</p>
<p>To, czego nie może zrobić sieć o mniejszej liczbie warstw, na ogół potrafi wykonać sieć zawierająca odpowiednie warstwy ukryte. W takich zadaniach neurony tych warstw będą znajdowały pewne wartości pomocnicze, na przykład ogólne cechy opisujące strukturę obrazu i widocznych na nim obiektów. Cechy te powinny lepiej odpowiadać wymaganiom związanym z ostatecznym rozpoznaniem obrazu niż sam oryginalny obraz &#8211; na przykład mogą być w pewnym stopniu niezależne od położenia czy skali rozpoznawanych obiektów.</p>
<p>Należy podkreślić, że twórca sieci nie musi sam jawnie określać, jakie to cechy obrazu mają być znajdowane, gdyż sieć może sama nabywać stosownych umiejętności w trakcie procesu uczenia. Trzeba jej jednak dać szansę poprzez uwzględnienie w strukturze elementów, które mogą właśnie takie &#8220;opisowe cechy obrazu&#8221; wydobywać. Sam charakter wydobywanych cech nie jest zdeterminowany przez strukturę sieci, tylko przez proces uczenia. Jeśli wyobrazimy sobie sieć, która ma rozpoznawać obrazy, to cechy, które będą wydobywały neurony warstwy ukrytej dostosują się automatycznie do rodzaju rozwiązywanego zadania. Jeśli nakażemy sieci wykrywanie na zdjęciach lotniczych obrazów zamaskowanych wyrzutni rakietowych, to staje się oczywiste, że głównym zadaniem warstwy ukrytej będzie uniezależnienie się od położenia obiektu, gdyż podejrzany kształt może się pojawić w dowolnym rejonie obrazu i zawsze powinien być tak samo rozpoznany. Jeśli natomiast sieć ma rozpoznawać litery, to nie powinna gubić informacji o ich położeniu &#8211; mało przydatna będzie sieć, która poinformuje nas, że gdzieś tam na zeskanowanej stronicy znajduje się litera A &#8211; my musimy wiedzieć, gdzie ona jest, a dokładniej &#8211; w jakim kontekście występuje. Natomiast celem warstwy ukrytej może być wydobycie cech pozwalających na niezawodne rozpoznanie litery niezależnie od jej rozmiaru i od kroju czcionki (font). Co ciekawe, po odpowiednim treningu oba te zadania może rozwiązywać ta sama sieć, chociaż oczywiście sieć nauczona rozpoznawać czołgi nie potrafi odczytywać pisma, a nauczona identyfikować odciski palców nie poradzi sobie z rozpoznawaniem twarzy.</p>
<p>Jak wynika z przytoczonych uwag, najszersze możliwości zastosowań posiadają sie?ci mające przynajmniej trójwarstwo-wą strukturę, z wyróżnioną warstwą wejściową przyjmującą sygnały, warstwą ukrytą wydobywającą potrzebne cechy wejściowych sygnałów oraz z warstwą wyjściową podejmującą ostateczne decyzje i podającą rozwiązanie. W tej strukturze pewne elementy są zdeterminowane: liczba elementów wejściowych i wyjściowych, a także zasada połączeń (każdy z każdym) pomiędzy kolejnymi warstwami. Są jednak elementy</p>
<p><strong><em>Nadmierna liczba elementów warstwy ukrytej Ł if prowadzi do efektu &#8220;uczenia się na pamięć&#8221;. Sieć ucząc się na podstawie przykladów poprawnych rozwiązań nie podejmuje próby uogólniania nabywanych wiadomości, tylko dysponując bardzo pojemną pamięcią usiłuje osiągać sukces na zasadzie dokładnego zapamiętania reguł w rodzaju: &#8220;przy takim wejściu takie wyjście&#8221;.</em></strong></p>
<p>zmienne, które trzeba wybrać samemu: liczba warstw ukrytych (jedna czy kilka?) oraz liczba elementów w warstwie (warstwach?) ukrytych. Ponieważ brakuje precyzyjnej teorii sieci neuronowych, elementy te wybiera się zwykle arbitralnie, co jednak nie powinno mieć (w pewnym zakresie) wpływu na sposób działania sieci, gdyż w trakcie procesu uczenia ma ona możliwość korygowania ewentualnych błędów struktury poprzez wybór odpowiednich parametrów połączeń.</p>
<p>Trzeba jednak wyraźnie przestrzec przed dwoma rodzajami błędów, stanowiących pułapki dla wielu (zwłaszcza początkujących) badaczy sieci neuronowych. Pierwszy błąd-polega na zaprojektowaniu sieci o zbyt małej liczbie elementów &#8211; jeśli warstwy ukrytej nie ma lub występuje w niej zbyt mało neuronów, proces uczenia może się definitywnie nie udać, gdyż w zbyt ubogiej strukturze sieć nie ma szans odwzorować wszystkich niuansów rozwiązywanego zadania.<br />
Niestety, nie można także &#8220;przedobrzyć&#8221;. Zastosowanie zbyt wielu warstw ukrytych prowadzi do znacznego pogorszenia sprawności procesu uczenia. Często lepsze wyniki daje sieć o mniejszej liczbie warstw ukrytych (bo można ją porządnie nauczyć) niż teoretycznie lepsza sieć z większą liczbą warstw ukrytych, w której jednak proces uczenia &#8220;grzęźnie&#8221; w nadmiarze szczegółów. Dlatego należy stosować sieci o jednej lub dwóch warstwach ukrytych, natomiast pokusę stosowania większej liczby warstw ukrytych najlepiej przezwyciężać stosując post i zimne kąpiele.</p>
<p>Jeszcze gorsza sytuacja pojawia się przy szacowaniu liczby neuronów wymaganych do prawidłowego działania warstwy ukrytej. Wiemy już, jakie są zadania tych elementów &#8211; mają one wypracować pewne pomocnicze dane pośrednie, dzięki którym znalezienie rozwiązań stanie się łatwiejsze niż w oparciu o same dane wejściowe. Jednak ta wiadomość wcale nie pomaga w określeniu, ile ma być tych elementów. Na pewno nie może ich być zbyt mało, ale co się stanie, jeśli będzie ich za dużo?</p>
<p>Okazuje się, że nadmierna liczba elementów warstwy ukrytej prowadzi do niekorzystnego efektu nazywanego &#8220;uczeniem się na pamięć&#8221;. Polega on na tym, że sieć ucząc się na podstawie przedstawianych jej przykładów poprawnych rozwiązań stawianych jej zadań nie podejmuje próby uogólniania nabywanych wiadomości, tylko dysponując bardzo pojemną pamięcią (dzięki posiadaniu rozległej warstwy ukrytej) usiłuje osiągać sukces na zasadzie dokładnego zapamiętania reguł w rodzaju &#8220;przy takim wejściu takie wyjście&#8221;. Objawem takiego nieprawidłowego działania sieci jest fakt, że uczy się ona dokładnie i szybko całego tzw. ciągu uczącego (czyli zbioru przykładów użytych do pokazania sieci, jak należy rozwiązywać stawiane zadania), natomiast fatalnie kompromituje się przy pierwszej próbie egzaminu, czyli rozwiązania zadania z podobnej klasy, nieco jednak odmiennego od zadań jawnie pokazywanych w trakcie uczenia. Przykładowo, ucząc sieć rozpoznawania liter bardzo szybko uzyskujemy sukces (sieć bezbłędnie rozpoznaje wszystkie pokazywane jej litery), ale próba pokazania jej litery napisanej odmiennym charakterem pisma lub wydrukowanej innym fontem prowadzi bądź do zupełnego braku rozpoznania (zera na wszystkich wyjściach) bądź do rozpoznań ewidentnie błędnych. Bliższa analiza wiedzy zgromadzonej przez sieć ujawnia w takich przypadkach, że zapamiętała ona wiele prostych reguł w rodzaju &#8220;jak tutaj są dwa piksele zapalone, a tam jest pięć zer &#8211; to należy rozpoznać literę A&#8221;. Te prymitywne reguły nie wytrzymują oczywiście konfrontacji z nowym zadaniem i sieć zawodzi nasze oczekiwania.</p>
<p>Opisany objaw &#8220;uczenia się na pamięć&#8221; nie występuje w sieciach mających mniejszą warstwę ukrytą, gdyż dysponując ograniczoną pamięcią sieć taka musi lepiej się starać i wypracować na niewielu dostępnych jej elementach warstwy ukrytej takie reguły przekształcania wejściowego sygnału, by umożliwić jego trafne wykorzystanie w więcej niż jednym przypadku wymaganej odpowiedzi systemu. Z reguły prowadzi to do znacznie wolniejszego i bardziej uciążliwego procesu uczenia (przykłady, na podstawie których sieć ma się uczyć, muszą być pokazane więcej razy &#8211; często kilkaset lub kilka tysięcy razy), jednak efekt końcowy jest zwykle znacznie lepszy &#8211; z chwilą stwierdzenia dobrego działania sieci dla przykładów stanowiących podstawę uczenia mamy prawo przypuszczać, że poradzi sobie ona także z podobnymi, chociaż nie identycznymi, zadaniami, pokazanymi jej w trakcie egzaminu. Nie zawsze tak jest, ale zwykle tak bywa i na tym musimy opierać swoje oczekiwania dotyczące użycia sieci.</p>
<p>Kilka następnych artykułów poświęcę studiowaniu mechanizmów uczenia i działania sieci neuronowych, oczywiście na takim poziomie i w takim zakresie, w jakim będzie to możliwe bez odwoływania się do matematyki. Czytelników zainteresowanych bliższymi szczegółami odsyłam do mojej książki pt. &#8220;Sieci neuronowe&#8221; dostępnej obecnie w prawie każdej księgarni.</p>
]]></content:encoded>
			<wfw:commentRss>http://www.jasinski.us/2009/01/tadeusiewicz-sieci-neuronowe-2/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>Tadeusiewicz &#8211; Sieci neuronowe 1</title>
		<link>http://www.jasinski.us/2005/12/tadeusiewicz-sieci-neuronowe-1/</link>
		<comments>http://www.jasinski.us/2005/12/tadeusiewicz-sieci-neuronowe-1/#comments</comments>
		<pubDate>Sat, 03 Dec 2005 17:17:42 +0000</pubDate>
		<dc:creator>admin</dc:creator>
				<category><![CDATA[Przedruki]]></category>
		<category><![CDATA[sieci neronowe]]></category>

		<guid isPermaLink="false">http://www.jasinski.us/?p=13</guid>
		<description><![CDATA[Sieci neuronowe (1) ENTER 1, Styczeń 1995 Ryszard Tadeusiewicz Mniej więcej na początku lat 90 zapanowała moda na sieci neuronowe. Chwilami odnosi się wrażenie, że badanie i stosowanie sieci neuronowych stało się tak dalece &#8220;w dobrym tonie&#8221;, że nieposiadanie dorobku i przemyśleń w tym zakresie jest wręcz nietaktem towarzyskim! Moda czy metoda? W informatyce od [...]]]></description>
			<content:encoded><![CDATA[<h2>Sieci neuronowe (1)</h2>
<p><em>ENTER 1, Styczeń 1995</em></p>
<p><strong>Ryszard Tadeusiewicz</strong></p>
<p class="j">Mniej więcej na początku lat 90 zapanowała moda na sieci neuronowe. Chwilami odnosi się wrażenie, że badanie i stosowanie sieci neuronowych stało się tak dalece &#8220;w dobrym tonie&#8221;, że nieposiadanie dorobku i przemyśleń w tym zakresie jest wręcz nietaktem towarzyskim!</p>
<p class="j"><span id="more-13"></span></p>
<h3>Moda czy metoda?</h3>
<p class="j">W informatyce od lat obserwujemy przypływy i odpływy zainteresowania różnymi szczegółowymi zagadnieniami, wpływające na kierunki prac badawczych, kształtujace obraz rynku komputerowego i ogniskujące na określonych zagadnieniach wysiłek licznych programistów.</p>
<p>Moda na sieci neuronowe przejawia się w ogromnej liczbie publikacji naukowych, jakie ukazują się na ten temat na świecie, niezliczonych konferencjach, na których prezentowane są wyniki prac naukowych i prób zastosowań, a także znajduje swój wyraz w liczbie uczonych, którzy uważają się za autorytety w tej dziedzinie. Liczba ta ostatnio lawinowo wzrasta.</p>
<p>Czas trwania takiej mody na ogół trwa od kilku miesięcy do kilku lat &#8211; na ogół do czasu, aż kolejna fascynacja nie ściągnie rzeszy &#8220;poszukiwaczy złota&#8221; w zupełnie nowe rejony. Przykładów można wymienić bez liku, m. in. masowy &#8220;atak&#8221; na nadprzewodniki wysokotemperaturowe, mijająca już fala mody na fraktale i chaos lub nawracające okresowo (jak epidemie dżumy!) fascynacje teorią zbiorów rozmytych.</p>
<p>JeśIi coś jest modne, to czasem warto się do tej mody przyłączyć, gdyż w ten sposób łatwiej zdobyć uznanie, skutecznie zaprezentować swój dorobek, zapewnić sobie możliwość publikacji oraz zyskać zamówienia na programy lub fundusze na badania. Dlatego modne tematy warto i nalezy poznać. Można takze ignorowad modę i trzymać się na uboczu, ale wtedy także warto wiedzieć, z czego się rezygnuje. Niezależnie wiec od tego, Drogi Czytelniku, czy pragniesz włączyć sieci neuronowe do swoich prac, czy zamierzasz je wyniośle ignorować &#8211; powinieneś je poznać.<br />
Ten artykuł, a także następne, które po nim nastąpią, mają na celu pokazanie, na czym ta modna dziedzina polega, jakie są jej realne atuty przyciągające badaczy, a także, jakie są jej ograniczenia, o których entuzjaści z reguły zapominają. Kto zastosował sieci neuronowe i rozwiązał ciekawy problem oraz, kto się na tym srodze poparzył. Ten cykl artykułów publikowanych na łamach ENTER-a powinien dać Ci pewien calościowy obraz problematyki sieci neuronowych, dzięki czemu będziesz mógł sam wybrać &#8211; czy przyłączysz się do grona entuzjastów tej nowej techniki, czy obdarzysz ją swoją wyniosłą wzgardą &#8211; wiedząc jednak dokładnie, dlaczego tak postępujesz.</p>
<p>Cykl będzie wyczerpujący, to znaczy postaram się zaprezentować wszystko to, co w sieciach najważniejsze i najnowsze. Będzie on jednak pozbawiony (celowo) tych licznych, drobnych, ale uciążliwych szczegółów, w które obfituje każda dziedzina techniki obliczeniowej, a które dają się zwykle wyrazić wyłącznie przy użyciu formuł matematycznych. Potraktowałem bowiem poważnie zasadę zapisaną na okładce wspaniałej książki Stephena W. Hawkinga &#8220;Krótka historia czasu&#8221;, głoszącą, że każde równanie zamieszczone w tekście zmniejsza liczbę Czytelników o połowę. Zależy mi na tym, by ten tekst przeczytały liczne osoby, wśród których znajdą się zapewne takie, które uznają sieci neuronowe za fajne i pożyteczne narzędzie. Dlatego nie zamieszczę w tekście ani jednego równania, jeśli bowiem choć jednego Czytelnika może to zniechęcić, to uważałbym to za niepowetowaną stratę. Natomiast szczególnie zainteresowa-nych informuję, że wszystkie szczegóły na temat teorii i zastosowań sieci neuronowych zawarłem w mojej książce pod tytułem &#8220;Sieci neuronowe&#8221;, wydanej przez Akademicką Oficynę Wydawniczą RM w 1993 roku. Jest tam tyle wzorów, że gdyby reguła Hawkinga miała obowiązywać w sposób dokładny i gdyby chociaż jedna osoba miała przeczytać książkę do końca &#8211; liczba potencjalnych czytelników na początku powinna być większa od liczby neuronów w mózgu (i wielokrotnie większa od liczby ludzi, jacy żyli od początku dziejów). Mam jednak nadzieję, że obliczenia wielkiego astrofizyka są w tym miejscu niedokładne i znajdę chociaż kilka osób, które podejmą także trud przeczytania poważnej książki.</p>
<p class="h3">Równoległość przetwarzania</p>
<p class="j">Sieci neuronowe są nowym i pod wieloma względami atrakcyjnym narzędziem informatycznym, zasadniczo odmiennym w swoich założeniach od tych komputerów, którymi posługujemy się na co dzień, a jednocześnie wybitnie wygodnym i wydajnym. Dlatego właśnie interesują się nimi zarówno badacze, jak i praktycy. Zalety sieci neuronowych polegają na dwóch podstawowych atutach:</p>
<ol>
<li> stanowią wygodną i tanią propozycję wieloprocesorowego systemu o bardzo wielu elementach przetwarzających równolegle dostarczane informacje;</li>
<li> nie wymagają programowania, tylko wykorzystują proces uczenia.</li>
</ol>
<p class="j">Omówię teraz obydwie wymienione zalety sieci neurono-wych, pokazując, jakie jest ich znaczenie. Przy okazji podam pewne podstawowe pojęcia i koncepcje związane z techniką sieci neuronowych, których rozwinięcie i dokładniejsza dyskusja będą przedmiotem kolejnych, dalszych artykułów.</p>
<p>Pierwszy atut sieci, polegający na możliwości realizacji w nich postulatu &#8220;masowego równoległego przetwarzania&#8221; (massive parallel processing) wynika z faktu, że sieć neuronowa zbudowana jest z bardzo wielu (od kilkuset do kilkudziesięciu tysięcy) równocześnie pracujących i wspólnie przetwarzających informacje elementów zwanych neuronami. Ich pierwowzorem są komórki nerwowe składające się na mózg człowie-ka, ale w istocie elementy używane w technicznych sieciach neuronowych są skrajnie uproszczone i zawierają tylko podstawowe   (nie do końca wiadomo, czy najważniejsze) właściwości swoich biologicznych pierwowzorów. Niżej je dokładniej opiszę, teraz jednak istotne jest tylkoto, że neurony są bardzo proste w swojej budowie i działaniu, w związku z czym łatwo jest je symulować za pomocą komputera, a specjalistyczne układy scalone (są już takie) mogą zawierać setki takich elementów w jednym &#8220;chipie&#8221;.</p>
<p>Z takich neuronów (czyli procesorów zawierających zarówno elementy pamięci, jak i pewne możliwości przetwarzania informacji) buduje się sieć, łącząc je ze sobą według pewnych prostych reguł. Przy wyborze sposobu połączeń i struktury sieci ponownie spotykamy maksymalne uproszczenia, gdyż generalnie w sieciach neuronowych wierność biologicznemu oryginałowi poświęca się na rzecz prostoty. Używane sieci najczęściej buduje się jako struktury złożone z pewnej liczby warstw neuronów, połączonych między sobą w sąsiednich warstwach na zasadzie &#8220;każdy z każdym&#8221;. Jest to biologicznie nie uzasadnione i bardzo daleko idące uproszczenie. Struktura warstwowa występuje wprawdzie w pewnych rejonach mózgu (np. w korze wzrokowej), jednak z pewnością nie jest tak prosta i regularna, jak struktura budowanych sztucznie sieci &#8211; nie mówiąc już o tym, że inne fragmenty mózgu mają zupełnie inną budowę, na przykład bardziej zbliżoną (lokalnie) do topologii gwiazdy. Ponieważ jednak przyjęcie struktury warstwowej ułatwia techniczne operowanie siecią i zapewnia możliwość jej zdefiniowania przy minimalnym wkładzie pracy zarówno w rozwiązaniach symulacyjnych (wystarczy kilka prostych pętli w programie, by &#8220;obsłużyć&#8221; całą sieć), jak i przy wykonaniach sprzętowych (obwód drukowany, na którym rozmieszcza się chipy z modelami neuronów ma prostą i łatwą do wykonania strukturę) &#8211; wszyscy tak postępują, nie martwiąc się ani przesłankami biologicznymi, ani dowodami wskazującymi, że architektura sieci bardziej wymyślnie dostosowanej do charakteru zadania może znacznie lepiej realizować stawiane zadania.</p>
<p>Z kolei pomysł jednorodnego &#8220;pełnego&#8221; schematu połączeń między elementami poszczególnych warstw zapewnia minimalizację wysiłku związanego z definiowaniem sieci, chociaż odbywa się to kosztem dużego nakładu (np. pamięci w modelu symulacyjnym czy potencjalnych połączeń w strukturze chipu), niezbędnego dla zapewnienia możliwości odwzorowania w sieci wszystkich niezbędnych przy takim założeniu połączeń. Warto zauważyć, że bez przyjęcia (arbitralnie!) jednorodności struktury sieci samo tylko opisanie topologii jej połączeń wymaga podania setek tysięcy parametrów, co skutecznie udaremnia wszelkie próby stosowania takich struktur o nadmiernie wymyślnych architekturach połączeń. Natomiast decyzja o przyjęciu połączeń typu &#8220;każdy z każdym&#8221; stanowi elementarny i nie wymagający żadnego głębszego zastanowię-nią akt woli konstruktora sieci. Tak jest łatwiej i dlatego (prawie) wszyscy tak robią. Możliwość wygodnego (czytaj: bez-4 myślnego) stosowania tego typu uproszczenia wynika z faktu, że w trakcie procesu uczenia sieć &#8220;sama&#8221; wybierze z dostęp nych jej początkowo wszystkich połączeń te, które są naprawdę potrzebne, odrzucając (zerując) pozostałe.</p>
<p>Podsumowując tę	część rozważań możemy stwierdzić, że sieć składa się z bardzo wielu prostych (i tanich!) elementów zdolnych do równoczesnego przetwarzania informacji, których wspólne i równoczesne działanie tworzy efekt w postaci przetwarzania informacji wejściowej, podawanej do pierwszej warstwy neuronów (dane) na sygnały pojawiające się na wyjściach wszystkich neuronów sieci. Niektóre z nich, tworzące ostatnią warstwę sieci, dostarczają rozwiązania postawionego zadania (wyniki). Dzięki równoczesnej pracy wszystkich neuronów sieć może dostarczać rozwiązań o wiele szybciej niż jakikolwiek inny system komputerowy &#8211; oczywiście pod warunkiem realizacji elementów sieci w postaci specjalizowanych bloków elektronicznych lub optoelektronicznych (bywają i takie). Ponieważ widziałem wiele zawiedzionych min różnych naiwniaków, czuję się w obowiązku podkreślić oczywisty fakt, że chętnie stosowane symulowanie sieci na zwykłych komputerach nie zwiększa ich szybkości &#8211; chociaż może przyczyniać się do efektywniejszego rozwiązywania problemów dzięki zastąpieniu skomplikowanego algorytmu numerycznego prostszą obliczeniowo &#8220;sieciową aproksymacją&#8221;.</p>
<p class="h3">Zdolność uczenia się</p>
<p class="j">Drugim atutem sieci jest ich zdolność do uczenia się. Tutaj nie ma już różnicy między siecią wykonaną ze specjalizowanych układów scalonych i siecią symulowaną &#8211; jedna i druga nie wymaga programowania. Jest to bardzo silny argument zdecydowanie przemawiający za szerokim stosowaniem sieci wszędzie tam, gdzie algorytm działania nie jest do końca znany lub musi być często i szybko modyfikowany (na przykład w zadaniach sterowania adaptacyjnego obiektami automatyki o zmiennych w czasie właściwościach). Szczegóły procesu uczenia będą omawiane w dalszych artykułach cyklu, gdyż stanowią jeden z najważniejszych i najciekawszych elementów techniki sieci neuronowych.</p>
<p>Tutaj warto jedynie uwypuklić kilka ogólnych  zagadnień wiążących się z tym tematem.</p>
<p>Po pierwsze, możliwość uczenia sieci usuwa jeden z najtrudniejszych problemów wiążących się z techniką systemów wieloprocesorowych. Ogólnie wiadomo, że sensowne zaprogramowanie systemu złożonego z kilku jednostek mających równocześnie przetwarzać informacje (np. systemu wielotransputerowego) wymaga o wiele większego wysiłku, niż napisanie programu dla konwencjonalnej maszyny jednoprocesorowej. Gdyby trzeba było &#8220;ręcznie&#8221; programować sieć złożoną z kilkudziesięciu tysięcy równocześnie pracujących procesorów (neuronów) &#8211; byłby to prawdziwy horror. Tymczasem twórca sieci nie musi nawet palcem kiwnąć &#8211; sieć sama się zaprogramuje w wyniku procesu uczenia. Metody tego uczenia i samouczenia się sieci będą opisane (na tyle, na ile to będzie możliwe bez używania zaawansowanej matematyki) w następnych odcinkach cyklu.</p>
<p>Po drugie, użytkownik może na własną rękę sieć dowolnie &#8220;douczać&#8221; adaptując jej zachowanie do swoich szczegółowych wymagań. Wysiłek włożony w ten &#8220;trening&#8221; może być naprawdę minimalny (w skrajnych przypadkach sieć może douczać się sama, obserwując wyniki swojego działania i korygując ewentualne błędy). Żeby było jeszcze atrakcyjniej &#8211; twórca sieci może nie mieć pojęcia, jak należy rozwiązać postawione zadanie, a sieć potrafi sama znaleźć to rozwiązanie i zapamiętać &#8220;odkrytą&#8221; przez siebie metodę! Na tej właśnie zasadzie działają między innymi systemy wykorzystujące sieci neuronowe do prognoz giełdowych &#8211; my nie wiemy, od czego naprawdę zależy zwyżka lub zniżka cen określonych akcji, ale możemy zmusić sieć, by próbowała te zmiany przewidywać na podstawie analizy wcześniejszych zmian notowań traktowanych jako materiał do uczenia sieci. Najzabawniejsze jest, że sieć naprawdę potrafi to zrobić! Znane są przykłady znakomitego prognozowania za pomocą sieci notowań giełdowych, kursów walut, zapotrzebowania na energię elektryczną i wielu innych na pozór przypadkowych przebiegów, przy czym twórcy sieci nawet po ich wytrenowaniu nie potrafili dojść, &#8220;jak ona to robi&#8221;.</p>
<p class="h3">Umiejętność abstrakcji</p>
<p class="j">Wreszcie, po trzecie, sieć potrafi (w ograniczonym zakresie) uogólniać wiedzę zdobytą w toku procesu uczenia. Po nauczeniu sieci reagowania w określony sposób na określone zbiory danych (czyli rozwiązywania pewnej klasy problemów) można kazać jej rozwiązać zadanie podobne do tych, które podawano w trakcie uczenia, ale w pewnym stopniu odmienne. Sieć jest w stanie uogólnić posiadane wiadomości na przypadki, których nigdy nie widziała, może więc &#8220;wymyślić&#8221;  sposób rozwiązania nieznanego zadania, czego zwykły komputer normalnie zaprogramowany nigdy nie zrobi. Przykładem zadań, w których te własności sieci znajdują zastosowania, są pamięci asocjacyjne. Sieć potrafi zgromadzić określony zestaw wiadomości, do których dostęp można uzyskać na zasadzie kontekstowej, a nie na zasadzie adresowej, jak w zwykłym komputerze. Przykładowo można sieć nauczyć kilku obrazów, a potem pokazać drobny fragment jednego z nich, być może nawet zakłócony i zniekształcony. Sieć na podstawie tej niepełnej i niedokładnej informacji potrafi odnaleźć i otworzyć pełny obraz w jego idealnej postaci.</p>
<p class="j">Sieć ma więc pewne cechy upodabniające ją do naszego mózgu, w którym także możliwe jest uogólnianie zdobytej wiedzy na nowe (chociaż podobne) przypadki, a pamięć funkcjonuje na zasadzie asocjacji, a nie na zasadzie adresów czy słów kluczowych. Jest to fascynujące spostrzeżenie, samo w sobie wystarczające do tego, by uznać sieć neuronową za interesujący obiekt badań.</p>
<p>Zaskakujących analogii z ludzkim umysłem jest w dziedzinie sieci neuronowych więcej. Sieć nie daje się na przykład &#8220;wyprowadzić w pole&#8221; &#8211; jeśli uczący ją nauczyciel popełnia błędy lub jest niekonsekwentny, sieć uzyskuje możliwość realizacji stawianego zadania lepiej niż nauczyciel, który ją naucza. Obserwacje, za pomocą których sieć &#8220;trenujemy&#8221; mogą być także obarczone błędami, a także decyzje nauczyciela, na których sieć ma się wzorować, bywają błędne (zdarza się to zwłaszcza w zadaniach rozpoznawania obrazów). Okazuje się, że sieć potrafi te losowe zjawiska &#8220;uśrednić&#8221;, uzyskując zwykle bardziej klarowny obraz rozpoznawanego wzorca, niż by wynikało z podawanych w trakcie uczenia przykładów.</p>
<p>Sieć wykazuje też zwiększoną odporność na uszkodzenia -potrafi zwykle działać poprawnie nawet w przypadku, kiedy część jej elementów jest uszkodzona, połączenia zerwane, a informacje zawarte w strukturze sieci (to one zawierają właśnie zgromadzoną w toku uczenia &#8220;wiedzę&#8221; sieci) bezpowrotnie stracone. Takich właściwości nie ma żaden z komputerów, natomiast są one dobrze znane neurologom, gdyż mózg człowieka wykazuje właśnie zdumiewające zdolności poprawnego działania, mimo bardzo obszernych niekiedy uszkodzeń.</p>
<p>Podsumowując tę część rozważań należy stwierdzić, że sieci neuronowe są zdolne do samoprogramowania w wyniku procesu uczenia, a także wykazują pewne cechy podobne do cech rzeczywistego mózgu, a wyraźnie odmienne od cech klasycznych komputerów. Wszystkie te możliwości słusznie uznawane są za ważne i wysoce przydatne atuty, dlatego liczba zastosowań sieci neuronowych jest już bardzo długa i zapewne będzie w najbliższym czasie dalej wydłużana.</p>
<p class="h3">Przykłady zastosowań</p>
<p class="j">W cytowanej wcześniej książce (R. Tadeusiewicz: Sieci neuronowe, AOW RM, Warszawa 1993) wymieniłem i omówiłem kilkanaście takich zastosowań, tutaj przedstawię kilka dalszych, nowych przykładów, eksponując głównie te dokonania, które znalazły konkretne miejsce wpraktyce, zwłaszcza te najnowsze, które pojawiły się po napisaniu książki (a więc głównie w 1994 roku).</p>
<p>NASA wykorzystuje sieci neuronowe do sterowania ramieniem robota, którego zadaniem jest chwytanie przedmiotów znajdujących się w dowolnym położeniu (dotyczy to między innymi manipulatora działającego w ładowni promów kosmicznych, gdzie w warunkach nieważkości szczególnie trudno jest utrzymać manipulowane obiekty w stałym położeniu, a pewność chwytu jest uzależniona od stopnia zgodności orientacji przestrzennej osi przedmiotu i elementów chwytaka.</p>
<p>Również do zadania sterowania ramienia robota dedykowana jest sieć neuronowa zbudowana przez uczonych z New York University Medical Center. Zastosowano sieci jako alternatywę dla złożonych tensorowych obliczeń dotyczących parametrów ruchu ramienia robota w celu znacznego przyspieszenia działania systemu sterowania, który dzięki zastosowaniu sieci może działać w czasie rzeczywistym. Zwykłe algorytmy realizowane na tych samych komputerach nie są w stanie osiągnąć wystarczającej szybkości przy wyznaczaniu wszystkich potrzebnych współrzędnych, przyspieszeń i wielkości wymaganych sił i momentów obrotowych.</p>
<p>Firma General Dynamics opracowała dla potrzeb US Navy oparty na sieciach neuronowych system klasyfikujący i rozpoznający sygnały sonarowe. System ten pozwala rozpoznawać<br />
szumy charakterystyczne dla napędów różnych typów statków i okrętów. Udało się tak dokładnie wytrenować sieć, że jest ona zdolna do rozróżniania między sobą szumów różnych okrętów tego samego typu, co pozwala na identyfikację nazwy jednostki, a także potrafi rozpoznawać za pomocą hydrofonów niektóre dźwięki nadwodne, na przykład szum wytwarzany przez helikopter unoszący się nad powierzchnią oceanu.</p>
<p>Podobne osiągnięcia, ale w zakresie identyfikacji samolotów uzyskali naukowcy z University of Pensylvania współpracujący z firmą TRW. Zbudowana przez nich sieć neuronowa potrafi rozpoznawać samoloty z taką dokładnością, że podstawą do bezbłędnej identyfikacji może być detal wielkości 18 cali zaobserwowany z odległości 50 mil.</p>
<p>W szpitalu Anderson Memoriał Hospital w Południowej Karolinie wykorzystano sieci neuronowe do realizacji procesu optymalizacji leczenia, zyskując (jak podają publikacje) miliony dolarów oszczędności i ratując życie kilkudziesięciu ludzi. Niestety, bliższe dane na temat tego ciekawego przedsięwzięcia nie są znane.</p>
<p>Wielki producent rakiet, firma General Devices Space Systems Division użyła sieci neuronowych do sterowania pracą 150 zaworów doprowadzających paliwo i tlen do silników rakiety Atlas. Okazało się, że odpowiednio wytrenowana sieć potrafiła w oparciu o dane na temat aktualnych fluktuacji mocy silnika sterować zaworami trafniej, niż poprzednio stosowany, kosztowny, zawodny i złożony system automatyki oparty na wykorzystaniu danych z setek sensorów.</p>
<p>Bardzo znanym zastosowaniem sieci neuronowej jest wykorzystany przez firmę Eaton Corporation układ sterowania pozwalający na wspomaganie kierowcy dużej ciężarówki (pięć osi, osiemnaście kół) przy wykonywaniu niektórych szczególnie trudnych manewrów (cofanie z naczepą).</p>
<p>Sieci neuronowe często stosowane są w energetyce, zwłaszcza do prognozowania zapotrzebowania na moc elektryczną. Jedno z bardziej znanych wdrożeń w tym zakresie dotyczy elektrowni BC Hydro w Vacouver, szczególnie trudnej do sterowania, ponieważ jej cztery turbiny mają wyraźnie różniące się charakterystyki i zadanie ich włączania i wyłączania w odpowiedzi na zmienne zapotrzebowanie na moc elektryczną ze strony odbiorców energii jest wyjątkowo złożone i niewdzięczne.<br />
Takich i podobnych doniesień o udanych zastosowaniach sieci neuronowych znaleźć można w najnowszym piśmiennictwie bez liku. Żeby nie przedłużać nadmiernie tego wątku wymienię jeszcze tylko kilka dalszych zastosowań w skrócie.</p>
<p>Amerykańskie siły powietrzne (US Air Force) stosują sieci neuronowe do rozwoju symulatorów lotu.</p>
<p>Do sieci neuronowych odwołał się koncern Ford Motor Company przygotowując nowy system diagnostyczny dla swoich silników.</p>
<p>Firma Halliburton stosuje sieci neuronowe do identyfikacji typu skał napotykanych podczas prowadzenia odwiertów poszukiwawczych przy poszukwaniu złóż ropy i gazu.</p>
<p>Linie TWA stosują sieci neuronowe do poszukiwania bomb w swoim terminalu na lotnisku JFK w Nowym Yorku.</p>
<p class="h3">Słabe strony sieci neuronowych</p>
<p class="j">Jak widać, udanych przykładów zastosowania sieci neuronowych jest bardzo wiele. Czy z tego wynika, że powinniśmy porzucić dobrze znane &#8220;klasyczne&#8221; komputery i wszystkie zadania obliczeniowe rozwiązywać wyłącznie przy użyciu sieci? Zdecydowanie nie &#8211; sieci są narzędziem modnym i wygodnym, mającym jednak szereg istotnych ograniczeń. Dokładniejsza specyfikacja tych ograniczeń wyłoni się z dalszych rozważań, kiedy to w kolejnych odcinkach cyklu poznamy kolejne struktury sieci, metody ich uczenia i szczegółowe sposoby ich zastosowania do konkretnych zadań. Już teraz można jednak podać kilka charakterystycznych cech zadań, których rozwiązanie z wykorzystaniem sieci jest praktycznie niemożliwe.</p>
<p>Pierwsza klasa zadań, przy rozwiązywaniu których trzeba całkowicie zrezygnować z sieci, związana jest z manipulacjami na symbolach. Wszelkie formy przetwarzania informacji w postaci symbolicznej są niesłychanie trudne do przeprowadzenia przy użyciu sieci neuronowych, dlatego obecność elementu polegającego na przetwarzaniu symboli powinno być sygnałem, że z użycia sieci trzeba będzie zrezygnować. Sprowadzając rzecz do krańcowego przykładu można powiedzieć, że nie ma elementarnego sensu budowanie edytora tekstu działającego w oparciu o koncepcję sieci neuronowej lub procesora wyrażeń algebraicznych wykorzystującego tę samą koncepcję.</p>
<p>Drugim &#8220;klasycznym&#8221; obszarem, w którym sieci neuronowej nie da się zastosować, jest problematyka obliczeń, przy których wymagana jest wysoka dokładność wyniku numerycznego. Sieć pracuje zawsze w sposób &#8220;jakościowy&#8221;, to znaczy dostarczane przez nią rozwiązania mają zawsze charakter przybliżony. Dokładność tego przybliżenia jest zadowalająca w wielu zastosowaniach: przy przetwarzaniu sygnałów, analizie obrazów, rozpoznawaniu mowy, prognozowaniu wartości notowań giełdowych, sterowaniu robotów, aproksymowaniu wartości złożonej funkcji itp. Absolutnie nie do przyjęcia jest jednak przybliżone 15 wykonywanie obliczeń charakterystyczne dla sieci neuronowej 3 w przypadku na przykład obsługi kont bankowych lub realizacji precyzyjnych obliczeń inżynierskich.<br />
Trzeci wreszcie obszar, w którym trudno oczekiwać dobrych wyników przy stosowaniu sieci neuronowych, związany jest z zadaniami wymagającymi wieloetapowego rozumowania &#8211; na przykład wieloetapowego rozstrzygania o prawdziwości lub fałszywości pewnych sekwencji stwierdzeń logicznych. Sieć na ogół usiłuje rozwiązać postawiony problem jednokrokowo &#8211; jeśli się jej to uda, wynik jest dostępny natychmiast i jest to duży praktyczny sukces. Jeśli jednak trzeba przeprowadzić pewien ciąg rozumowania, a zwłaszcza jeśli trzeba podać dokumentację tego ciągu częściowych uzasadnień końcowego wniosku (na przykład w systemach ekspertowych) &#8211; sieć okazuje się tworem zupełnie nieprzydatnym i wszelkie próby jej zastosowania prowadzić muszą do frustrujących niepowodzeń.</p>
<p>Z tego, co wyżej napisano, nie należy wyciągać pochopnych wniosków: sieć nie może sama wykonywać obliczeń symbolicznych, ale może wspomagać systemy operujące na symbolach w zakresie czynności, z którymi one sobie nie radzą. Przykładem mogą być sieci Teuvo Kohonena lub klasyczna sieć NetTalk Terence Sejnowskiego, używane do zamiany tekstu ortograficznego na ciąg symboli fonematycznych służących do sterowania syntezatorem mowy. Podobnie, ze stwierdzenia, że sieci nie nadają się do obsługi pracy terminalu w okienku bankowym, nie wynika ich bezużyteczność dla banków jako takich &#8211; przeciwnie, okazały się wyjątkowo użyteczne w badaniach wiarygodności kredytobiorców lub przy ustalaniu warunków negocjowanego kontraktu. Podobne zastrzeżenia można mnożyć bez końca.</p>
<p>Ważny jest jednak jeden konkretny końcowy wniosek: sieć neuronowa nadaje się do wielu zastosowań, nie jest jednak tak uniwersalna jak klasyczny komputer. Dlatego entuzjastom łatwo jest wskazać zadania, których rozwiązania za pomocą sieci okazały się znacząco lepsze niż rozwiązania uzyskane przez klasyczne komputery, zaś malkontenci bez trudu wskażą zadania, dla których rozwiązania wykorzystujące sieci okazały się groteskowo niepoprawne. Prawda &#8211; jak zwykle &#8211; leży pośrodku.</p>
<p>Spróbujemy jej poszukać w kolejnych artykułach cyklu, opisując dokładniej technikę sieci neuronowych, metody ich uczenia, a także dostępne programy symulacyjne i systemy hardware&#8217;owe, pozwalające każdemu &#8220;pomacać własnymi rękami&#8221;, ile to wszystko jest warte.</p>
<p align="right"><em>Autor jest profesorem Akademii Górniczo-Hutniczej w Krakowie.</em></p>
]]></content:encoded>
			<wfw:commentRss>http://www.jasinski.us/2005/12/tadeusiewicz-sieci-neuronowe-1/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>Ralph Linton &#8211; DYFUZJA</title>
		<link>http://www.jasinski.us/2005/12/ralph-linton-dyfuzja/</link>
		<comments>http://www.jasinski.us/2005/12/ralph-linton-dyfuzja/#comments</comments>
		<pubDate>Fri, 02 Dec 2005 23:12:41 +0000</pubDate>
		<dc:creator>admin</dc:creator>
				<category><![CDATA[Przedruki]]></category>

		<guid isPermaLink="false">http://new.jasinski.us/?p=11</guid>
		<description><![CDATA[Bardzo ciekawy artykuł, który przytrafił mi się na studiach. Warto przeczytać. Ralph Linton DYFUZJA Fragment książki The Study af Man: An Introduction. New York 1936, s. 324 &#8211; 346. Przedruk w zbiorze Theories of Society. Copyright © by the Macmillan Company (Collier Macmillan International, Inc.). W poprzednim rozdziale zobaczyliśmy, jak konkretna kultura ukierunkowuje i zakreśla [...]]]></description>
			<content:encoded><![CDATA[<p class="content" style="width: 100%;">Bardzo ciekawy artykuł, który przytrafił mi się na studiach. Warto przeczytać.</p>
<p class="content" style="width: 100%;"><span id="more-11"></span></p>
<p class="content" style="width: 100%;"><em>Ralph Linton</em></p>
<p class="content" style="width: 100%;">
<h1>DYFUZJA</h1>
<p><em>Fragment książki The Study af Man: An Introduction. New York 1936, s. 324 &#8211; 346. </em><em> Przedruk w zbiorze Theories of Society. Copyright © by the Macmillan Company (Collier Macmillan International, Inc.).</em></p>
<p>W poprzednim rozdziale zobaczyliśmy, jak konkretna kultura ukierunkowuje i zakreśla granice wysiłków wynalazcy oraz decyduje o tym, czy jego wynalazki zostaną społecznie zaakceptowane. Powoduje to, że liczba uwieńczonych sukcesem wynalazków w ramach każdego spójnego społeczeństwa i kultury jest zawsze mała. Gdyby każda grupa ludzka musiała piąć się wzwyż własnym trudem, bez żadnego oparcia, postęp byłby tak powolny, iż wątpić można, czy do tej pory jakiekolwiek społeczeństwo wyszłoby poza poziom epoki kamiennej. Względnie szybki rozwój kultury ludzkiej jako całości zawdzięczamy zdolności społeczeństw do zapożyczania elementów od innych kultur i włączania ich w obręb własnej. Takie przenoszenie elementów kulturowych z jednego społeczeństwa do innego nazywamy dyfuzją. Jest to proces, dzięki któremu ludzkość zdoln była zespolić swe zdolności wynalazcze. Dzięki dyfuzji wynalazek zrealizowany i zaakceptowany społecznie w jednym miejscu może być przekazywany coraz szerszej grupie kultur, aż z upływem wieków upowszechni się praktycznie wśród całej ludzkości.</p>
<p>Wkład dyfuzji w postęp ludzkości jest dwojaki. Pobudziła ona rozwój kultury jako całości i jednocześnie wzbogaciła treść kultur poszczególnych, posuwając wzwyż i naprzód społeczeństwa, które je zrodziły. Przyczyniła się do przyspieszenia ewolucji całej kultury, gdyż dzięki niej żadne społeczeństwo nie musi samotnie i samodzielnie dokonywać wszystkich kroków prowadzących do wynalazku. W ten sposób podstawy wynalazku stworzone w jednym miejscu przyciągną w końcu uwagę wielu wynalazców, a możliwości dalszego jego wykorzystania i usprawniania będą dogłębnie zbadane. Skoro zaś w rozwiązanie problemu angażuje się więcej umysłów, proces postępu kulturowego ulega przyspieszeniu. Gwałtowność postępu w ostatnim stuleciu z pewnością w dużej mierze wynika z rozwoju środków ułatwiających i przyspieszających komunikację, z którym w parze idą możliwości zapewnienia wynalazcy materialnego wynagrodzenia jego wysiłków. Dzięki patentom nie jest już konieczne zachowywanie tajemnicy. Za korzystanie z wynalazków przez czas jakiś ściągany jest podatek, lecz pomysł zostaje udostępniony wszystkim. Obecnie każdy zrealizowany wynalazek natychmiast upowszechnia się na dużym obszarze oraz staje się częścią zasobu wiedzy dostępnej setkom wynalazców. Nim rozwój osiągnął, obecny, stan, na to, by nowy element kultury przyjął się na obszarze, jaki obecnie, ogarnia, w kilka miesięcy lub lat, trzeba było wieków.</p>
<p>Powolny postęp kulturowy społeczeństw zdanych na własne możliwości dobrze ilustrują sytuacje izolowanych grup ludzkich. Przykład skrajny stanowią zapewne Tasmańczycy. Lud ten został odcięty od reszty ludzkości przynajmniej 20 000 lat temu. Gdy dotarli na swoją wyspę, ich kultura zapewne, przynajmniej w swym aspekcie materialnym, z grubsza odpowiadała europejskiej w środkowym paleolicie. W tym samym stadium znajdowali się równiej gdy po raz pierwszy zawitali dof nich Europejczycy w XVIII w. W ciągu długiego okresu izolacji niewątpliwie poczynili pewne drobne postępy i ulepszenia, lecz olbrzymie zapóźnienie kulturowe &#8216;odzwierciedlało brak kontaktów zewnętrznych. By przytoczyć znacznie mniej skrajny przykład: kultura naszych własnych izolowanych społeczności w górach ciągle pod wieloma względami odpowiada kulturze pionierskiej sprzed stu lat. Pierwsi osadnicy w tych odosobnionych okolicach przynieśli tę kulturę ze sobą, a ich pozbawione zewnętrznego oparcia wysiłki niewiele do niej wniosły. Ogólnie, im więcej dane społeczeństwo ma okazji do zapożyczeń, tym szybszy będzie jego postęp kulturowy.</p>
<p>Wkład dyfuzji we wzbogacenie treści poszczególnych kultur jest olbrzymi. Prawdopodobnie nie istnieje obecnie kultura, która zawdzięczałaby więcej niż 10% całości swych elementów wynalazkom poczynionym przez członków jej własnego społeczeństwa. Ponieważ żyjemy w okresie lawiny wynalazków, skłonni jesteśmy sądzić, iż kultura nasza jest w znacznej mierze samorodna, jednak uzmysłowimy sobie rolę, którą w jej rozwoju odgrywała dyfuzja, rozważywszy, jak zaczyna się dzień przeciętnego człowieka. Tereny wyliczone niżej oznaczają jedynie miejsca powstawania różnych elementów kulturowych, a nie okolice, z których obecnie w drodze handlu uzyskujemy materiały lub przedmioty.</p>
<p>Solidny amerykański obywatel budzi się w łóżku zbudowanym według wzoru powstałego na Bliskim Wschodzie, lecz przed przeniesieniem do Ameryki zmodyfikowanego w północnej Europie. Odrzuca przykrycie zrobione z bawełny, pierwotnie używanej w Indiach, lub płótna bądź wełny owczej — pierwotnie używanych na Bliskim Wschodzie — względnie też jedwabiu, którego wykorzystywanie odkryto w Chinach. Procesy przędzenia i tkania wszystkich tych materiałów wynaleziono na Bliskim Wschodzie. Wzuwa kapcie wymyślone przez Indian z lasów na wschodzie, idzie do łazienki której urządzenia są mieszaniną wynalazków europejskich i amerykańskich wszystkie niedawnej daty. Zdejmuje piżamę, odzież wymyśloną w Indiach, i myje się mydłem wynalezionym przez starożytnydh Galów. Następnie goli się — masochistyczny rytuał przejęty, jak się zdaje, bądź od Sumerów, bądź od starożytnych Egipcjan.</p>
<p>Wracając do sypialni, zdejmuje ubrania z krzesła o typie południowoeuropejskim i zaczyna się ubierać. Nakłada odzież, której kształt początkowo przejęty &#8211; został ze skórzanego odzienia nomadów ze stepów azjatyckich, wkłada buty zrobione ze skóry wygarbowanej w trakcie procesu wynalezionego w starożytnym Egipcie oraz skrojone według wzoru przejętego od klasycznych cywilizacji Morza Śródziemnego, wiąże wokół szyi pasek jasnokolorowego materiału, który jest szczątkowym przeżytkiem szali noszonych na ramionach przez siedemnastowiecznych Kroatów. Zanim wyjdzie z domu na śniadanie, wygląda przez szybę zrobioną ze szkła wynalezionego w Egipcie, a jeśli pada deszcz, nakłada kalosze zrobione z gumy odkrytej przez Indian środkowoamerykańskich i bierze parasol wymyślony w południowowschodniej Azji. Na głowę wkłada kapelusz zrobiony z filcu, materiału wynalezionego w stepach Azji. W drodze na śniadanie zatrzymuje się, by kupić gazetę, płacąc za nią monetami — wynalazek starożytnych Lidyjeżyków. W restauracji ma do czynienia z zestawem nowych elementów zapożyczonych. Talerz zrobiony jest z pewnego rodzaju glinki wynalezionej w Chinach. Nóż jest ze stali, stopu sporządzonego po raz pierwszy w południowych Indiach, widelec jest wynalazkiem średniowiecznych Włoch, ałyżka jest pochodzenia rzymskiego. Śniadanie zaczyna od pomarańcz ze wschodnich brzegów Morza Śródziemnego, kantalupy z Persji lub może od kawałka afrykańskiego arbuza. Popija to kawą, zrobioną z abisyńskiej irośliny, ze śmietanką i cukrem. Zarówno oswajanie krów, jak i pomysł ich dojenia zapoczątkowano na Bliskim Wschodzie, zaś cukier po raz pierwszy wyprodukowano w Indiach: Po owocach i pierwszej kawie przechodzi do wafli ciasta wykonanego techniką skandynawską z pszenicy, której uprawę podjęto w Azji Mniejszej. Polewa je syropem klonowym wynalezionym przez Indian z lasów na wschodzie. Uzupełnieniem mogą być jajka pewnego gatunku ptaków udomowionych w -Indochinach, względnie cienkie paski mięsa zwierzęcia udomowionego we Wschodniej Azji, mięsa, które nauczono się solić i wędzić w północnej Europie.</p>
<p>Gdy przyjaciel nasz skończy jeść, zabiera się do palenia — zwyczaj Indian amerykańskich — używając do tego rośliny, której uprawę zapoczątkowano w Brazylii, umieszczonej w fajce przejętej od Indian z Wirginii, bądź przygotowanej jako papieros, którego ojczyzną jest Meksyk. Jeśli jest dość odporny, może nawet spróbować cygara przeniesionego do Ameryki -z Antyli przez Hiszpanię. Paląc, czyta ostatnie wiadomości, odbite przy użyciu systemu znaków wynalezionych przez starożytnych Semitów techniką wynalezioną w Niemczech na materiale wynalezionym w Chinach. Jeili jest dobrym obywatelem o postawie konserwatywnej, to czytając sprawozdania o kłopotach za granicą będzie dziękować hebrajskiemu bóstwu w indoeuropejskim języku za to, że jest stuprocentowym Amerykaninem.</p>
<p>Powyższe wyliczenie jest jedynie odrobiną antykwarycznej wirtuozerii możliwej dzięki istnieniu niebywale kompletnej kroniki obszaru euroazjatyckiego. Istnieje wiele innych regionów, dla których kronika taka nie istnieje, a jednak kultury tamtych obszarów dostarczają podobnych dowodów o znaczeniu dyfuzji dla ustalenia się ich treści. Rozwinięto dość dokładne techniki określania rozrzutu poszczególnych cech, a nawet ustalania miejsc ich powstania, tak~że nie może być wątpliwości, iż wszędzie tam, gdzie stykały się dwa społeczeństwa i dwie kultury, zachodziła dyfuzja.</p>
<p>Biorąc pod uwagę olbrzymie znaczenie tego mechanizmu dla wzbogacenia kultury, dziwi ciągle jeszcze tak mała znajomość rzeczywistej dynamiki procesu dyfuzyjnego. Większość badaczy, których interesowało to zagadnienie, uważała badanie dyfuzji zaledwie za wstęp do rekonstrukcji historycznej. Mnóstwo czasu i wysiłku poświęcali oni określeniu rozkładu elementów kulturowych, lecz zadowalali się sformułowaniem dwóch lub trzech podstawowych zasad dyfuzji, mających bezpośrednie zastosowanie w ich studiach historycznych. Badania takie w żadnym wypadku nie służyły li tylko próżnej ciekawości, jak chcieliby to widzieć niektórzy ich przeciwnicy. Treści kultury w każdym momencie historycznym wyjaśnić można jedynie w oparciu o jej przeszłość, a świartło, jakie przeszłość na nie może rzucić, zawsze przyczyni się do zrozumienia teraźniejszości. Nawet badanie funkcji różnych elementów kultury traci sens, jeśli nie możemy ustalić, jakim czynnikom elementy te zawdzięczają swój kształt, a zatem również zdolność pełnienia funkcji. Sprawę tę omówimy jeszcze szerzej, obecnie musimy jedynie wskazać, że im dokładniejsza naszą wiedza o dynamice procesu dyfuzyjnego, tym większa możliwość trafnych rekonstrukcji historycznych w oparciu o rozkład geograficzny cechy.</p>
<p>Naprawdę zrozumieć dynamikę dyfuzji można jedynie obserwując proces w trakcie autentycznego przebiegu. Wnikliwe studium rozprzestrzeniania się każdego nowego elementu kulturowego, czynników, które je powodują, reakcji, które ten nowy element wywołał w różnych społeczeństwach, oraz przystosowań, które w różnych kulturach pociągnęło za sobą jego przyjęcie, zrobiłoby więcej dla osadzenia badań nad dyfuzją na solidnych podstawach niż dwadzieścia badań rozkładu geograficznego cechy w danym momencie czasowym. Niestety, nie ma jeszcze nawet jednego studium tego rodzaju. W poniższych rozważaniach musimy zatem postawić o wiele więcej pytań, niż potrafimy znaleźć odpowiedzi. niemniej istnieje kilka ogólnie uznanych teasad dyfuzji, możemy więc od nich rozpocząć nasze dociekanie.</p>
<p>Pierwsza z tych ząsad głosi, że <em>jeśli nie oddziałają żadne inne warunki, to elementy kultury zostaną przede wszystkim przejęte przez społeczeństwa, które stykają się z miejscami powstania tych elementów, a później przez społeczeństwa bardziej odlegle lub mające mniej bezpośrednie kontakty</em>. Zasada ta opiera się na oczywistym fakcie, że dyfuzja każdego elementu wymaga zarówno styczności, jak i czasu. Niemożliwe jest, by jakakolwiek cecha przemknęła do kultury, jeśli nie zetknie się ona z jakąś inną kulturą, która już tę cechę posiada. Tak więc, jeśli istnieją trzy plemiona: A, B i C, a terytorium B odgradza terytorium A od terytorium C i uniemożliwia wszelki bezpośredni kontakt między nimi, to żadna nowa cecha kulturowa, którą może rozwinąć A, nie dotrze do C, zanim nie zostanie przyjęta przez B. Wynika stąd również, że C przejmie tę cechę później niż B.</p>
<p>Na potwierdzenie ogólnej trafności tej zasady istnieje mnóstwo dowodów historycznych. I tak pismo alfabetyczne, które, jak się przypuszcza, wynalezione zostało na obszarze półwyspu Synaj, najpierw przejęły grupy semickie, które bezpośrednio stykały się z tym obszarem, a następnie przeniosły do Fenicji. Fenicjanie morzem dostarczyli je Grekom i Rzymianom, skąd alfabet, rozprzestrzenił się na północną Europę. W Skandynawii nie pojawił się wcześniej niż 2000 lat po odkryciu, a dotarł tam za pośrednictwem szeregu kultur sąsiadujących ze sobą, z których każda jakoś wpłynęła na jego rozwój.</p>
<p>Zasada dyfuzji cech na tereny coraz odleglejsze implikuj drugą zasadę <em>przeżytków peryferycznych</em>. Załóżmy, że w określonym społeczeństwie powstało nowe urządzenie, które coraz szerszymi kręgami upowszechnia się w społeczeństwach sąsiednich. Jednocześnie w miejscu swego powstania może ono z powodzeniem ulegać zmianom i usprawnieniom. Te usprawnienia będą z kolei przenikać do sąsiednich społeczeństw, lecz ponieważ ich dyfuzja zaczyna się odpowiednio później, więc urządzenie usprawnione upowszechniać się będzie z pewnym opóźnieniem w stosunku do urządzenia oryginalnego. Długo po tym, jak w miejscu narodzin nowe urządzenie całkowicie wyparło pierwowzór, ten nadal jest używany na peryferiach obszaru dyfuzji. Zasadę tę ilustruje współcześnie upowszechnianie się różnych typów telefonów w Stanach Zjednoczonych. Pierwsze telefony miały korby, które służyły temu, by wezwać centralę. Obecnie telefony z korbą są ciągle w użyciu na odległych terenach wiejskich, lecz w miastach znikły całkowicie. Typ telefonu z deską rozdzielczą pozwalającą automatycznie połączyć się z centralą używany jest na terenach pośrednich miejsko-wiejskich, zaś telefony .[...] tarczowe bardzo szybko torują sobie drogę w większych miastach, zaledwie zaczynają się pojawiać w mniejszych, a na obszary wiejskie w ogóle jeszcze nie dotarły. Można uważać, iż przykład ten nie jest najtrafniejszy, gdyż na dyfuzję telefonu wpływają, oczywiście, takie nietypowe czynniki, jak monopol obsługi telefonicznej oraz dążenie spółki do wykorzystania istniejącego już starego wyposażenia, posługujemy się nim jednak w celu zilustrowania zasady.</p>
<p>Procesy dyfuzji porównuje się najczęściej do fal na wodzie powstałych po wrzuceniu do spokojnej wody kamienia. Fale wciąż jeszcze rozchodzą się na zewnątrz, gdy centrum jest- uż na powrót spokojne. Choć takie systematyczne rozprzestrzenianie się cech z jednego centrum, w porządku ich występowania służyć może jako hipotetyczny przypadek dla zilustrowania zasady, autentyczne kromki historyczne świadczą, iż faky tycznie nigdy się tak nie dzieje. Nawet cechy, które powstały w tym samym centrum, rozprzestrzeniają się nieregularnie i pokonują dystans z różną prędkością. Uwidoczni to kilka przykładów.</p>
<p>Wszystko wskazuje na to, że uprawa kukurydzy w Ameryce jest cechą kulturową przejętą z Meksyku. Stamtąd rozprzestrzeniła się ona szeroko w dolinie Missisipi oraz wschodnich Stanach Zjednoczonych, a także trwale zakorzeniła się na południowym Zachodzie. Podczas gdy na wschodzie sięga aż po Nową Anglię, Dakotę oraz półwysep Michigan, na zachodzie ledwie przeniknęła do południowej Kalifornii. Jest tak mimo faktu, że ten region, jest w dość bliskim związku z południowym Zachodem, gdzie uprawa kukurydzy jest wysoko rozwinięta oraz gdzie stosuje się techniki odpowiednie dla uzyskiwania plonów w warunkach na wpół pustynnych. Podobnie Indianie kalifornijscy, poza niewielkim obszarem na południu, nie zdołali przejąć garncarstwa, chociaż bardzo blisko sąsiadowali z terenami, gdzie stało ono na wysokim poziomie, a przy dość osiadłym trybie życia plemion kalifornijskich byłoby ono dla nich bardzo użyteczne. Nasza obecna dość dokładna znajomość chronologii wydarzeń na południowym Zachodzie dowodzi, że plemiona na krańcach Kalifornii musiały podlegać wpływom kultur kukurydzy i garncarstwa przez co najmniej 1500 lat, a jednak żadnej sobie nie przyswoiły.</p>
<p>Oporność wobec przyjmowania nowych elementów kulturowych, nawet jeśli nie kładzie tamy dyfuaji w pewnych kierunkach, to hamuje jej tempo. Grupa, która nie chce przejąć nowego elementu, wznosi przegrodę między miejscem powstania itej cechy a grupami bardziej oddalonymi, które gotowe byłyby ją przyjąć, gdyby miały po temu okazję. Nawet jeśli w końcu niechęć grup pośredniczących zostanie przełamana, stracone zostanie mnóstwo czasu. Z powodu owego zmiennego współczynnika podatnpości, cechy rozchodzą się ż punktu swego powstania zawsze nieregular tak że pewne z nich przenikają zdumiewająco prędko, zaś inne, jeśli (&#8230;) do najbardziej uderzających przykładów niezmiernie szybkiej dyfuzji stanowi rozprzestrzenienie się pewnych upraw jadalnych Nowego Świata, szczególnie kukurydzy, w ciągu trzystu lat od momentu odkrycia Ameryki. Pod koniec tego okresu uprawy te przeniknęły praktycznie wszystkie obszary Europy, Azji i Afryki, na których mogły być uprawiane, a w wielu miejscach głęboko zmieniły wzory życia tubylców. Na przykład Betsimisaraka z Madagaskaru, którzy chyba nie mogli poznać kukurydzy przed 1600 r., wierzą, iż otrzymali ją od stwórcy w tym samym czasie, gdy dał on ryż plemionom równinnym na wyspie. Każdą sugestię, że mogła ona być wprowadzona dość niedawno, odpierają twierdzeniem, iż jest to niemożliwe, bowiem ludzie nie mogliby bez niej żyć.</p>
<p>Rozpowszechnienie się tytoniu po odkryciu Nowego Świata jest jeszcze bardziej uderzającym przykładem gwałtownej dyfuzji, a daje tę korzyść że jest dobrze udokumentowane. Raz przynajmniej ludowa tradycja zdaje się mieć słuszność przypisując wprowadzenie zwyczaju palenia w Anglii Sir Walterowi Raleighowi. W każdym razie pierwsze wzmianki o paleniu wiążą się z powrotem jego kolonistów z Wirginii, a wiadomo nam, że Ralph Lane, pierwszy gubernator, podarował w 1586 r. Raleighowi fajkę oraz poinstruował go, jak jej używać. Zapoczątkowało to zwyczaj palenia w kręgach dworskich, skąd ze zdumiewającą prędkością rozpowszechnił się on wśród ogółu ludności. Warto odnotować, że Francisco Fernandez w 1558 r. wprowadził również tytoń w Hiszpanii, lecz był on tam używany jako lek co znacznie opóźniło użytkowanie go w celach czysto towarzyskich.</p>
<p>Te dwa obszary, na których zaczęto używać tytoniu, stały się z kolei centrami jego dyfuzji w Starym Świecie. Anglia była głównym przenośnikiem, na .tereny północnej Europy. W.Holandii palenie zapoczątkowali angielscy studenci medycyny w 1590 .r., zaś Anglicy i Holendrzy wspólnie przenieśli nowy zwyczaj drogą morską do krajów bałtyckich i Skandynawii oraz lądem przez Niemcy do Rosji. Około 1634 r., czterdzieści osiem lat po pierwszym pojawieniu się w. północnej Europie, zwyczaj ten stał się plagą w Rosji, gdzie wydano przeciw niemu ustawy. Nie powstrzymało to jednak jego pochodu na wschód i w ciągu dwustu lat poprzez stepy i góry Syberii powrócił do Ameryki, tzn. na Alaskę. Tak gwałtowna dyfuzja zdumiewa tym bardziej, że na większości obszarów północnych uzyskanie tej rośliny wymaga kontaktów handlowych z krajami bardzo odległymi.</p>
<p>Z Hiszpanii i Portugalii poprzez kraje basenu Morza Śródziemnego tytoń toń przeniknął na Bliski Wschód. daty nie są tu jednak pewnoe, lecz sułtan turecki Murad wydał ustawę zabraniającą jego używania w 1605 r. Holendrzy i Portugalczycy wspólnie przenieśli go do Afryki i południowo-wschodniej Azji. W odległej Japonii przyjął się tak szybko, iż konieczne okazało się ograniczenie terenów poświęconych na jego uprawę. W Afryce Południowej tytoń stał się obiegowym środkiem wymiany pomiędzy Holendrami i tubylcami — krowa stanowiła równowartość tylu liści tytoniu, ile zmieściło się ich na odcinku odpowiadającym jej długości. Mimo częstych oficjalnydh zakazów i drakońskich przepisów ten nowy element kulturowy upowszechniał się niemal tak szybko, jak szybko ludzie potrafili podróżować.</p>
<p>Zauważono, że choć możliwe jest upowszechnianie się pojedynczych elementów kultury, ta cześciej wędrują grupy elementów funkcjonalnie powiązanych. Kwestię tę egzemplifikuje również rozpowszechnianie się tytoniu, ponieważ wraz z rośliną przenoszone były różne metody jej używania. Powiązania tych metod z różnymi liniami dyfuzji odnaleźć można nawet na terenach Nowego Świata. Indianie w różnych regionach używali tytoniu w różny sposób. Ci ze wschodniego wybrzeża Ameryki Północnej palili tytoń w fajkach kolankowych, które stały się prototypem współczesnych angielskich „briarów&#8221;. Choć ten kształt fajki uległ różnym zmianom w trakcie procesu dyfuzji na obszarach północnych, wszystkie jednak ludy, które przejęły zwyczaj palenia tytoniu od Anglii, pozostały w większości palaczami fajek. Indianie brazylijscy, z którymi najczęściej kontakty mieli Portugalczycy, woleli cygara, tak samo niektóre grupy z Antyli. Meksykańczycy natomiast woleli papierosy i przekazali je Hiszpanom. Od nich przejęły je kultury basenu Morza Śródziemnego, a fakt ten odzwierciedla nasze własne preferowanie papierosów tureckich i egipskich. Ponieważ w procesie przenoszenia tytoniu do południowo-wschodniej Azji uczestniczyli zarówno Portugalczycy, jak Holendrzy, więc rejon ten uzyskał zarówno fajkę, jak cygaro i w wielu miejscach współistnieją one nadal. Niektóre plemiona zachowują nawet pełną neutralność, zawijając tytoń w cygara, a następnie paląc je w fajkach. W Afryce, tam gdzie w walce z Portugalczykami zwyciężyli Holendrzy, w powszechnym użyciu znalazła się fajka.</p>
<p>W trakcie upowszechniania się tytoniu rozwinęły się nawet dwie nowe metody jego używania — nargile i tabaka. Nargile powstały na Bliskim Wschodzie i nigdy nie przeniknęły poza ten region. Tabaka, jak się zdaje, powstała w Hiszpanii w następstwie medycznych zastosowań tytoniu. Nie miała prototypu w Ameryce. Niektóre plemiona z Antyli i Ameryki Południowej używały tabaki, lecz nie była ona robiona z tytoniu. Z drugiej strony, w Europie używano takich lub innych rodzajów tabaki przez całe wieki. Najwidoczniej był to skutek mylnych prób pobudzenia mózgu przez kanał nosowy. Pierwszy tytoń przesłano z Portugalii do Francji w postaci tabaki, a zwyczaj zażywania tytoniu w ten sposób przyjął się na dworze francuskim i stamtąd rozpowszechnił wśród całego wytwornego towarzystwa europejskiego. Wydaje się, że w pewnym okresie stał się nawet zagrożeniem dla zwyczaju palenia w wyższych kręgach społecznych. Pod koniec osiemnastego stulecia tabaka traci swą pozycję, a teraz utrzymuje się ona jedynie na peryferiach i nawet tani jest społecznie zdegradowana.</p>
<p>Ostatni rozdział dyfuzji sposobów palenia jest wystarczająco ciekawy, by zasługiwał na specjalne uwzględnienie. Papieros, mimo iż ogólnie przyjęty na obszarze Morza Śródziemnego, nie rozpowszechnił się w północnej Europie ani w Stanach Zjednoczonych aż do czasów obecnych. W Anglii nie pojawił się przed końcem Wojny Krymskiej, kiedy to zwyczaj palenia papierosów przywieźli wracający oficerowie, którzy nauczyli się go od swych tureckich sojuszników. Do Stanów Zjednoczonych dotarł jeszcze później, za pamięci wielu osób jeszcze żyjących i napotkał tam żywiołową opozycję. Choć, jak się zdaje, nie ma żadnego dowodu, że papieros jest hardziej szkodliwy niż męska fajka kukurydziana czy tytoń do żucia (szczególny wkład amerykańskich pionierów do „kulturowego kompleksu tytoniowego&#8221;), w wielu regulaminach wciąż jeszcze można znaleźć przepisy zabraniające jego używania. Papieros uważano nie tylko za rzecz szkodliwą, lecz również za objaw zniewieściałości, a ślady tej ostatniej, postawy przetrwały do dziś. Dla stuprocentowych mężczyzn rozkoszujących się papierosem pociechą może być wiadomość, że wielu „twardych&#8221; kapłanów azteckich pozwalało sobie na jednego papierosa przed rozpoczęciem „dziennej porcji&#8221; ofiar z ludzi.</p>
<p>Na podstawie tego co powiedzieliśmy powyżej, powinno być oczywiste, że żadna prosta mechanistyczna interpretacja; dyfuzji nie wystarczy dla dokonania choćby ograniczonej rekonstrukcji historycznej. Dyfuzja wymaga nie tylko przekaziciela, lecz również odbiorcy, a rola odbiorcy jest z pewnością ważniejsza. Na przykładzie Indian kalifornijskich i ich stosunku do kukurydzy i garncarstwa widzieliśmy, że ciągła styczność z cechą kulturową nie musi pociągać za sobą jej przejęcia. W gruncie rzeczy dyfuzja obejmuje trzy dość różne procesy: przedstawienie społeczeństwu nowego elementu lub elementów kulturowych, przyjęcie go przez społeczeństwo, zespolenie przyjętego elementu lub elementów z dotychczas istniejących. Na każdy z tych procesów wpływa duża liczba czynników, z których większość ciągle wymaga zbadania.</p>
<p>Przedstawienie społeczeństwu nowego elementu zawsze zakłada styczność styczność. Społeczeństwo, z którym kontakt został nawiązany, może być bądź twórcą nowego elementu kulturowego, bądź pośrednikiem w jego rozpowszechnianiu — różnica ta nie ma większego wpływu na proces. Istota tego kontaktu ma jednak znaczenie olbrzymie. Może on przybierać najrozmaitsze formy, od bliskich związków dwu społeczeństw i kultur jako całości, aż po sporadyczne kontakty handlowe i osiedlanie się poszczególnych członków jednego społeczeństwa w innym. Kontakty pełne są zdecydowanie rzadkie. Trudno znaleźć ich przykłady, z wyjątkiem grup zdobywców, którzy osiedlają się i wyzyskują lud podbity, względnie grup emigrantów podobnych do tych, które ciągle jeszcze występuje w Amerce. Tego typu kontakty mają nieco inny charakter niż te, które występują w zwykłym procesie dyfuzji, a proces zmiany, kulturowej ,w takich warunkach określany jest zwykle terminem <em>akulturacja</em>. Oczywiście takie użycie tego terminu, który po raz pierwszy zastosowano, do badania zmian w grupach emigrantów, opiera się na dość naiwnym przekonaniu, że jedno ze społeczeństw stykających się ze sobą całkowicie, odrzuca swą poprzednią kulturę i w pełni przyjmuje kulturę tego drugiego. W rzeczywistości wynikiem takich bliskich i pełnych kontaktów zawsze jest wymiana elementów kulturowych. Po dłuższym czasie obydwa różniące się między sobą społeczeństwa i ich kultury zespolą, się, w kształt nowego społeczeństwa i nowej kultury. W tym końcowym produkcie reprezentowane będą elementy ich obydwu, choć być może w bardzo różnych proporcjach. I tak Włosi w Ameryce zwykle przestają się utożsamiać jako odrębne społeczeństwo w trzecim lub czwartym pokoleniu i przyjmują kulturę, w obrębie której żyją. Jednocześnie nie jest to ta sama kultura, z którą zetknęli się ich przodkowie po przybyciu do Ameryki. Została wzbogacana w wyniku przejęcia przez Amerykanów takich oryginalnie włoskich elementów, jak powszechne zainteresowanie wielką operą, spożywanie na obiad spaghetti oraz znakomite techniki wymuszania pieniędzy.</p>
<p>Uwzględniając cały obszar, kuli ziemskiej, ten typ kontaktu, który umożliwia akulturację, bardziej niż wskutek czegokolwiek innego powstaje na drodze podboju i osiedlenia się grup zdobywców w środowisku pokonanych. W tych przypadkach zwykła liczebna przewaga podbitych będzie prawdopodobnie w znacznej mierze zrównoważona wyższością prestiżu zdobywców, tak że obydwie, kultury mają mniej więcej równy wkład do nowej kultury, która wyłania się zawsze w tych warunkach. Takie hybrydy kulturowe przejawiają zazwyczaj cechy mieszanin chemicznych raczej niż mechanicznych. Oprócz cech zaczerpniętych z obu kultur założycielskich, posiadają one ponadto właściwości obce im obu. Musimy jednak powrócić, do powszechniejszych form kontaktu kulturowego i możliwego dzięki nim szerzenia się elementów kulturowych.</p>
<p>Jest samo przez się zrozumiałe, że kontakty miedzy kulturami nawiązane być mogą jedynie za pośrednictwem jednostek. W poprzednim rozdziale mówiliśmy, że żadna jednostka nie uczestniczy w kulturze swego własnego społeczeństwa w pełni. W normalnych warunkach oznacza to, że nigdy nie oferuje się społeczeństwu otrzymującemu pełnej kultury społeczeństwa przekazującego. Dostępne mu są jedynie te elementy, z którymi jednostki, kontaktujące się są zżyte. Jeśli zatem pomiędzy dwoma plemionami istnieją stosunki handlowe, a handel prowadzą jedynie mężczyźni, wtedy przyswojone mogą zostać, wytwory, przemysłu kobiecego, lecz nie zostaną wraz z nimi przekazane techniki wytwarzania. Mężczyźni prowadzący handel, nawet jeśli nie strzegą tych technik jako ważnych tajników handlowych mają zaledwie ogólne wyobrażenie o tym, jak te rzeczy się produkuje. Jeśli plemię otrzymujące przyzwyczaja się do używania tych produktów, a potem nagle ich dopływ zostaje odcięty, to może ono rozwinąć całkiem odmienne techniki wytwarzania artykułów ekwiwalentnych. Ciekawe mogłoby być przypuszczenie, że w ten sposób powstała skrajna, różnorodność technik wytwarzania ceramiki na obszarze Melamezji. Istnieje wiele plemion, które regularnie i używa ją wyrobów ceramicznych nie produkując ich i łatwo można sobie wyobrazić, iż grupa taka opracowuje własną metodę wytwarzania niezbędnych garnków, gdy zabraknie, normalnych źródeł ich uzyskiwania.</p>
<p>Występujący w procesie dyfuzji wskutek różnego uczestnictwa jednostek w ich własnej kulturze mechanizm różnicujący działa, równie silnie, gdy kontaktujące się jednostki z grupy przekazującej osiedlają się w grupie otrzymującej. Kupiec, misjonarz czy urzędnik administracji nie mogą przekazać ze swej kultury, więcej niż sami posiedli. Jeśli jednostka kontaktująca się jest mężczyzną, to zwykle bardzo mało może ona przekazać z kobiecej sfery, swej kultury, a kobiece elementy, które przekaże, będą prawdopodobnie nader przypadkowe i funkcjonalnie słabo ze sobą powiązane. Znałem francuskiego urzędnika, który był przedmiotem zazdrości swych kolegów, ponieważ potrafił nauczyć swą tubylczą kochankę krochmalenia i prasowania białych koszul. Znajomość tej techniki nabył przypadkowo i o innych aspektach prowadzenia domu nie wiedział więcej niż przeciętny mężczyzna. I na odwrót, jeśli jednostką kontaktującą się jest kobieta, może ona przekazać techniki kobiece, ale jest wielce nieprawdopodobne, by mogła przenieść takie czysto męskie umiejętności, jak nowe formy pracy w metalu czy nowa magia wojenna. Łatwo sobie wyobrazić sytuację, gdy skutkiem tego różnicującego mechanizmu wiele elementów z pewnych dziedzin kultury zostanie przedstawionych a nawet zaakceptowanych,-podczas gdy z innych dziedzin nie zostaną przedstawione żadne lub tylko kilka. Zatem krajowcy z wyspy, która była stałą bazą statków wielorybniczych, mogli przyswoić sobie sporo elementów kulturowych związanych z przemysłem, a nawet pewną, liczbą zwyczajów i postaw wielorybników. Mogli nauczyć się budować łodzie wielorybnicze i ubierać w europejską odzież otrzymaną od wielorybników, nie wiedząc nic o tym, że istnieją salony i jeszcze mniej o tym, jak należy się poprawnie w nich zachowywać. Przytoczmy mniej skrajny przypadek, grupa tubylców może mieć bliski kontakt z pół tuzinem misjonarzy i ich żonami, a nie zdobędzie najmniejszego pojęcia o teoriach ewolucyjnych, które tak dalece wpływają na współczesną myśl europejską, ani obecnych europejskich tendencjach mody i dekoracji wnętrz.</p>
<p>Gdy dwa społeczeństwa pozostają w długotrwałych kontaktach, jak w przypadku dwóch obok siebie żyjących plemion, i na ogół są w dobrych stosunkach, prędzej czy później całość kultury jednego z nich stanie się dostępna drugiemu. Szereg powtarzających się kontaktów z jednostkami, z których każda jest uczestnikiem częściowym, da efekt skumulowany. Z drugiej strony, gdy jedno społeczeństwo ma kontakty wyłącznie z wybranymi grupami jednostek drugiego społeczejstwa, grupa otrzymująca może nigdy nie zetknąć się z całością kultury grupy przekazującej. W dużej mierze sytuacja taka występuje na obszarach, gdzie biali zjawiają się jako kupcy lub administratorzy, lecz nigdy jako rzemieślnicy czy robotnicy.</p>
<p>Drugim czynnikiem, który wywiera silny wpływ na dyfuzję, jest coś, co z braku lepszego terminu nazwać można swoistą komunikowalnością samego elementu kulturowego. Nie ma to nic wspólnego z postawami grupy otrzymującej czy z konfiguracjami jej dotychczasowej kultury. Choć ten aspekt problemu dyfuzji nigdy nie został zbadany, wydaje się prawdopodobne, iż mamy tu do czynienia z czymś w miarę stałym. W poprzednim rozdziale wskazaliśmy, że kultura sama w sobie jest zjawiskiem socjo-psychologicznym oraz że różne formy zachowań, które jesteśmy w stanie obserwować i rejestrować, są po prostu jej zewnętrznym wyrazem. Pewne elementy kultury są łatwiej wyrażalne niż inne, bez względu na to, czy wyrażane są czynem czy słowem. Ponieważ elementy kulturowe mogą być przekazane jednej jednostce przez drugą lub jednemu społeczeństwu przez drugie jedynie dzięki obserwacji zewnętrznych wyrazów, więc wynika z tego, że najłatwiejsze do przyswojenia będą te elementy kulturowe, które mogą być najłatwiej i najpełniej wyrażone. Wśród różnych elementów, które składają się na całość kultury, pierwszeństwo pod tym względem mają techniki zdobywania pożywienia i produkcji. Można je wyjaśnić widzowi bez pośrednictwa mowy. Jeśli zechce on przyswoić sobie te techniki, wystarczy by naśladował uważnie i dokładnie ruchy pracującego. Choć z początku może mieć trudność z wykonywaniem odpowiednich ruchów, nauczy się ich poprzez praktykę. To samo dotyczy produkowanych przedmiotów. Nawet jeśli nie można obserwować techniki, członek kultury otrzymującej może dokładnie wbić sobie w pamięć szczegóły przedmiotu, a następnie postarać się je odtwo-f rzyć. Skłonność Japończyków do badania i odtwarzania importowanych przedmiotów może być właśnie takim przypadkiem.</p>
<p>Gdy tylko odejdziemy od tak prostych elementów kulturowych, jak (&#8230;) materialny, stajemy wobec rosnących trudności (&#8230;) takiego elementu kultury, jak idealny model małżeństwa, a nawet można go wyrazić w niewerbalnym zachowaniu, wyrażenie to jest daleko mniej pełne niż to, które możliwe jest w odniesieniu do takiego elementu kulturowego, jak produkcja koszy. Najdokładniejsza werbalizacja natknie się na trudności z przekazaniem ciągu skojarzeń i uwarunkowanych reakcji emocjonalnych, które wiążą się z tym wzorem i które nadają mu znaczenie i żywotność w ramach jego własnej konfiguracji kulturowej. We wszystkich zewnętrznych wyrazach takiego wzoru aspekty te są z góry założone, lecz osoba, której usiłujemy przekazać jego sens, może o nich nic nie wiedzieć. różnice językowe przestały być poważną przeszkodą w przekazaniu jego rodzaju wzorów, pomyślne przeprowadzenie takiej operacji byłobynięzmiernie trudne. W jeszcze większym stopniu dotyczy to pojęć, które stanowiąc część kultury nie są bezpośrednio wyrażalne w zachowaniu niezależnie od werbalizacji. Opowiada się anegdotę o wykształconym Japończyku, który usiłował zrozumieć naturę Trójcy i po długiej dyskusji ze swym europejskim przyjacielem zawołał: „Oh! już rozumiem. To jest komitet&#8221;. Uwaga taka jest szokująca dla dobrego chrześcijanina. Trójca z pewnością nie stanowi komitetu, lecz czytelnik zda sobie sprawę z trudności, jeśli w wyobraźni sam spróbuje wytłumaczyć temu japońskiemu studentowi, dlaczego właściwie ów jest w błędzie.</p>
<p>W końcu, mamy w kulturze wszystkie te żywotne postawy i wartości, które leżą znacznie poniżej poziomu świadomości indywidualnej i które przeciętny członek społeczeństwa rzadko próbuje werbalizować, nawet na własny użytek. Praktyczna niemożliwość udostępnienia tych elementów .członkom jakiegoś innego społeczeństwa jest oczywista. Ta część każdej kultury po prostu nie poddaje się dyfuzji. Nigdy nie może być ona przedstawiona w dostatecznie konkretnych i obiektywnych terminach. Takie sprawy, jak pojęcia religijne lub filozoficzne można w jakiś sposób zakomunikować, choć zapewne nigdy w całości. W ten sam niepewny sposób przekazać można również wzory zachowań społecznych, lecz nie można przekazać skojarzeń, które nadają im ową autentyczną siłę oddziaływania. Grupa zapożyczająca może naśladować formy zewnętrzne, lecz zazwyczaj okazuje się, że te elementy, które nie zostały jej właściwie zakomunikowane, są zastąpione elementami zupełnie nowymi. Instytucja małżeństwa, jaka istnieje wśród Murzynów na Południu, może być dobrym przykładem takiego niepełnego przekazu wzoru i wynikających stąd modyfikacji. W gruncie rzeczy prawdopodobnie techniki materialne i ich wytwory są jedynymi elementami kultury, które mogą być w pełni zakomunikowane, i znanamienne, że zazwyczaj te elementy są najłatwiej przyjmowane i zachowywane w formie najbliższej tej, w jakiej zostały przyjęte. Oczywiste, że te swoiste różnice komunikowalności muszą mieć olbrzymie znaczenie w procesie dyfuzji, szczególnie przez swój wpływ na kompletność i szybkość przekazu.</p>
<p>Do tego momentu dyskusja nasza traktowała o kulturach przekazujących i właściwościach elementów kulturowych. Przejdźmy teraz do tego, co stanowi właściwą istotę problemu dyfucji, do reakcji grupy przyjmującej na elementy jej przedstawione. Społeczeństwo posiada pełną swobodę przyjmowania Lub odrzucania tych elementów. Istnieje od tego kilka wyjątków w przypadkach, gdy grupa dominująca społecznie usiłuje narzucić siłą swą kulturę społeczeństwu poddanemu, lecz przypadki te są mniej ważne niż mogłoby się zdawać. Po pierwsze, takie dominujące grupy rzadko kiedy, o ile w ogóle, usiłuj narzucić swą kulturę jako całość. Zadowalają się narzuceniem kilku wybranych elementów, takich jak zewnętrzne przyjęcie ich religii czy zwyczaj noszenia spodni. Oczywiście, siłą nie uda się wprowadzić do innej kultury żadnego elementu, który nie jest trwale i bezpośrednio odzwierciedlony w zewnętrznym zachowaniu. Podbity lud można zmusić do regularnego uczęszczania do kościoła, może to nawet stać się nawykiem, jak coś, co nie powoduje żadnej reakcji uczuciowej, nie można jednak zmusić do emocjonalnego przyjęcia nowej wiary, nie można też powstrzymać od modlenia się do własnych bogów prywatnie i w samotności jednocześnie samo użycie siły czyni zakazane elementy rodzimej kultury symbolami buntu, co rozbudza do nich tym silniejsze przywiązanie. Pod płaszczykiem pozornej uległości grupa prześladowana może zachować swoje ideały i wartości nienaruszone l przez całe pokolenia, przekształcając i interpretując powierzchowne elementy narzuconej im kultury tak, by nie czyniły tamtym żadnej szkody.</p>
<p>Zatem, z nielicznymi wyjątkami, każdy nowy element, który społeczeństwo włącza do swojej kultury, przyjmuje z własnej woli. Akceptacją taką z kolei rządzi duża liczba zmiennych czynników. Niezmienne w tej sytuacji jest tylko to, że elementy te zawsze odbierane są naskórkowo. Społeczeństwo przejmuje jedynie te części całego kompleksu, które mogą mu być zakomunikowane po prostu i bezpośrednio. Zatem kobieta z jednego plemienia, kopiująca wzór zauważony na koszyku wykonanym przez jakieś inne plemię, postępuje tak jedynie dlatego, że przemawiają do niej jego własności estetyczne. Nie wie ona nic o symbolice wiążącej się z tym wzorem ani o tym, co oryginalni twórcy używają za jego właściwe lub niewłaściwe zastosowania. Podobnie, gdy przedstawi się jakiejś grupie nowe urządzenie, powiedzmy karabin, to przyjmie je ona lub odrzuci nie na podstawie jego powiązań i funkcji w kulturze przekazującego, lecz ze względu na możliwości wykorzystania go we własnej kulturze, co nigdy nie wykracza poza granice bezpośrednich zastosowań. Nie dostrzega się (&#8230;) w dotychczas istniejących strukturach po (&#8230;) Wątpić można, czy w ogóle jakikolwiek umysł jest zdolny przewidzieć takie zmiany — wyjąwszy najbardziej bezpośrednie. Nawet w naszej własnej kulturze nikt nie był w stanie przewidzieć głębokich zmian, jakie spowodował samochód, zmian, które głębiej nawet dotknęły nasze struktury społeczne niż ekonomiczne.</p>
<p>Czynniki decydujące o podatności społeczeństwa na nowe elementy kulturowe są, mimo wszystko, z grubsza takie same — niezależnie od tego, czy element powstaje wewnątrz czy na zewnątrz tego społeczeństwa tj., czy pojawia się jako wynalazek czy w wyniku dyfuzji. Główna różnica pomiędzy tymi dwoma procesami polega na tym, że jeśli społeczeństwo odrzuca wynalazek, to ten wkład w ogólne zasoby kultury jest na zawsze stracony, podczas gdy odrzucony element przedstawiony w procesie dyfuzji nie ginie, lecz pozostaje w skarbcu kultury przekazującej i może niespodziewanie przydać się w późniejszym okresie, gdy reakcja społeczeństwa wobec niego ulegnie zmianie.</p>
<p>Przyjęcie nowych elementów wymaga przede wszystkim spełniania przez nie dwóch warunków: użyteczności i zpodności innymi słowy przyjmowane jest to, co wydaje się dobre i łatwo dające się dopasować do istniejącej konfiguracji kulturowej. Obydwie te właściwości zależą, rzecz jasna, od kultury przyjmującej i wpływa na nie tak wiele czynników, że osoba postronna z trudem zdoła je ustalić. Gdzie indziej nadmieniliśmy, że zmiana kulturowa jest głównie sprawą zastąpienia elementów starych nowymi oraz, że każda kultura normalnie obejmuje techniki zaspokajania wszystkich uświadamianych potrzeb członków. społeczeństwa. Przyjęcie nowej cechy nie tyle zależy od tego, czy jest ona lepsza &#8216;niż już istniejąca, ile od tego, czy jest ona o tyle lepsza, by jej przyjęcie wynagradzało związany z tym kłopot. To z kolei zależy od nastawienia grupy, stopnia jej konserwatyzmu oraz od tego, ile zmian w istniejących zwyczajach pociągnie za sobą nowe urządzenie. Nawet rozpatrując najprostszą formę dyfuzji, dyfuzję urządzeń mechanicznych, nie można wyższości elementu oceniać po prostu ze względu na większą wydajność. Istnieją formy pracy przyjemne i nieprzyjemne, a nawet zmiana tak prosta, jak przejście od używania topora do siekiery przy wyrębie drzew, pociąga za sobą zmianę zwyczajów mięśniowych, która przez pewien czas jest nieprzyjemna. Na wielu terenach Oceanii krajowcy przyjmowali europejskie ostrza żelazne, które mogli następnie osadzić w rękojeści i używać tak, jak swe pierwotne topory kamienne, lecz odrzucili o wiele bardziej wydajne siekiery,. po prostu dlatego,. że nie lubili nimi pracować.</p>
<p>Podobnie rzecz się ma ze zgodnością. Przyjęcie jakiegokolwiek nowego elementu kulturowego pociąga za sobą pewne zmiany w całej konfiguracji kulturowej. Mimo że nigdy nie można przewidzieć pełnego zakresu tych zmian, niektóre z nich są zwykle oczywiste. Jesionowa cecha iegorodzaju, że przyjęcie jej spowoduje bezpośrednio konflikt z ważnymi cechami dotychczasowej kultury, to prawie na pewno zostanie ona odrzucona. Nie można sobie wyobrazić, by techniki produkcji masowej przyjęły się w kulturze, w której obowiązuje wzór niepowtarzalności. Istnieją społeczeństwa, w których sądzi się, że żadne dwie rzeczy nie powinny być takie same i nigdy nie produkuje się dwóch rzeczy dokładnie takich samych.</p>
<p>Dobry przykład takiego konfliktu stanowi reakcja Apaczów na pejotl, narkotyzujący kaktus używany przez wiele plemion indiańskich dla wywoływania wizji i przez to nawiązanie kontaktu z siłami nadprzyrodzonymi. Apacze przywiązują taką samą wagę do wizji jak każde inne plemię, lecz każda jednostka stara się chronić siłę, którą dają jej doznania nadprzyrodzone, a czarownik mógłby tę siłę ukraść. Normalny wzór zażywania pejotlu, to spożywanie go podczas grupowej uroczystości. Po próbnym i częściowym przyjęciu nowego pomysłu Apacze odrzucili go. Możliwość skradzenia siły, jaką stwarza liczne zgromadzenie, szczególnie, gdy jednostka znajduje się pod wpływem narkotyku, a więc przestaje mieć się na baczności, stanowiły zbyt duże niebezpieczeństwo. Uznano za bardziej prawdopodobne utratę siły niż jej zyskanie. W rezultacie używanie pejotlu w tym plemieniu stało się rzadkością, a nawet, w tych nielicznych przypadkach ograniczyło się do mężczyzn nie mających żadnego znaczenia, którzy mają mało siły do stracenia.</p>
<p>Większość konfliktów między elementami nowymi a uprzednia istniejący mi nie jest tak bezpośrednia i oczywista. Zarówno w kwestiach zgodności, jak i użyteczności istnieje szeroka sfera niepewności. Niektóre nowee elementy uważać można nieznacznie przewyższające dotychczasowe, inne &#8211; postrzegać jako trochę niezgodne, lecz nie na tyle, by ich przyjęcie było niemożliwe. Bardzo często korzyści i niedogodności wyrównują się tak dalece, że jednym członkom społeczeństwa przyjęcie nowej cechy może wydawać się pożądane, innym natomiast — niepożądane. Przyjęcie lub odrzucenie tego rodzaju niejednoznacznych elementów zależy ostatecznie od szeregu zmiennych czynników, o których bardzo mało wiemy. Jednym z najważniejszych są z pewnością partykularne interesy, dominujące w życiu grupy przyjmującej. Nowa cecha, która odpowiada takim interesom, zostanie bardziej poważnie potraktowana i ma większe szansę, by zostać przyjęta, niż taka, która im nie odpowiada. Niewielki, lecz zgodny z interesami zysk wydaje się ważniejszy niż duży, lecz dotyczący spraw, którymi grupa jest mało zainteresowana. Na przykład Hindusi zawsze byli bardzo podatni na nowe kulty i nowe idee filozoficzne, dopóki nie popadały one w zbyt bezpośredni konflikt z istniejącymi wzorami, lecz całkowitą prawie obojętność wykazywali wobec usprawnień technik produkcji. Świat materialny uważano za zbyt mało ważny, by traktować drobne postępy w t j dziedzinie za godne kłopotów związanych ze zmianą przyjętych zwyczajów.</p>
<p>Oprócz interesów grupy otrzymującej istnieją jeszcze inne czynniki i oceny, które pomagają rozważyć wszystkie za i przeciw nowemu elementowi kulturowemu. Jednym z najważniejszych jest prestiż grupy przekazującej. Istnieją różne stopnie i rodzaje prestiżu. Można natknąć się na społeczeństwo, które ma autentyczny kompleks niższości wobec innego elementy społeczeństwa podziwianego uważa za doskonalsze od odpowiednich elementów własnej kultury. Grupa taka wszystko, co będzie w stanie, zapożyczy od swego ideału. Przykładem tego może być bezkrytyczne przyjmowanie elementów kultury europejskiej przez Japończyków w drugiej połowie dziewiętnastego stulecia. Postawa taka prowadzi zazwyczaj bądź do całkowitego rozczarowania, bądź do zaniku społeczeństwa zapożyczającego jako odrębnego tworu kulturowego.</p>
<p>Jest to sytuacja niezwykła. Prestiż przekazującego zwykle ma o wiele bardziej ograniczony charakter, związany z pewnymi tylko aspektami kultury. Przeciętne społeczeństwo przekonane, jest o swojej wyższości w stosunku do reszty rodzaju ludzkiego, zarazem jednak przyznaje, że niektóre społeczeństwa przewyższają je pod pewnymi względami. I tak, mimo iż Amerykanie odnoszą się do całości kultury francuskiej z pewną protekcjonalnością, to jednak niemal powszechnie podzielane jest przekonanie, że Francuzi przewyższają nas w projektowaniu ubiorów damskich. Gdyby poprosić Amerykankę o dokonanie wyboru między modelem z Paryża a modelem z Chicago, to przekonanie to okazałoby się dostatecznie silne, by wybrała zdecydowanie model paryski. I odwrotnie, fason który byłby reklamowany jako niemiecki, zyskałby jeszcze mniejsze uznanie niż chicagowski, bowiem przekonani jesteśmy, że projektowanie ubiorów nie należy do największych osiągnięć Niemców. Innymi słowy, przyjmowanie fasonów paryskich w Ameryce wspomaga prestiż Francuzów, podczas gdy fasony berlińskie wobec &#8216;braku prestiżu przyjmują się z oporami. Nawet w społeczeństwach pierwotnych pewne plemiona sąsiednie podziwia się pod pewnymi względami, innymi się natomiast pogardza. Każda cecha, którą reprezentuje podziwiany, będzie przynajmniej poważnie wzięta pod uwagę, podczas gdy ta, która jest właściwością pogardzanego, musi dawać wyraźne korzyści, by zyskać względy.</p>
<p>Dalszym czynnikiem, który wpływa na przyjęcie nowych elementów kulturSwyi-h, JesTTprestiż jednostek, pod których auspicjami nowa rzecz jest społeczeństwu przedstawiona. W przypadku dyfuzji, tak jak w przypadku wynalazku, przyjęcie nowej cechy zaczyna się zwykle od jednostki, a najczęściej od małej grupy osób. Nie jest wszystko jedno, kim są ci wynalazcy. Jeśli są to osoby, które społeczeństwo podziwia i które przyzwyczajone jest naśladować, to nowa cecha zostaje przyjęta bez oporów.</p>
<p>Jeśli zdarza się, że wynalazcy są osobiście niepopularni lub mają niski status społeczny, to nowy element natychmiast narzuca niepochlebne skojarzenia, które mogą przeciwważyó wszelkie jego istotne korzyści. W naszym społeczeństwie, na przykład, nikt nie będzie próbował lansować jakiegoś nowego i śmiałego fasonu poprzez sklepy z tanią odzieżą. Nie przyjąłby się on nawet wśród tych grup społecznych, które korzystają z tych sklepów, gdyż noszenie tego fasonu ś&#8221;wiadczyłoby o statusie społecznym, którym jego posiadacze nie są zachwyceni. Ten. sam styl lansowany w imieniu najwyższych szczebli&#8217;drabiny społecznej, do jakich jego projektanci mogli dotrzeć, zostałby chętnie przyjęty przez klientów sklepów tanich.</p>
<p>W końcu istnieje czynnik który określić można jedynie jako „szał&#8221;. Zauważono, że ludzie chętnie przyjmują pewne nowe elementy kulturowe, choć nie wyróżniają ich żadne względy użyteczności czy prestiżu. Mało jest prawdopodobne, by w ten sposób wprowadzono do kultury elementy zasadnicze, ale może tak być z szeregiem pomniejszych. Sami byliśmy świadkami pojawienia się i zaniku takich pomysłów jak zegarek zapinany wokół kostki na nodze, opalanie się w inicjały itp. Zjawisko to, co więcej, bynajmniej nie ogranicza się do cywilizacji schyłkowych. Plemiona pierwotne również przeżywają zmiany mody oraz zapożyczają w gruncie rzeczy bezużyteczne elementy kulturowe, którym udało się opanować ich wyobraźnię. Na przykład wśród Barów z Madagaskaru w ostatnich dwudziestu latach zapanowała moda na fantazyjne fryzury męskie, choć przedtem czesano się w tym plemieniu w sposób dość prosty i jednolity. Mówi się, że styl ów powstanie swe zawdzięcza przedsiębiorczemu fryzjerowi z plemienia Imerina, który osiedlił się na terytorium Bara i szukał ujścia dla swegp zawodowego talentu. Młodzi ludzie, którzy przyjęli tę modę, byli z początku bezlitośnie wyśmiewani, lecz raz zrobiona — fryzura ta zachowała swą trwałość, mieli zatem istotne powody, by pozyskiwać dla swego pomysłu innych. Z początku bezużyteczna i ciesząca się złą reputacją, stała się teraz solidnie ustabilizowanym fragmentem kultury Barów.</p>
<p>Wszystko to wskazuje na dużą liczbę zmiennych czynników, związanych z przedstawianiem i przyjmowaniem nowych elementów kulturowych. Dopóki nie dowiemy się więcej o działaniu tych czynników,, nasze rozumienie procesu dyfuzji może być jedynie bardzo niedoskonałe. Ostatnie ogniwo tego procesu— zmiany i przystosowania nieuchronnie następujące po przyjęciu nowej cechy omówione będą w następnym rozdziale.</p>
]]></content:encoded>
			<wfw:commentRss>http://www.jasinski.us/2005/12/ralph-linton-dyfuzja/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
	</channel>
</rss>
