Ein theoretischer Integrationsversuch
(29 Dezember 1996)
ZWEITES KAPITEL
DIE KOMPLEXE MEHREBENENSTRUKTUR
KOLLOKALER INTERAKTIONE
2.2 Vier komplementäre Ebenen
sinnhafter Kommunikation
2.2.1 Zur Hierarchie der vier Kommunikationsebenen
Nichts wäre verfehlter als das reduktionistische Vorurteil, dass man
bei der Analyse kollokaler Sozialbeziehungen gewissermassen auf die
einfachsten Elementarbausteine der sozialen Welt stossen könnte, aus
deren Kombinationen und Abwandlungen dann alle die komplexeren
Erscheinungen (Gruppen, Organisationen, Institutionen, Gesellschaften)
konstruierbar seien. Vielmehr findet man gerade in dieser urtümlichsten
und alltäglichsten, universellsten und voraussetzungslosesten Sphäre
menschlicher Sozialität besonders vielschichtige strukturelle
Aufbauprinzipien vor: weil die verschiedenen Ebenen physischer,
senso-motorischer, sinnhafter und sprachlicher Wechselwirkungen weniger
als anderswo voneinander ausdifferenziert und verselbständigt sind,
sondern sich auf diffuse Weise wechselseitig durchdringen.
Konkret bedeutet dies, dass sich die sinnhaften und kommunikativen
Verhältnisse anwesender Personen niemals nur im Austausch intentionaler
Handlungen oder Sprechakte erschöpfen: weil jede in der Lage ist, auch
die physische Körperlichkeit, die biologischen Bedürfnisse oder die
unwillkürlichen senso-motorischen Verhaltensweisen der anderen sinnhaft
zu erleben und sprachlich zu thematisieren. Und weil jeder Teilnehmer
weiss, dass dies wechselseitig geschieht, werden alle versuchen, durch
selektive Manipulation ihrer rein physischen Kundgaben auf ihre Partner
gewisse Wirkungen zu erzielen und ihnen bestimmte Mitteilungen zukommen zu
lassen, welche die Kommunikationen auf höheren Ebenen teils
unterstützen, teils abschwächen oder gar konterkarieren.
Charakteristisch für Kollokalität ist deshalb, dass gleichzeitig
mehrere, völlig verschiedenartige Trägermedien für teils intentional
gesendete, teils unabsichtlich emittierte, immer aber sinnhaft
dekodierbare Kundgaben zur Verfügung stehen. Im Sinne der vorhin (vgl.
2.1) explizierten theoretischen Prinzipien ist ihr Verhältnis zueinander
derart, dass jedes niedrigere Medium als notwendige Ausgangsbasis für
alle "höheren" fungiert, und dass mit zunehmender
"Höhe" des benutzten Kanals
- immer komplexere und variablere Botschaften gesendet werden
können,
- die Enkodierungs- und Dekodierungsprozesse besser kontrollierbar und
intentional gestaltbar werden,
- die "Temporalisierung" zunimmt: so dass
Übermittlungsprozesse mehr Zeit beanspruchen und dem
Selektivitätsdruck der Zeitknappheit unterliegen.
Im Minimum ist es notwendig, die folgenden vier Niveaus sinnhaften
Ausdruckhandelns und Erlebens voneinander zu unterscheiden, die für den
soziologischen Beobachter in Termini relativ objektiver
Unterscheidungsmerkmale identifizierbar sind und aus demselben Grund auch
von den sozialen Akteuren selbst als voneinander differenzierte Ebenen
interpersoneller Erfahrung wahrgenommen werden:
- "Anwesenheit": Das wechselseitig evidente Faktum
des räumlichen Hierseins einer Person in ihrer physischen
Körperlichkeit ist der generellste, fundamentalste Ausgangspunkt für
alle spezifischere interpersonelle Erfahrung, Interaktion oder
Kommunikation. Als undifferenziertestes individuelles
"Basisverhalten" ist der Ausdruckswert schieren
Anwesendseins normalerweise derart gering, dass der "subjektive
Sinn", den der Anwesende damit verbindet, meist nur in einem
grösseren Horizont von Situationsbedingungen und
Verhaltenserwartungen. erschlossen werden kann.
- "Persönliche Erscheinung": Sie umfasst alle an der
physischen Körperlichkeit festgemachten, zumindest im aktuellen
Interaktionskontext relativ invarianten Merkmale (Hautfarbe,
Geschlecht, Gesichtszüge, Haltung, Frisur, Kleidung u.a.), mit denen
ein Individuum den Mitanwesenden ein teils absichtlich manipuliertes,
teils nicht manipulierbares Simultanbild seiner Persönlichkeit
vermittelt. Setzt sie einerseits "Anwesenheit" voraus, so
fungiert sie selber wieder als der Boden, aus dem alle variableren
Kundgaben (Gestik, Sprechakte) herauswachsen und ihre spezifische
Deutung gewinnen.
- "Gestik": bildet den zusammenfassenden Ausdruck
für alle variablen Verhaltenskundgaben, wie sie einerseits bei
intentionalen Akten nichtverbaler Kommunikation, andererseits aber
genauso als unbeabsichtigte Begleiterscheinungen senso-motorischer
Abläufe oder Handlungsvorgänge auftreten und dank ihrer objektiven
Wahrnehmbarkeit als Symptome für innere Gefühlszustände,
Motivationen, Fähigkeiten oder Absichten eines andern Subjekts
fungieren.
- "Sprache": umfasst die Gesamtheit akustischer
Äusserungen, die im Medium eines konventionellen Codes der Laut-,
Wort- und Satzbildung enkodiert sind und durch Benutzung desselben
Codes dekodiert werden müssen. Es ist die Kommunikationsebene mit der
höchsten Kapazität für intentionale Steuerung und mit dem grössten
Reichtum an inhaltlichen Spezifizierungen, aber andererseits auch mit
den restriktivsten Anforderungen an sachliche Selektivität, soziale
Kontrolle und zeitliche Sequentialisierung.
In der Terminologie von Ruesch/Kees wären "Anwesenheit" und
"persönliche Erscheinung" dem Niveau der "object language"
(zu der auch Wohnungseinrichtungen, Schmuckstücke und andere
Ausdrucksgegenstände gehören) zuzurechnen, während der Begriff der
"Gestik" weit genug gespannt sein soll, um alle mit dem Konzept
der "action language" bezeichneten kommunikativen
Verhaltensäusserungen zu umfassen. Die verbale Kommunikationsebene
schliesslich koinzidiert mit dem Niveau der "sign language", die
alle durch konventionell festgelegte Symbole konstituierten
Sinnbedeutungen umfasst (vgl. Ruesch/Kees 1956; Kendon 1981: 5gff).
Vom kollokalen Sozialsystem aus gesehen bilden die beiden unteren
Ebenen ("Anwesenheit" und "äussere Erscheinung") dank
ihrer geringen Variabilität und Differenzierbarkeit in erster Linie
Quellen systemischer Integration und Grundlagen struktureller
Stabilisierung. Die beiden "höheren" Ebenen dagegen sind genau
konträr dazu Quellen der Differenzierung und der prozessualen Dynamik,
mit deren Hilfe sich das Sozialsystem zur Umwelt hin öffnen und seine
inneren Zustände in dauernder Bewegung halten kann. Diese potenzierte
Spannweite zwischen stabilen und labilen, strukturellen und prozessualen,
integrativen und adaptiven Systemkomponenten ist wahrscheinlich der
entscheidende Vorzug kollokaler Sozialsysteme, aus dem sich ihr
universelles Vorkommen und ihre funktionale Unentbehrlichkeit (selbst in
ausgeprägt alokalen oder translokalen Systembildungen (vgl. Kap. 1)
erklärt.
2.2.2. "Anwesenheit"
Viele soziale Systeme stützen sich auf irgendein materielles
Trägermedium ab, um zumindest ihrer Existenz, meist aber auch ihrer
Reichweite und besonderen Identität, einen objektiv sichtbaren, für
Mitglieder und Aussenstehende gleichermassen evidenten Ausdruck zu
verleihen.
So erhalten Staaten durch ihr Territorium, Kirchen durch ihre
Gotteshäuser, Städte durch ihre architektonische "sky line",
Familienhaushalte durch ihr Eigenheim, transitorische
"Miteinanders" durch gemeinsam in Beschlag genommene Tische,
Bänke u.a. ihre Verankerung in der physischen Welt: also durch
Inanspruchnahme materieller Substrate, die praktisch voraussetzungslos
(d.h. ohne besondere Qualifikationen und Aktivitäten seitens der
Emittenten und Rezipienten) wahrnehmbar sind, im Zeitablauf invariant
bleiben und unabhängig vom Wechsel der beteiligten Personen und von
Wandlungen sozialer Strukturen und kultureller Muster dieselbe Bedeutung
und Integrationskraft beibehalten (vgl. z.B. Simmel, 1908a: 474).
Mit diesem Höchstmass an zeitlicher, sozialer und sachlicher
Generalisierung unterscheiden sich physische Substrate von symbolischen
Trägermedien, die immer nur in Termini spezifischer Inhalte konstituiert
sind und die Identität des Sozialsystems deshalb untrennbar an die
Aufrechterhaltung besonderer Fixierungen (Normen, Zielsetzungen,
Wertorientierungen u.a.) binden.
Beispiele dafür wären Schriftdokumente (Verfassungen, Statuten,
"charters" u.a.), durch die formale Organisationen eine von
physischen Bindungen zwar unabhängige, dafür aber inhaltlich festgelegte
und den strukturellen und kulturellen Variationsspielraum einengende
Identität zugewiesen erhalten, oder konsensuale subjektive
Identifikationen (z.B. über gemeinsame Zugehörigkeit zu politischen
Gesinnungsgruppen, Nationalitäten, Klassen, sozialen Bewegungen u.a.) die
immer von labilen innerpsychischen Vorgängen abhängig bleiben.
Dementsprechend sind vor allem jene Sozialsysteme auf physische Substrate
als Garanten ihrer Identität angewiesen, die infolge hoher Fluktuationen
und Unberechenbarkeiten ihrer Umwelten und/oder Binnenverhältnisse
gezwungen sind, ihre Existenz auf einer von konkreten Werten, Zwecken,
Handlungsweisen oder Organisationsformen unabhängigen Grundlage
festzumachen: z.B. stationäre Lebensgemeinschaften oder
Siedlungsagglomerate (Dörfer und Städte), denen die Dauerhaftigkeit und
sinnliche Prägnanz ihrer architektonischen Strukturen dazu verhilft, ihre
Identität über beliebig wechselnde Mitgliederzusammensetzungen,
Zwecksetzungen, Interaktionsprozesse, Konfliktsituationen oder politische
Machtverhältnisse hinweg aufrechtzuerhalten.
Die folgenreiche Besonderheit kollokaler Sozialsysteme besteht nun
darin, dass sie konkrete, körperlich anwesende menschliche Personen als
ihr basales physisches Trägermedium benutzen: so dass sie einerseits von
andern physischen Medien (Territorien, Gebäuden u.a.) und andererseits
von symbolisch-kulturellen Identitätsträgern (Zielsetzungen, Ideologien
u.a.) relativ unabhängig werden.
Zwar trifft es nicht nur manchmal, sondern im typischen Normalfalle zu,
dass "Anwesenheit" mit andern konstituierenden Medien sozialer
Zugehörigkeit koinzidiert: z.B. wenn formale Mitglieder derselben
Organisation im vorbestimmten Büroraum miteinander regelmässig
kooperieren, Familienmitglieder am gemeinsamen Wohnsitz miteinander
interagieren, oder wenn sich freiwillige Anhänger einer sozialen Bewegung
zur gemeinsamen Kundgebung treffen. In allen diesen Fällen aber gilt,
dass das wechselseitig konstatierte Faktum, physisch im selben Raum
anwesend und deshalb kommunikativ erreichbar zu sein, als notwendige
Ausgangsbasis für jeder kollokale Systembildung fungiert, oder vielleicht
besser: dass erst dadurch jene niedrigste, undifferenzierteste,
evidenteste, konsensualste und generellste Ebene der Assoziierung
konstituiert ist, an der selektivere und variablere Sozialbeziehungen erst
anknüpfen können.
Auf Grund der Tatsache, dass auch menschliche Personen physische
Objekte sind, sind einige funktionale Korrelate von
"Anwesenheit" durchaus mit den Eigenschaften anderer physischer
Substrate der sozialen Systembildung identisch:
Erstens bildet das körperliche Hiersein ein Faktum
von unübertrefflicher Objektivität: Alle Beteiligten können praktisch
voraussetzungsfrei und völlig evidenterweise zum gemeinsamen Schluss
gelangen, dass sie selbst und die andern anwesend sind, und alle wissen
zweifelsfrei, dass alle anderen dies zweifelsfrei wissen.
Zweitens sind alle Individuen unter dem Gesichtspunkt
ihrer Anwesenheit betrachtet auf fundamentale Weise gleich, denn jeder
Mensch ist allein dadurch, dass er existiert, mit einer Vielzahl von
identischen physikalischen und biologischen Körpereigenschaften
ausgestattet und trägt diese Körperlichkeit als sein invariantestes,
unmanipulierbarstes, nur durch seinen Tod eliminierbares Merkmal mit sich
herum. Trotz kontinuierlicher Variabilität räumlicher Distanzen findet
auf "natürliche" Weise eine relativ scharfe taxonomische
Differenzierung der Menschheit in "Anwesende" und in
"Abwesende" statt: eine Dichotomisierung, die z.B. von formalen
Organisationen mit ihrer Unterscheidung zwischen "Mitgliedern"
und "Nicht-Mitgliedern" auf viel anspruchsvollere Weise
artifiziell hergestellt und mit Hilfe spezieller Arrangements
(Eintrittsprozeduren, Registrationen u.a.) aufrechterhalten werden muss.
Im gemeinsamen Gegensatz dazu stehen all jene nicht-kollokalen informellen
Kollektive, die variable Ausprägungen subjektiv empfundener und
intersubjektiv anerkannter "Zugehörigkeit" erlauben
(Gesinnungsgruppen, soziale Schichten, Parteisympathisanten u.s.w.)
zulassen und dementsprechend nicht in der Lage sind, ihre Grenzen autonom
zu definieren.
Drittens stellt "Anwesenheit" stellt eine für
sich ausdifferenzierbare, völlig inhaltsfrei konstituierte
Rahmenbedingung für soziale Interaktion und Strukturbildung dar, dank der
Kollokalsysteme eine jenseits aller spezifischen Themen, Zielsetzungen,
Aktivitäten u.a. stabilisierbare, "infrastrukturelle"
Integrationsbasis erhalten. Daraus beziehen sie eine potentiell
unbegrenzte, z.B. in Beziehungen lebenslanger Partnerschaft oder
Hausgemeinschaft arg strapazierte Elastizität.
Demgegenüber sind translokale Beziehungen (z.B. via Telephon oder
Briefwechsel) dadurch ausgezeichnet sind, dass sie ohne diese
generalisierte Basisebene immer gleich auf dem Niveau inhaltlich
spezifischer symbolischer Kommunikation einsetzen müssen.
Insofern nun aber die physischen Objekte menschliche Personen sind, sind
mit "Anwesenheit" als Strukturbildungsprinzip andererseits
einige Schranken und Risiken verbunden, die es als universelles Medium der
Systemintegration - im Vergleich zu Territorien oder Gebäuden - weniger
geeignet machen:
- Die soziale Generalisierbarkeit ist gering, weil es häufig nicht
substituierbare partikuläre Personen sind, deren Anwesenheit die
besondere Identität des jeweiligen Sozialsystems garantiert.
- Die zeitliche Generalisierbarkeit ist beschränkt, weil jedes
Mitglied durch Wegbleiben oder Weggehen jederzeit die Möglichkeit
hat, die Struktur des Sozialsystems zu modifizieren oder gar seine
Auflösung herbeizuführen.
Zu einer Quelle der Unsicherheit und Systemgefährdung wird die
"Anwesenheit" vor allem in dem Masse, als sie als eine
absichtliche Handlung aufgefasst wird, die in einem Horizont verschiedener
Alternativen ausgewählt wurde und durch freien Willen diskontinuiert
werden kann (bzw. könnte). Genau im selben Masse wird die
"Anwesenheit" andererseits aber auch zu einer kommunikativen
Kundgabe, die sich zum Ausdruck bestimmter - allerdings diffus bleibender
und ungerichtet emittierter - Mitteilungsakte eignet.
Der Handlungscharakter von Anwesenheiten ist nun aber äusserst
variabel und kann überdies leicht strittig und unentscheidbar bleiben,
weil die selbstreferentiellen Auffassungen des Akteurs mit den
Perspektiven seiner Interaktionspartner (und diese wiederum mit den
Deutungen externer, z.B. sozialwissenschaftlicher, Beobachter) -
keineswegs übereinzustimmen brauchen.
So wird dem Kleinkind der Aufenthalt in seiner Familie kaum als
freiwillige, kontingente Handlung zugerechnet werden; und mein zufälliger
Kabinengenosse auf der Schiffsreise ist höchstens insofern
"freiwillig" in meiner Nähe, als er es unterlassen hat, aus
Abneigung gegen mich um eine andere Koje nachzusuchen.
Unstrittigen Handlungscharakter aber haben jene Anwesenheiten, die auf
expliziten vorgängigen Vereinbarungen beruhen (Besuche, Rendez-vous,
Vertragsgespräche u.a.), und/oder zu deren Zustandekommen besondere
Ortsveränderungen (Reisen u.a.) notwendig waren.
Physische Anwesenheit wird rasch zu einem knappen Gut, wenn Individuen
wegen vielseitiger sozialer Inanspruchnahmen, Rollenverpflichtungen und
Mitgliedschaften genötigt sind, sich simultan oder in rascher Folge an
verschiedenen Orten aufzuhalten.
In dem Masse, wie diese Verknappung nicht durch intensivere
Lokomotionen (z.B. durch schnelle Autofahrten, Flugreisen u.a.) gemildert
werden kann, muss sie durch eine verstärkte Selektivität in der Auswahl
der Örtlichkeiten und/oder eine intensivere Ökonomisierung des
Zeitbudgets bewältigt werden: so dass räumliche Aufenthalte zunehmend
den Charakter intentionaler, kontingenter Entscheidungshandlungen
gewinnen.
So müssen moderne Individuen mit wachsender Differenzierung ihres
Rollensets immer mehr mit der Tatsache zurechtkommen, dass ihnen sowohl
die Orte ihrer An- und Abwesenheit wie die jedem Aufenthalt gewidmeten
Zeitspannen als absichtsvolle, häufig gar begründungsbedürftige
Handlungen zugerechnet werden.
Das "Anwesenheitsmanagement" wird vor allem für
vielbeschäftigte Elitepersonen (bzw. ihre agendaführenden
Sekretärinnen) zu einem ständig akuten Problem: aber auch zur
permanenten Chance, allein durch den Akt ihres Erscheinens,
Nichterscheinens oder Weggehens an bestimmten Orten und zu gewissen Zeiten
Ausdruckshandlungen mit klar verständlichem Symbolgehalt zu vollziehen.
So kann ein Generaldirektor allein durch häufiges Herumgehen im Betrieb
sein generelles Interesse für die Belegschaft und die konkreten
Fabrikationsabläufe so überzeugend bekunden, dass seine spezifischen
Aeusserungen während des Umgangs (Fragen, Aufmunterungen, Lobzuweisungen
u.a.) vergleichsweise zweitrangig sind; und jeder Minister kann durch die
Wahl der von ihm besuchten Verbandstagungen, Messeeröffnungen u.a.
politische Bewertungen ausdrücken und Signale setzen, die weitherum
verstanden werden. Umgekehrt können "graue Eminenzen" auf den
Verlauf formeller Entscheidungsprozesse in dem Masse Einfluss nehmen, als
man ihre Abwesenheit als kontingent ansieht und jederzeit damit gerechnet
werden muss, dass sie bei einem für sie ungünstigen Verlauf der Dinge
"persönlich intervenieren".
In hochdifferenzierten urbanen Gesellschaften wird praktisch jedermann
dazu neigen, seine An- und Abwesenheiten nicht nur auf Grund seiner
subjektiven Präferenzen, sondern auch unter dem Gesichtspunkt
festzulegen, welche kommunikativen Kundgaben darin mitimpliziert sind und
wie andere voraussichtlich darauf reagieren.
Jeder Student kann seinem Professor allein durch regelmässigen Besuch
der Vorlesung auffälliges Interesse bekunden, weil diese dauernde
Anwesenheit angesichts der Vielfalt alternativer Studienbeschäftigungen
nicht selbstverständlich ist; durch dauernde Tagespräsenz im Haushalt
drückt eine moderne, von Emanzipationsideen durchdrungene Ehefrau
unweigerlich aus, dass sie im Interesse ihrer Familie bereit ist, auf eine
Berufsarbeit zu verzichten; und jedermann kann durch Pünktlichkeit seine
Treffpartner davon überzeugen, dass er die Zusammenkunft für hinreichend
wichtig ansieht und dass er über genügend Selbstdisziplin verfügt, um
diese Bewertung in seinem Verhalten zum Ausdruck zu bringen.
Der Ausdruckswert von Anwesenheit kann artifiziell gesteigert werden,
wenn es gelingt, andere von der Vielfältigkeit konkurrierender
Einladungen und Anwesenheitspflichten etc. zu überzeugen: so dass z.B.
das Erscheinen zu einer Einladung selbst dann als Kundgabe besonderen
Interesses und Wohlwollens für den Gastgeber erscheint, wenn man beim
besten Willen nicht wusste, wie man den freien Abend sonst hätte
gestalten sollen.
So mögen hochrangige Personen sich zum Teil deshalb als
vielbeschäftigt, ja "chronisch überlastet" darstellen, weil
dieser Mythos ihnen die willkommene Möglichkeit gibt, nicht nur alle
Abwesenheiten zu entschuldigen, sondern jede Anwesenheit als einen höchst
selektiven Akt darzustellen, der z.B. einen besonderen Respekt gegenüber
einer Person oder ein überdurchschnittliches Interesse für eine
Veranstaltung bekundet. Wer nicht durch den anspruchslosen Akt des blossen
"Hierseins" in der Lage ist, hinlänglich deutliche und
verständliche Mitteilungen auszudrücken, sieht sich stärker damit
belastet, die ungleich anstrengenderen Ausdrucksebenen der
"persönlichen Erscheinung", des Verhaltens oder des Gesprächs
als Trägermedien intentionaler Kundgaben zu benutzen.
Die fundamentale Bedeutung "gemeinsamer Anwesenheit" für die
Basisintegration sozialer Systeme entsteht aus der doppelten Tatsache,
dass die "Befindlichkeit im selben Raumabschnitt"
- eine elementare Basishandlung darstellt, die von allen
Individuen mit normaler motorischer Leistungsfähigkeit praktisch
voraussetzungslos erbracht werden kann und die zu ihrer Kontinuierung
keine besonderen Fähigkeiten oder Anstrengungen erfordert;
- ein der physischen Umwelt zugehöriges objektives Faktum darstellt,
das vom Subjekt selbst, seinen Partnern und Beobachtern (normale
sensorische Leistungsfähigkeit vorausgesetzt) praktisch
voraussetzungslos und auf völlig evidente Weise konsensual
wahrgenommen werden kann.
Die anspruchslose Erzeugbarkeit (a) des räumlichen
Beisammenseins hat zur Folge, dass "gemeinsame Anwesenheit" als
höchst unselektives und extensives Medium sozialer Kollektivierung
wirksam sein kann: weil sich hier unterschiedlichste Individuen im Vollzug
einer völlig identischen "Basishandlung" zusammenfinden, die
nur im quantitativen Aspekt ihrer zeitlichen Erstreckung variiert werden
kann, sich aber sonst in jeder qualitativen Hinsicht als völlig
undifferenzierbar erweist. So können manche sozialen Bewegungen oft nur
dadurch eine eindrucksvolle Grösse und innere Geschlossenheit
demonstrieren, dass sie die Handlungserfordernisse der Teilnehmer streng
auf reine Anwesenheiten (z.B. an Demonstrationen, Sternmärschen,
Versammlungen, Mahnwachen u.a.) beschränken. Denn sobald darüber hinaus
ein spezifischeres und variableres Verhalten gefordert wird, werden die
vielfältigen Unterschiede in der Motivation, Qualifikation und bei
normativen Orientierungen oder Zielsetzungen verschiedener Teilnehmer
deutlich: so dass das Kollektiv schrumpft, in verschiedene Teile
auseinanderbricht oder sich intern in Subgruppen mit unterschiedlichen
Zielsetzungen und Aktivitätsformen fragmentiert.
Die anspruchslose Wahrnehmbarkeit (b) gemeinsamer
räumlicher Präsenz bedeutet vor allem, dass
"Anwesenheitskontrolle" die verbreitetste, weil mit geringstem
Aufwand an individueller Aktivität und sozialer Organisation
praktizierbare, Form sozialer Kontrolle darstellt, die ganz besonders in
den folgenden zwei Fällen in den Vordergrund tritt:
- in mangelhaft organisierten, intern wenig differenzierten sozialen
Kollektiven: z.B. in informellen sozialen Bewegungen und
Gesinnungsgruppen, wo die Tatsache, Häufigkeit und Länge der
Anwesenheit (an Veranstaltungen u.a.) als einziges Kriterium für die
faktische Zugehörigkeit und für den Intensitätsgrad der Teilnahme
fungiert;
- in Organisationen, die aus sachlichen Gründen über keine
operationalen Massstäbe des Verhaltens oder seiner Ergebnisse
verfügen: z.B. in öffentlichen Verwaltungen, wo die
Anwesenheitskontrolle als Substitut für Leistungsmessungen oder
Erfolgsbewertungen Verwendung findet.
Diese Gewinne an Objektivierbarkeit und Quantifizierbarkeit werden aber
dadurch teuer bezahlt, dass sich aus dem undifferenzierbaren Faktum
physischer Anwesenheit kaum gültige Schlüsse auf intraindividuelle
Merkmale (Motivationen, Qualifikationen, Verhaltensneigungen u.a.) oder
auf die Qualität interpersoneller Beziehungen gewinnen lassen. Denn
genauso wie die Teilnahme an einer Beerdigungszeremonie nicht als
hinreichender Beweis für innige gefühlsmässige Anteilnahme gewertet
werden kann, darf aus der überdurchschnittlichen wöchentlichen
Aufenthaltsdauer im Amtsbüro nicht zwingend auf eine überragende
berufliche Leistungskraft geschlossen werden: und manch regelmässiges
Erscheinen an Sitzungen mag allein dadurch motiviert sein, auf möglichst
arbeitssparende Weise ein möglichst sichtbares Zeichen von Interesse,
Zuverlässigkeit u.a. zu setzen.
Bei länger andauernder gemeinsamer Anwesenheit werden schliesslich
zusätzliche Quellen sozialer Systemstabilisierung erschliessbar, die mit
den regelhaften, berechenbaren physiologischen Funktionsweisen
menschlicher Organismen zusammenhängen.
So braucht man höchstens drei bis vier Stunden in einer kleinen Gruppe
zusammenzusitzen, bis die gemeinsame Einnahme einer Mahlzeit zu einem
allerseits konsensfähigen, weil durch ununterdrückbare Hungergefühle
gestützten, Anliegen wird: ein Unterfangen, über dessen Wünschbarkeit
die Partner ungeachtet ihrer übrigen Meinungsdifferenzen und Konflikte in
erlösender Gemeinsamkeit der Bedürfnisse miteinander konvergieren, und
bei dem sie eine neue Ausgangsplattform für expressive und
sozio-emotional motivierte soziale Interaktions- und
Verständigungsprozesse (im Medium der "Geselligkeit") finden.
Ähnlich erklärt sich der hohe Routinisierungsgrad der meisten
kommunalen Verwaltungstätigkeiten und Dienstleistungen hinreichend aus
der einfachen Tatsache, dass mit dem andauernden Zusammenwohnen
zahlreicher Einzelpersonen und Familien viele äusserst berechenbare
Bedürfnisse und Ansprüche (nach Frischwasserangebot,
Elektrizitätsversorgung, Abwasserkanalisation, Schneereinigung u.a.)
erwachsen, für deren Erfüllung ebenso stabile, standardisierbare
Verfahrensweisen, Organisationsstrukturen und Technologien zur Verfügung
stehen.
"Totale Institutionen" wie z.B. geschlossene Anstalten,
Schiffsbesatzungen oder Militärgarnisonen zeigen in ihrem Strukturaufbau
regelmässig hohe "induzierte Stabilitäten" auf Grund der
Tatsache, dass die integral eingebundenen Insassen mit höchster
Berechenbarkeit immer dieselben - sich andauernd reproduzierenden -
Grundbedürfnisse artikulieren und dadurch auch höchst verlässliche
Ansatzpunkte für Strategien der Sanktionierung und Sozialkontrolle bieten
(vgl. Goffman, 1973: 54ff.).
Die schwerwiegendsten, gerade unter modernen gesellschaftlichen
Verhältnissen immer auffälligeren Leistungsschwächen aller auf dem
Prinzip der "Anwesenheit" konstituierten Sozialsysteme entstehen
aus der Tatsache, dass Mitgliedschaftsrollen, Statusverhältnisse,,
Kooperationsbeziehungen und alle andern Elemente der Binnenstruktur nur
dadurch stabil gehalten werden können, dass die Teilnehmer drastische
Beschränkungen ihrer räumlichen Mobilität auf sich nehmen.
Verständlicherweise wird mit vielerlei Mitteln versucht, den Status
"prinzipieller Anwesenheit" wenigstens partiell vom Zustand
dauernder physischer Präsenz unabhängig zu machen: indem man
stellvertretend für den eigenen Körper symbolische Markierungen
verwendet, um Phasen temporärer Abwesenheit zu überbrücken oder um sich
gar bei beliebig seltener Anwesenheit immer den Zugang zu einer kollokalen
Teilnehmerrolle zu sichern. Am besten scheinen dazu "persönliche
Gegenstände" (z.B. Badetücher am Strand, Jacken im Eisenbahnabteil,
Handtaschen auf Wartezimmerstühlen) geeignet, die mit der partikulären
Persönlichkeit des Besitzers symbolisch derart stark assoziiert werden,
dass man den Respekt und die Berührungsscheu, den man seinem Körper
gegenüber verspürt, zumindest teilweise auf sie überträgt (Goffman
1974: 71ff.).
Vor allem Individuen in höheren Statusrängen sind auf einen
extensiven Gebrauch derartiger Körpersubstitute angewiesen, um ihre
vielfältigen Einbindungen in kollokale Interaktionsfelder mit ihren
ebenso ausgeprägten Bedürfnissen nach räumlicher Mobilität in Einklang
zu bringen. Dies geschieht dadurch, dass sie eine besonders grosse Zahl
physischer Gegenstände und Einrichtungen (z.B. Büros, Ferienvillen u.a.)
exklusiv mit ihrer "Persönlichkeit" imprägnieren, andererseits
aber darüber hinaus auch rein institutionelle Hilfen in Anspruch nehmen,
um sich dauernde Zugangschancen (z.B. zum familieneigenen Kirchenstuhl
oder zum Stammplatz im bevorzugten Speiserestaurant) zu sichern.
2.2.3 "Persönliche Erscheinung"
In der praktischen interpersonellen Wahrnehmung mag es kaum gelingen,
das reine raum-zeitliche "Hiersein" eines Individuums zu
verifizieren, ohne gleichzeitig auch verschiedene Aspekte seines
besonderen "Soseins" in den Blick zu bekommen (vgl. Schütz,
1974: 182ff).
Dennoch bleibt diese Unterscheidung von höchster analytischer
Relevanz, weil alle über die schiere "Anwesenheit"
hinausgehenden personellen Attribute und Kundgaben einen ungleich
spezifischeren und variableren Charakter haben, und auf Seiten des
Emittenten wie des Rezipienten mehr Spielraum für eigenselektive
Gestaltung und Deutung offenlassen,
Am wenigsten treffen diese Eigenheiten allerdings auf die relativ
invariante Ausdrucksebene der "äusseren Erscheinung" zu, die
einerseits am unmittelbarsten auf dem Basisfaktum der
"Anwesenheit" ruht, auf der andern Seite aber ihrerseits als
Fundament und Deutungsrahmen für alle variableren Äusserungen auf der
Ebene der Gestik (2.2.4) oder auf verbalem Niveau (2.2.5) fungiert.
Normalerweise kann ich die Verhaltensäusserungen und Sprechakte eines
anwesenden anderen Individuums nicht einmal wahrnehmen, geschweige denn
adäquat interpretieren, bevor ich dieses nicht in intuitiver, höchst
synthetischer Weise im Medium seiner spezifischen "äusseren
Erscheinung" wahrgenommen habe: in den Aspekten seiner körperlichen
Verfassung, seiner Bekleidung und Physiognomie, die sich
"spontan" (d.h. für mich als Wahrnehmenden unvermeidbar und
unkontrollierbar) zu einem komplexen Simultanbild der Gesamtperson und
ihrer aktuellen Befindlichkeit zusammenfügen.
Auf ebenso unkontrollierbare Weise wird dieses Bild als äusserliches
Korrelat einer - direkt nicht beobachtbaren - persönlichen
Charakterstruktur gedeutet, der man ein analoges Mass an Konsistenz,
Invarianz und Situationsunabhängigkeit unterstellt.
"Das Gesicht aber... ist das Symbol all dessen, was das
Individuum als die Voraussetzung seines Lebens mitgebracht hat, es ist
abgelagert, was von seiner Vergangenheit in den Grund seines Lebens
hinabgestiegen und zu beharrenden Zügen in ihm geworden ist. Das Gesicht
bewirkt, dass schon aus seinem Anblick, nicht erst aus seinem Handeln,
verstanden wird. Das Gesicht, als Ausdrucksorgan, betrachtet, ist
sozusagen ganz theoretischen Wesens, es handelt nicht, wie die Hand, wie
der Fuss, wie der ganze Körper: es trägt nicht das innerliche oder
praktische Verhalten des Menschen, sondern es erzählt nur von ihm. In
irgendeinem, freilich schwankenden Masse, wissen wir mit dem ersten Blick
auf jemanden, mit wem wir es zu tun haben (Simmel 1908b: 485)."
Dieser diffus-holistischen Auffassungsweise steht nun allerdings eine
ausgesprochen differenzierte, durch das komplementäre Zusammenwirken
mehrerer kommunikativer Ausdrucksebenen gekennzeichnete Konstitutionsweise
der "persönlichen Erscheinung" gegenüber.
Nach Massgabe des Kriteriums, wie eng sie mit dem Niveau
zugeschriebener biologischer Körpermerkmale einerseits oder dem Niveau
intentional manipulierbaren Verhaltens andererseits in Verbindung stehen,
müssen mindestens die folgenden vier Ebenen analytisch
auseinandergehalten werden:
- Auf Grund von Alter, Geschlecht, Hautfarbe und anatomisch bedingten
Charakteristika bringt jedes Individuum an alle kollokalen
Interaktionsfelder eine invariante Konstellation fundamentalster
physischer Eigenschaften mit, die praktisch im selben
Wahrnehmungsakt, mit dem man die Anwesenheit der Person registriert,
mitaufgefasst werden. Ihre weite Entfernung von der Ebene
intentionalen Handelns verdankt diese Ausdrucksebene also der
Tatsache, dass der Emittent nicht in der Lage ist, auf das Ob, Wie,
Wann und Wo solcher Kundgaben wesentlich Einfluss zu nehmen, und der
Rezipient (vor allem bei nichtvisuellen, z.B. akustischen oder
olfaktorischen Reizen) genau so wenig Autonomie hat, sich ihrer
Wahrnehmung zu entziehen.
- Auf der zweiten Ebene finden sich jene ebenfalls im Medium
biologischer Körperlichkeit transportierten Eigenschaften, die aber als
Ergebnisse vorangegangenen
Verhaltens aufgefasst werden können.
In nächster Nähe zur Ebene (1) stehen Merkmale, die auf Grund eines
irreversiblen organischen Eingriffs (z.B. einer chirurgischen Operation)
jetzt zu den zugeschriebenen Körpermerkmalen zu zählen sind, oder
habitualisierte Körperhaltungen, die sich auf Grund langer
Eingewöhnung einer intentionalen Manipulation entziehen. Ein
Illustrationsbeispiel für den letzteren Fall findet sich in der
Gewohnheit englischer Oberschichtkreise, ihren Kindern eine höhere
Stellung der Augenbrauen anzuerziehen (vgl. Birdwhistell 1968: 381).
Zu einem Bereich mittlerer Fixiertheit gehören Körpermanipulationen,
die - wie z.B. das Färben der Haare oder das Ansetzen von Bartwuchs -
zwar reversibel sind, dem Individuum aber dennoch längerfristig ein
stabiles, in allen Kollokalfeldern auf identische Weise zur Geltung
kommendes Erscheinungsbild verleihen. Dadurch kontrastieren sie mit
jenen nur kurzfristig wirksamen Manipulationen (Schminke, Rasur,
Abendfrisur), die häufig im Hinblick auf eine einzelne kollokale
Interaktionsphase (z.B. eine Party oder einen Opernveranstaltung)
vollzogen werden und bei deren längerem Andauern Schaden zu nehmen
drohen.
- Drittens wird die "persönliche Erscheinung" in zentraler
Weise durch materielle Accessoires wie z.B. Kleidungsstücke,
Brillen, Schmuckstücke, Schirme, Handtaschen u.a.)
mitkonstituiert, die - obwohl faktisch von ihrem Besitzer jederzeit
entfernbar - an seine Person temporär oder dauernd assimiliert sind:
indem er exklusive Nutzungsrechte auf sie geltend macht und sie
häufig auch mit physischen Charakteristika (z.B. seinen
Körpergerüchen) "imprägniert".
Einige dieser Utensilien (z.B. die meisten Kleidungs- oder
Schmuckstücke) teilen mit den körperlichen Ausdruckskundgaben der
Ebene (2) die Eigenschaft, dass sie vor dem Eintritt ins Kollokalfeld
fixiert worden sind und während der Dauer der Interaktionsteilnahme
unverändert bleiben. Andere Gegenstände (wie z.B. Hüte, Handschuhe,
Mäntel) sind gerade daraufhin angelegt, innerhalb desselben
Interaktionsprozesses an- und abgelegt zu werden und dem Individuum zu
einer gewissen (selbstkontrollierten) Modifizierbarkeit seines äusseren
Erscheinungsbildes zu verhelfen.
- Schliesslich ist nicht zu unterschätzen, in welchem Ausmass auch vom
menschlichen Körper völlig unabhängige äussere Objekte das
persönliche Erscheinungsbild mitkonstituieren: z.B. kostbare Büro-
oder Wohnungseinrichtungen,, die sich - als
"Bühnenrequisiten" - zusammen mit der Kleidung,
Körperhaltung usw. zu einem Gesamteindruck von
"Vornehmheit" verbinden. Ein grosser Teil der
Konsumgüterwerbung ist damit befasst, verschiedensten Objekten (z.B.
Häuser, Möbel, Autos etc.) zu einem derartigen Status zu
verhelfen und dadurch jenes Repertoire an individuellen
Ausdrucksmöglichkeiten anzureichern, die den Individuen für freie
intentionale Gestaltung zur Verfügung stehen.
Aus dem Zusammenwirken dieser vier Ausdrucksebenen können im kollokalen
Feld bereits vorgängig jeder Interaktion und Kommunikation relativ
spezifische interpersonelle Typifikationen und Erwartungshaltungen
entstehen, die den Einsatz gestischer oder verbaler Kommunikationsmedien
- einerseits überflüssig machen: weil wichtige Strukturprämissen
der sozialen Beziehung bereits hergestellt sind, die z.B. im
translokalen Brief- oder Telephonkontakt völlig im Medium der Sprache
erarbeitet werden müssen;
- andererseits erleichtern: weil viele Verhaltensweisen oder Aussagen
rascher und adäquater verständlich werden, wenn man sie auf der
Folie eines aus vorgängigen Körperwahrnehmungen konstituierten
Persönlichkeitsbildes interpretiert.
Die relativ hohen Unkontrollierbarkeiten und Unvorhersehbarkeiten
kollokaler Interaktionsprozesse (vgl. Kap. 4) entstehen vor allem daraus,
dass praktisch alle intentionalen Handlungen und Sprechakte
unvermeidlicherweise über das Medium der "äusseren
Erscheinung" vermittelt werden, deren zweifache Problematik darin
beruht, dass sie
- auf Grund ihrer Verankerung in körperlichen Merkmalen nur in
begrenztem Masse autonom gestaltet und verändert werden kann;
- als Ausgangsbasis für spekulative - d. h. nicht auf empirische
Evidenz gegründete - Schlussfolgerungen über die
"dahinter" stehende persönliche Charakterstruktur fungiert.
So liegt es offensichtlich sehr nahe, körperlich besonders attraktiven
Personen auch verschiedenste andere positiv bewertete Eigenschaften auf
psychischer und charakterlicher Ebene zu attribuieren und ihnen - was
durchaus zur "self-fulfilling prophecy" werden kann -
überdurchschnittliche Mobilitätschancen auf dem Heiratsmarkt oder in der
beruflichen Arbeitswelt zu attestieren (vgl. z.B. Dion/Berscheid/Walster
1972).
Derartige Voreingenommenheiten mögen sehr wohl dazu führen, dass
physisch anziehende Individuen häufiger eine fortgesetzte Zuwendung ihrer
Interaktionspartner erfahren und dadurch automatisch auch bessere Chancen
zur verhaltensmässigen und verbalen Selbstdarstellung erhalten, während
unattraktive oder gar abstossend-hässliche Personen gegenüber ihren zum
Rückzug neigenden Interaktionspartnern oft keine Gelegenheit finden, ihre
anfänglich negative Eindruckswirkung durch die Artikulation umso
positiverer Eigenschaften auf Handlungsebene (Hilfsbereitschaft,
Kunstfertigkeit, rhetorische Überzeugungskraft u.a.) zu kompensieren.
Generell mag die Invarianz des äusseren Erscheinungsbildes eines
Individuums dazu verführen, ihm über Gebühr auch konstante
Persönlichkeitsmerkmale und innerpsychische Eigenheiten zuzurechnen, und
das Interaktionsverhältnis mag dadurch erschwert werden, dass die
variablen Äusserungen einer Person mit den aus dem
"Erscheinungsbild"" hergeleiteten Erwartungshaltungen in
ein konkurrierendes, konfliktives Verhältnis treten. So können
insbesondere Individuen mit einem sichtbaren äusseren Gebrechen in der
kollokalen Situation besondere Erschwernisse erfahren: weil man das
sinnlich hervorstechende Einzelmerkmal ihrer Lähmung, Blindheit,
Senilität u.a. zum Anlass nimmt, um sie auf generalisierte Weise zu
stigmatisieren und alle ihre Verhaltensregungen nur unter dem einen
Gesichtswinkel ihres physischen Handikaps (und dem damit assoziierten
Zustand dauernder, "Hilfebedürftigkeit") zu interpretieren
(vgl. Goffman 1971:87). Bei jedem Neubeginn einer Bekanntschaftsbeziehung
wird sich diese Problematik wieder verschärfen: weil erstmalige
Interaktionspartner sich zuerst am körperlichen Erscheinungsbild (als der
periphersten, sichtbarsten "Ausdruckskundgabe" einer Person)
orientieren werden, selbst wenn sie guten Willens sind, in nachfolgenden,
viel zeitaufwendigeren Beobachtungs- und Kommunikationsprozessen
"sich eines Besseren belehren zu lassen".
Experimentelle Untersuchungsergebnisse zeigen deutlich, dass Individuen
am prägenden Primäreindruck, den sie bei ihrer ersten Begegnung
voneinander gewinnen, stark festzuhalten pflegen, sofern sie sich nicht
durch drastische Informationen gegenteiliger Art zu einer Modifikation
genötigt sehen (vgl. Luchins, 1957; Anderson/Hubert 1963; Zimbardo
1980:145f.)
Wer den risikoreichen, wenig beeinflussbaren Wirkungen seines
körperlichen Erscheinungsbildes weniger ausgeliefert sein will, hat
deshalb zwei völlig gegensätzliche Strategien offen: er kann sein
soziales Feld auf relativ intime, langfristige Beziehungen einschränken,
in denen seine variableren, autonomer gestaltbaren (aber die Zeit und
Aufmerksamkeit seiner Partner stärker beanspruchenden) Ausdruckskundgaben
besser zur Geltung kommen; oder er kann sich auf translokale Interaktionen
(z.B. Telephon- oder Briefkontakte) verlegen, bei denen die diffusen und
unkontrollierbaren Ausdruckskundgaben seines physischen Erscheinungsbildes
aus rein technischen Gründen ausgefiltert bleiben.
Die Manipulation der äusseren Erscheinung stellt - aufbauend auf das
"Anwesenheitsmanagement" - eine zweite Ebene intentionalen
Handelns und interpersonellen Kommunizierens dar, die teils substitutiv,
teils komplementär zur Ebene variabler Gestik und Sprechakte zur
gezielten Selbstdarstellung und Fremdbeeinflussung eingesetzt werden kann.
Wie im Falle von An- und Abwesenheit kann die Frage, inwiefern z.B. ein
"jugendliches Gesicht", ein "gutsitzendes Kleid" oder
gar ein "muskulöser Körperbau" Ergebnisse kontingenten
Handelns oder nicht manipulierbarer physischer Einwirkungen sind, je nach
Situation sehr unterschiedlich beantwortet werden, und Fremddeutungen
brauchen natürlich keineswegs mit Selbstzurechnungen zu koinzidieren. So
bestehen notorische Unsicherheiten über das genaue Lebensalter, in denen
ein Kind für seine Bekleidung und Frisur die Eigenverantwortung
übernimmt oder das jugendliche Aussehen einer Dame nur noch auf
aufwendiger, raffinierter Toilette beruht.
Vor allem die Präsentation einer "gepflegten äusseren
Erscheinung" macht einen ständigen Aufwand an Wachsamkeit,
Korrekturmassnahmen u.a. nötig, um den erforderlichen
"unwahrscheinlichen" Ordnungszustand der eigenen Kleidung,
Frisur u.a. gegen ständige Entropisierungstendenzen zu verteidigen: und
dies unter der erschwerten Bedingung, dass Ego selbst viel weniger gut als
alle seine kollokalen Beobachter in der Lage ist, sich selbst rundum zu
inspizieren.
"Eines der augenfälligsten Mittel, mit dem der Einzelne seine
situationelle Anwesenheit belegen kann, ist die disziplinierte Handhabung
seiner persönlichen Erscheinung oder seiner `persönlichen Fassade', das
heisst des Komplexes von Kleidung, Aufmachung, Frisur und anderer
Oberflächendekoration seiner Person. An öffentlichen Orten in der
westlichen Gesellschaft soll sich der Mann, der einer bestimmten Schicht
angehört, in der Situation adrett gekleidet, rasiert, gekämmt, mit
frischem Gesicht und gepflegten Händen präsentieren; für Frauen gelten
ähnliche und noch weitere Auflagen. Zu beachten ist, dass in diesen
Fragen der persönlichen Erscheinung nicht nur der Besitz der notwendigen
Ausstattung zur Auflage gemacht wird, sondern auch die Ausübung einer
ständigen Kontrolle, um alles in untadeligem Zustand zu erhalten." (Goffman
1969:36).
Der gezielte Einsatz der "äusseren Erscheinung" als
Kommunikationsmedium wird durch die folgenden funktionalen Eigenschaften
begünstigt:
- Laufende Prozesse gestischer oder verbaler Kommunikation werden von
Sebstdarstellungsaufgaben entlastet: weil die erforderlichen
Anstrengungen zeitlich vor dem Eintritt ins Interaktionsverhältnis (z.B.
bei der Morgentoilette) getätigt werden. Mit Anzug, Gilet und
Krawatte kann ich den ganzen Tag über bei beliebigen Partnern als
"gepflegte Erscheinung" wirken und habe dadurch eine ohne
weitere Bemühungen stabil bleibende, gesicherte Plattform, die ein
Basisvertrauen in meine persönliche Normalität und
Handlungsfähigkeit erzeugt, so dass ich mich ungestörter allen
spezifischeren, variableren Selbstdarstellungshandlungen zuwenden
kann.
- Meine Körpererscheinung ist ein trotz hoher Komplexität synchron
gesendetes, ohne jeden Zeitverzug wahrgenommenes und entschlüsseltes
"Makrosignal", durch das ich grundlegende und von momentanen
Dispositionen relativ unabhängige Charakteristika meiner
Gesamtpersönlichkeit zum Ausdruck bringen kann. In Gestik und Sprache
sind demgegenüber nur zeitlich sequenzierte Bruchteile artikulierbar,
die überdies immer mit den Spezifika der äusseren Situation, der
inneren Stimmung u.a. imprägniert bleiben.
- Als unadressiert ausgesandtes, universell wahrnehmbares Signal
liefert die äussere Erscheinung ein Instrument äusserst extensiver,
auch unplanmässiger Bewirkung: so dass ihre Bedeutung vor allem in
dem Masse steigt, als Zahl und Identität der relevanten
Interaktionspartner unvorhersehbar variieren, bzw. wenn man auf
Partner positiv wirken will, die (noch) keine differenzierteren
Eindrücke besitzen oder mangels weiterer Interaktion ausschliesslich
auf den äusserlichen Ersteindruck verwiesen bleiben.
Die Identifikation einer bestimmten Person als "Kind",
"Frau", "Offizier", "Greis" oder als
"invalid", "dick", "bleichgesichtig" oder
"kleinwüchsig" ist das Ergebnis eines (im Normalfall visuellen)
intuitiv-gesamtheitlichen Wahrnehmungsaktes, der
"augenblicklich" (d.h. ohne subjektiv erlebten Zeitverzug)
stattfindet und deshalb bereits abgeschlossen ist, wenn ich zu
registrieren beginne, welche Verhaltensabläufe diese Person momentan
vollzieht. Deshalb steht mir das Personenbild immer schon als ein
informationsreicher Interpretationsrahmen zur Verfügung, der mir dazu
verhilft, bereits vollzogene Handlungen sinnhaft zu deuten und Erwartungen
über zukünftige Verhaltensweisen zu generieren.
Erst nach längerem Beisammensein (möglichst in verschiedenartigen
Situationen) habe ich so viele Verhaltensweisen meines Partners
beobachtet, dass ich in der Lage bin, aus ihnen ein eigenständiges, mit
dem intuitiven Anfangsbild konkurrierendes Modell der durch sie zum
Ausdruck kommenden Persönlichkeit zu konstruieren: der Invalide ist
bewegungsfähiger, als ich gedacht habe, das schmächtige Kind besitzt
Körperkräfte, die man ihm nie zugetraut hätte.
Derartige Urteilsbildungen sind voraussetzungsreich, zeitaufwendig und
deshalb chronisch knapp: so dass sie sich tendenziell auf den engeren
Kreis meiner regelmässigen Interaktionspartner begrenzen, während es im
viel umfangreicheren Feld oberflächlicher und transitorischer
Interaktionspartner nötig ist, sich auf das anstrengungslos erworbene
(aber entsprechend unkontrollierbar konstituierte) "Bild der
äusseren Erscheinung" zu verlassen.
In der modernen. urbanen Gesellschaft besteht die paradoxe Situation,
dass
- auf der einen Seite die Nachfrage nach informationsreichen
Ausdrucksformen der persönlichen Erscheinung sehr gross ist: weil
häufig neue Kontakte geknüpft werden und besonders zahlreiche
Sozialbeziehungen punktuell und transitorisch bleiben;
- andererseits das Angebot an derartigen Orientierungshilfen geringer
ist als in früheren, ständisch formierten Agrargesellschaften, in
denen jedermann in Kleidung und Habitus sichtbar zur Schau getragen
hat, welcher sozialen Gruppe (Klasse, Berufsstand, Zivilstand u.a.) er
angehörte.
2.2.4 "Gestik"
I
Im breitest möglichen Wortsinne sollen mit dem Begriff der
"Gestik" alle nicht-verbalen, auf körperlichen
Bewegungsabläufen beruhenden persönlichen Kundgaben verstanden werden,
die für den Emittenten selbst und/oder die kollokalen Anderen Objekte
sinnhafter Wahrnehmung und Deutung bilden. Nur zu einem sehr kleinen Teil
handelt es sich dabei um intendierte Äusserungen, die - z.B. substitutiv
für Worte - eine verständliche Mitteilung vom Sender zum Empfänger
transportieren. Zum grösseren Teil sind es ungeplant emittierte
Manifestationen, wie sie als Korrelate unkontrollierbarer
senso-motorischer oder gar physiologischer Vorgänge (z.B. Rülpsen,
Schnarchen, nervöse Zuckungen u.a.) oder als Begleiterscheinungen
innerpsychischer Zustände (z. B. Mimik) entstehen.
Ähnlich wie die schiere räumliche "Anwesenheit"
sichergestellt sein muss, bevor die spezifischeren und variableren
Manifestationen der "persönlichen Erscheinung" wirksam werden
können, so können die noch ungleich volatileren Körpergesten wiederum
nur auf der Grundlage einer vorgängig konstituierten "persönlichen
Erscheinung" generiert und sinnhaft gedeutet werden. Dieselbe
Handbewegung gewinnt je nachdem, ob ein Kleinkind, Verkehrspolizist,
Dirigent oder Priester sie vollzieht, völlig verschiedene Konnotationen,
und der "jugendliche Schritt" kann sich erst im Kontrast zur
leiblichen Fülle oder zum greisenhaften Alter als etwas Bemerkenswertes,
Überraschendes profilieren.
Die Verwobenheit beider Ebenen wird am Zwischenbereich jener
"habituellen Leibkundgaben" deutlich, die sowohl der invarianten
Sphäre der Körpererscheinung wie dem labileren Niveau der Gestik
zugerechnet werden können: z.B. im Falle der Körperhaltung, die durch
ständige Aktualisierung eingeübter Muskelanstrengungen aufrechterhalten
werden muss, oder bei Gewohnheiten des Gehens, Nasenrümpfens oder
Umsichblickens, die beim besten Willen nicht unabhängig von der
leiblichen Gesamterscheinung wahrgenommen werden können.
II
Genauso wie die Merkmale der "persönlichen Erscheinung"
gelten Gesten in jedem Falle als "Äusserungen": d.h. als
empirische Indikatoren intraindividueller Geschehnisse oder Dispositionen,
die sich einer direkten Beobachtbarkeit entziehen. Ihre spezifische
Funktion besteht darin, den kognitiven Zugang zu den zeitlich variablen
Zuständen und Ablaufprozessen eines erlebenden und handelnden Individuums
sicherzustellen: wobei die gewichtigen Vorteile gegenüber der
sprachlichen Kommunikation darin bestehen, dass
- in den Gesten viele intraindividuelle Tatbestände auf
relativ unmittelbare Weise sichtbar werden, während Worte immer als
höchst vermittelte (weil von den bewussten Mitteilungsabsichten des
Emittenten gesteuerte) Äusserungen gedeutet werden müssen;
- Individuen zum selben Zeitpunkt ein reiches Spektrum verschiedener
Verhaltensweisen (z.B. Gesichtsmimik, Handbewegungen u.a.) aussenden
können, während Sprechakte auf strenges zeitliches Nacheinander
verwiesen sind - und deshalb mit dem vieldimensionalen Reichtum
psychischer Abläufe oft nicht Schritt halten können;
- nonverbale Gesten als "analoges" Kommunikationsmedium
einer kontinuierlichen Abstufung zugänglich sind, während die
Sprache als "digitales" Medium immer dazu zwingt, zwischen
diskreten semantischen Alternativen (Begriffen, Satzbildungen u.a.)
eine definitive Wahl zu treffen (vgl. Ruesch 1955; Sebeok 1962;
Watzlawick/Beavin/Jackson 1967; Wilden 1977).
Diese letztere Eigenschaft erweist sich überall dort als Vorzug, wo auch
die zu enkodierenden Tatbestände (Objekte, Zustände oder Ereignisse) den
Charakter kontinuierlicher Variabilität besitzen:
- Bei der Darstellung physischer Objekte, wo es mittels Gesten
gelingt, etwa die Grösse eines Kreises oder die Form einer Vase
"ikonisch" (d.h. durch Erzeugung einer der "wahren
Form" genau entsprechende oder wenigstens isomorphe Handbewegung)
zu symbolisieren (Graham/Argyle 1975).
- Beim Ausdruck innerpsychischer Zustände, wo die Verbalsprache eine
Entscheidung zwischen kategorial separierten Begriffsbestimmungen
("grosse Wut", "entsetzliche Enttäuschung" etc.)
aufzwingt, während es etwa im Medium mimischer Ausdruckskundgaben
viel besser gelingt, den feinabgestuften Intensitäten und subtilen
qualitativen Ausprägungen solcher Stimmungslagen Rechnung zu tragen.
Dank dieser Affinität zur psychischen Systemebene sind Körpergesten dazu
geeignet, innersubjektives Erleben in einer mittels Verbalisierung
unerreichbaren Differenziertheit für intersubjektive Kommunikation zu
erschliessen: (vgl. Bateson 1968).
So besteht die hauptsächliche Funktionsleistung der Schauspielkünste
darin, den defizienten Ausdrucksgehalt eines invarianten Sprachtextes
durch variablere nonverbale Ausdrucksmittel (Kostümierung,
Körperbewegung, Tonfall, Bühnenszenerien u.a.) zu komplettieren und
dadurch z.B. Sphären subjektiven Erlebens (wie z.B. variierende
Gefühlsintensitäten), die keiner digital-begrifflichen Artikulation
fähig sind, einer intersubjektiven Vermittlung und ästhetischen
Gestaltung zugänglich zu machen.
Im Sinne von Ekman/Friesen (1981) können innerhalb der gesamten
Sphäre nonverbaler Kommunikation drei Ebenen der Enkodierung
identifiziert werden, die sich danach unterscheiden, ob das Verhältnis
zwischen Zeichen und Bezeichneten auf physisch determinierten oder auf
konventionell definierten Zuordnungen beruht.
- Zur äusserst umfassenden Sphäre "intrinsisch kodierter"
Gesten gehören alle in der Gegenwart anderer vollzogener
Verhaltensweisen, die simultan als Akte physischen Bewirkens und als
Akte kommunikativen Ausdrucks fungieren.
Wer eine Ohrfeige verteilt, das Fenster öffnet oder sich intensiv
lesend über ein Buch beugt, erzeugt einerseits ein objektives Geschehen
und andererseits gleichzeitig auch eine intersubjektive Mitteilung, dass
sich genau dieses Geschehen vollzieht. Das reflektierte
Mitberücksichtigen der kommunikativen Aspekte mag dann vielleicht dazu
verleiten, sich etwas demonstrativer als "notwendig" über das
Buch zu beugen, oder zu hoffen, dass auch eine nur angedeutete, nicht
schmerzhafte, Ohrfeige ihre Sanktionswirkung tut. Eine der
folgenschwersten Spezifika kollokaler Sozialsysteme besteht darin, dass
praktisch alle äusserlich wahrnehmbaren Verhaltensweisen auch als
"auf sich selbst verweisende Symbole" fungieren: so dass es
nicht gelingt, sie aus solch kommunikativen Bindungen loszukoppeln und
kompromisslos auf rein sachliche Bewirkungen hin zu orientieren (vgl.
3.4).
- Die zweite Sphäre der "extrinsisch kodierten" Gesten
umfasst all jene Verhaltensvorgänge, die zu demjenigen, was sie
ausdrücken in einem "ikonischen" Verhältnis stehen: und
sich somit zum Bezeichneten nicht mehr in einem Kausalverhältnis,
aber immerhin noch in einem isomorphen Abbildverhältnis befinden. Die
Entlastung von physischen Bewirkungen hat zur Folge, dass
verschiedenartige und auch mit sehr geringem Aufwand an Energie oder
Qualifikation vollzogene Handlungen hinreichend sein können, um den
rein kommunikativen Zweck zu erfüllen: so dass es durchaus möglich
ist, mit sachten Handbewegungen ein gewaltiges Orchester zu
dirigieren, oder mit der blossen Drohfaust eine dem tätlichen Angriff
vergleichbare Einschüchterungswirkung zu erzielen.
- Zur dritten, der verbalen Ebene verwandtesten Sphäre
"konventioneller" Gesten ("arbitrary extrinsic coding")
gehören Ausdruckskundgaben, die mit dem symbolisierten Tatbestand in
einem völlig willkürlich festgelegten Zuordnungsverhältnis stehen -
und deshalb zu ihrer intersubjektiven Verständlichkeit einer umso
festeren Verankerung auf der kulturellen Ebene bedürfen.
Paradoxerweise bedeutet die "Willkürlichkeit" derartiger
Symbolhandlungen (wie z.B. Händeschütteln, Kopfnicken, Applaudieren
etc.) keineswegs, dass sie von den Akteuren nach Belieben umdefiniert,
eliminiert oder neu erzeugt werden könnten. Ganz im Gegenteil haben
konventionell festgelegte Symbole (wie z.B. auch Sprachbegriffe) die
Eigenschaft, besonders ritualisiert zu sein und sich der deliberaten
Kreation oder Manipulation viel weitgehender als z.B. ikonische Gesten
zu entziehen. Denn weil jede intrinsische Bezüglichkeit zum
bezeichneten Referenten fehlt, wird es bei jeglicher Modifikation der
Bedeutungszuordnungen erforderlich, sehr umfassende Prozesse sozialer
Diffusion, Konsensbildung, Sozialisierung und Tradierung stattfinden
zu lassen.
Während sich verbale Äusserungen (z.B. Begriffe, Sätze u.a.) zu
Formtypen verdichten, die völlig unabhängig davon, auf welche Weise sie
gesprochen oder geschrieben werden, dieselbe invariante Bedeutung
beibehalten, so bleibt der präzise Sinngehalt der meisten nonverbalen
Gesten unauflöslich an die spezifische Art und Weise ihrer Ausführung
gebunden. So können sich Emittenten durch Verfeinerung ihrer motorischen
Selbstkontrolle immer reichhaltigere und subtilere Fähigkeiten zu
nonverbalen Ausdruckskundgaben erschliessen; und die dekodierenden
Rezipienten können sich durch Differenzierung ihres Wahrnehmungs- und
Interpretationsvermögens in die Lage versetzen, immer feinere
Nuancierungen (des Gesichtsausdruckes, der Handbewegungen u.a.) zu
registrieren und adäquat zu verstehen:
"Die kommunikative Bedeutung des Tonfalls, in den ich diese
Redeäusserung kleide, des genauen Zeitpunkts (im Verhältnis zu den Voten
meiner Konversationspartner), zu dem ich sie ausspreche, der
Geschwindigkeit, mit der ich die Worte einander folgen lasse etc. etc.,
all dies hängt völlig von der Fähigkeit der Rezipienten ab, genau diese
Merkmale richtig zu erfassen." (Kendon 1981:3f.)
Weil man nicht sprechen kann, ohne auf eine bestimmte Weise zu
sprechen, sind alle kollokalen Redeäusserungen zwangsläufig mit einer
Aura "intrinsischer" nonverbaler Begleitäusserungen behaftet,
die vom Sprechakt selbst nicht ablösbar sind. Darüber hinaus aber
scheint es generell üblich zu sein, alles kollokale Sprechen auch in ein
Milieu "extrinsischer" Gestik einzubetten: vor allem durch
äusserst fein differenzierte Gestikulationen (der Hände u.a.), die mit
den sprachlichen Äusserungen in einem dicht verwobenen komplementären
Parallelitätsverhältnis stehen (vgl. Kendon 1983:17).
So scheint der Spracherwerb während des ontogenetischen
Reifungsprozesses eines Individuums keineswegs mit einem Verlust an Gestik
einherzugehen: vielmehr werden die beim Kleinkind "frei flottierenden"
nonverbalen Verhaltensweisen gleichsinnig ausdifferenziert und mit den
verbalen Ausdrucksprozessen immer perfekter integriert (vgl. Bates 1979;
Kendon 1983:24).
Wenn kollokale Sozialsysteme unter verschiedensten
Situationsbedingungen fast voraussetzungslos und unvermeidlich entstehen
und zu ihrer Kontinuierung (abgesehen von fortgesetzter Anwesenheit)
keiner besonderen strukturellen Vorkehrungen bedürfen, so ist dies vor
allem der Existenz und permanenten Aktiviertheit der fundierenden
nonverbalen Kommunikationsebene zu verdanken, die als
"Auffangebene" verfügbar ist, wenn die voraussetzungsreichere
verbale Kommunikation versagt.
Häufig nur rudimentär ausdifferenziert, stellt sie eine
entwicklungsfähige "Kommunikationsreserve" dar, deren
Kapazität nur in Ausnahmesituationen voll ausgeschöpft werden muss: z.
B. wenn Taubstumme oder Angehörige verschiedener Sprachgruppen
miteinander in Beziehung treten, oder wenn strikte institutionelle Normen
Schweigen gebieten.
So waren die Indianer der "great plains" auf eine hoch
differenzierte Zeichensprache als "lingua franca" verwiesen, als
sie im Zuge rascher Stammesexpansion erstmals miteinander in Berührung
traten, genauso wie verheiratete armenische Frauen, die durch Redeverbot
(während des Essens) zum Austausch vielfältiger Gesten genötigt werden
(vgl. Kendon 1983:37).
Während der Entstehungsprozess einer neuen Verbalsprache Jahrhunderte
benötigt und sich - im starken Kontrast zur hohen Intentionalität des
Sprachgebrauchs - einer absichtsvollen Steuerung weitgehend entzieht,
können gestische Zeichensprachen innerhalb eines kontinuierlichen und
relativ geschlossenen kollokalen Feldes ziemlich rasch zur
Ausdifferenzierung gelangen. Diese höhere Evolutionsfähigkeit ist zum
Teil sicher der Tatsache zu verdanken, dass viele nonverbale Gesten einen
"ikonischen" Charakter tragen: d.h. mit demjenigen, was sie
bezeichnen, in einem intrinsischen Isomorphieverhältnis (anstatt bloss
einem konventionellen Zuordnungsverhältnis) stehen (Ekman/Friesen 1981).
Während selbst intimste Unterredungen und Konversationen in Form und
Sinngehalt fest in der Konventionalität der Sprache verhaftet (und
deshalb auch für beliebige Dritte verstehbar) bleiben, so eignen sich
nonverbale Gesten als Trägermedium für die Ausdifferenzierung
partikularistischer Verständigungscodes, deren Geltung sich strikte auf
das Interaktionsfeld zwischen partikulären Einzelindividuen beschränkt.
Die geringere Einbindung in systemexterne, kulturell verankerte
Codestrukturen muss dann allerdings mit umso stärkeren Restriktionen
systeminterner Art erkauft werden: indem Gestensprachen zu ihrer
Entstehung und Reifung auf aussergewöhnlich stabile und langfristig
bestehende kollokale Interaktionsverhältnisse angewiesen sind und in
ihrer Geltung meist auf jene Individuen beschränkt bleiben, die sich
bereits an ihrer Genese mitbeteiligt haben.
So hat Knapp bei konnubialen Ehepaaren einen
langfristigen Perfektionierungsprozess der dyadischen nonverbalen
Kommunikation beobachten können, der bei beiden Partnern von einer
Zunahme der Enkodierungs- wie auch der Dekodierungsfähigkeiten begleitet
ist und in folgenden konsistenten Entwicklungen seinen Ausdruck findet:
- Ein immer breiteres Spektrum immer feinerer
Verhaltensnuancen wird in den kommunikativen Austausch einbezogen.
- Anstelle kulturell stilisierter (d.h. auch anderswo verwendeter)
Ausdrucksformen werden immer mehr rein bilateral definierte
"Sprachregelungen" verwendet: d.h. es wird eine vom Kontext
separierte "Mikrokultur" aufgebaut, die es äussern
Beobachtern (inkl. Soziologen) zunehmend erschwert, die Kommunikation
zu verstehen.
- Die Kapazität der Informationskanäle nimmt zu: indem es gelingt,
innerhalb derselben Zeitspanne immer zahlreichere Kommunikationsakte
stattfinden zu lassen.
- Indem eine wachsende Zahl funktional äquivalenter Ausdrucksweisen
für denselben Sinngehalt zur Verfügung steht, wächst die Chance,
unter beliebigen situativen Bedingungen (z.B. bei unterschiedlichen
räumlichen Distanzen) zuverlässig zu kommunizieren.
- Der gestische Austausch wird in dem Sinne habitualisiert, dass die
Partner sowohl zur Enkodierung wie zur Dekodierung immer weniger
Aufmerksamkeit aufwenden müssen und deshalb zunehmend in der Lage
sind, ihre Kommunikation "beiläufig" (d.h. ohne Behelligung
ihrer übrigen Aktivitäten) stattfinden zu lassen (vgl. Knapp 1983).
Indem die der nonverbalen Ausdrucksebene eigenen funktionalen
Leistungsvorteile auf diese Weise immer stärker zur Entfaltung gelangen,
wird sie fähig, um
- komplementär zur Sprache dem Sozialsystem sehr subtile und
flexible, voraussetzungslos zugängliche und höchst zuverlässige
Möglichkeiten der interpersonellen Akkordierung zu erschliessen, die
für den Vollzug anspruchsvoller Kooperationsleistungen (z.B. in
medizinischen Operationsteams) grösste Bedeutung haben (vgl. Goffman
1983);
- substitutiv zur Sprache einen grösseren Anteil der gesamten
intrasystemischen Kommunikation zu absorbieren, so dass sich die
Teilnehmer auf verbaler Ebene mit einem "restringierten
Code" begnügen können, bei dem die meisten übermittelten
Sinngehalte unausgesprochen bleiben (vgl. Bernstein 1964).
III
Bekanntlich muss bereits das An- und Abwesendsein als ein fundamentales
Basisverhalten angesehen werden, das - jeder spezifischen Interaktion
vorangehend - als Trägermedium für soziale Kommunikation Verwendung
finden kann. Die Übermittlungskapazität dieses Kanals ist aber äusserst
beschränkt, weil es in sachlicher Hinsicht nicht über eine blosse
Digitalität (d.h. ein einziges 'bit' Information) hinaus differenzierbar
ist: so dass es höchstens auf Grund seiner zeitlichen Spezifizierung
(z.B.: Pünktlichkeit des Erscheinens, Häufigkeit der Teilnahme, Länge
der Anwesenheit u.a.) möglich wird, exaktere Aufschlüsse zu gewinnen.
Demgegenüber enthält die Ebene der "persönlichen
Erscheinung" einen sachlich komplexeren und in zeitlicher Hinsicht
variableren Grad an Information, insofern
- verschiedene Individuen ihre je eigenen Körpermerkmale und
intendierten Weisen äusserlicher Selbstdarstellung zum Ausdruck
bringen;
- dieselben Individuen, je nach Lebensalter oder aktuellem Befinden,
ein unterschiedliches Erscheinungsbild bieten und je nach den
Eigenheiten des sozialen Anlasses absichtlich in unterschiedlicher
Montur erscheinen.
Immer noch aber ist der Grad an zeitlicher Variabilität äusserst
beschränkt, weil viele Erscheinungsmerkmale mit den langfristig stabilen
anatomischen und physiologischen Eigenschaften des biologischen Körpers
verhaftet sind, und weil die intentionalen Arrangements der persönlichen
Aufmachung darauf angelegt sind, zumindest im Rahmen einer einzelnen
sozialen Situation (z.B. während einer Abendeinladung, einer
Beerdigungsfeier, eines beruflichen Vorstellungsgesprächs u.a.m.)
möglichst invariant zu bleiben.
Entsprechend wird seitens des Emittenten keine Zeit beansprucht, um das
im äusseren Erscheinungsbild enthaltene Bündel an Information
mitzuteilen: so dass die für mich als Partygast benötigte Zeit, um mir
einen äusseren Eindruck von allen übrigen Gästen zu verschaffen, nur
von meinen eigenen Wahrnehmungsprozessen abhängig ist.
Nicht-verbale Vehaltensweisen haben demgegenüber die Eigenschaft, dass
sie
- mit dem physischen Substrat persönlicher Anwesenheit und
Körpererscheinung in einem äusserst lockeren, indeterminierten
Zusammenhang stehen;
- sich deshalb im Vergleich zur "persönlichen Erscheinung"
viel besser eignen, um mannigfachste interindividuelle Unterschiede
wie auch intra-individuelle Variationen (z.B. zeitliche Wandlungen der
Stimmungslagen, Interessen u.a.) zum Ausdruck zu bringen;
- in doppelter Hinsicht ihre Komplexität nur unter Beanspruchung von
Zeit angemessen entfalten können:
a) weil jeder einzelne Verhaltensablauf Zeit braucht, um vom Beginn
bis an sein Ende zu kommen;
b) weil nur sehr wenige Verhaltensabläufe simultan ablaufen können:
so dass sie in zeitlicher Sequenz angeordnet werden müssen.
Da nun der Emittent Zeit braucht, um seine informativen Stimuli
auszusenden, und der Rezipient Zeit benötigt, um sie zu registrieren, ist
jetzt eine intersubjektive Akkordierung motorischer und sensorischer
Prozesse notwendig, um den Erfolg des kommunikativen Aktes zu garantieren.
Spezielle Mechanismen der Erwartungsbildung und der begleitenden Kontrolle
müssen gewährleisten, dass ich genau dann (und solange) hinsehe, wenn
mein Partner handelt: bzw. dass ich mich vor Ausführung meiner eigenen
Gesten vergewissere, dass mein Partner sein enges Wahrnehmungs- und
Aufmerksamkeitsfeld auf mich fokussiert.
Die Konstitution, Wahrnehmung und Interpretation des nicht-verbalen
Verhaltens vollzieht sich also unter den äusserst erschwerten
Bedingungen, dass Emittent und Rezipient symmetrische Probleme zeitlicher,
sachlicher und sozialer Selektivität in wechselseitiger Abstimmung
zueinander bewältigen müssen:
| |
Emittent |
Rezipient |
| sachlich: |
was will ich tun? |
was soll ich beobachten? |
| zeitlich: |
wann will ich es tun? |
wann soll ich wahrnehmen? |
| sozial |
gegenüber wem will ich es tun? |
wen will ich beobachten? |
Diese Selektions- und Koordinationsprobleme sind so enorm und die zu
ihrer Bewältigung entwickelten Mechanismen so beeindruckend und
vielfältig, dass bei ihrer angemessenen Diskussion fast alle Aspekte der
soziologischen Theoriebildung mitthematisiert werden müssten.
Andererseits halten sich diese Probleme im Bereich nicht-verbalen
Verhaltens dennoch in viel engeren Grenzen als in der Sphäre sprachlicher
Kommunikation, wo noch ungleich höhere Niveaus der Variabilität und
Temporalisierung auftreten (und entsprechend drastischere Mechanismen der
Selektivität wirksam werden müssen (vgl. 2.2.5):
- Während der Emittent im selben kleinen Zeitabschnitt nur einen
einzigen Satz ausformulieren und nur über ein einziges Thema sprechen
kann, so ist er in der Lage, simultan durchaus verschiedene
nicht-verbale Stimuli auszusenden, die in unterschiedliche
Sinnkontexte eingebettet sind und auf verschiedene Interaktionspartner
ausgerichtet werden.
Ein Grund dafür liegt darin, dass neben dem akustischen Emissionskanal
(der auf strenge zeitliche Sequenzierung hin angelegt ist) noch andere
Trägermedien des Ausdrucks zur Verfügung stehen. Insbesondere lässt
sich der Körper als komplexes visuelles Ausdrucksfeld beanspruchen,
weil seine verschiedenen hochdifferenzierten Muskelpartien (Augen,
Gesicht, Hände, Wirbelsäule u.a.) unabhängig voneinander bewegt
werden können.
So kann es in Gesprächssituationen leicht geschehen, dass nonverbale
Kundgaben dem zähen Strom der Rede leichtfüssig vorauseilen: beim
Rezipienten den Erwartungs- und Deutungshorizont vorstrukturierend,
innerhalb dem er dann die nachfolgenden Verbalisierungen interpretiert.
Ein mit diesem Deutungsrahmen in Widerspruch stehender Inhalt der Rede
vermag sich häufig nicht durchzusetzen, weil die nonverbalen Kundgaben
primär zum Zuge kommen und auch meist für authentischer (weil: für
weniger leicht manipulierbar) gehalten werden:
"Und wenn ich fragte 'kennen Sie die Guermantes?' gab Legrandin,
der Plauderer, zur Antwort: 'Nein, und ich habe auch niemals Wert darauf
gelegt.' Leider aber antwortete er nur als zweiter, denn ein anderer
Legrandin, den er sorgfältig in seinem Inneren verbarg und niemals
vorzeigt, weil dieser Legrandin über den unseren und seinen Snobismus
allerlei kompromittierende Geschichten wusste, ein anderer Legrandin,
sagte ich, hatte zuvor bereits seine Antwort gegeben durch den
verwundeten Blick, die verbissene Linie seines Mundes, den
übertriebenen Ernst im Tone seiner Erklärung, durch die tausend
Pfeile, von denen unser Legrandin sich einen Augenblick gespickt und
versehrt gefühlt hatte, ein heiliger Sebastian des Snobismus: 'Ach! Wie
tust Du mir weh! Nein, ich kenne die Guermantes nicht, rühre nicht an
den grossen Schmerz meines Lebens.' Und wenn dieser zweite Legrandin,
das enfant terrible, nicht über die nette Ausdrucksweise jenes zweiten
verfügte, so war er doch viel schlagfertiger, bestand aus lauter
'Reflexen', wie man sagt, und wenn Legrandin der Plauderer ihm das
Schweigen gebieten wollte, hatte der andere längst gesprochen, und es
nützte unserem Freund nichts, wenn er nachträglich verzweifelt war
über den schlechten Eindruck, den die Enthüllungen seines alter Ego
machten; er konnte nur noch versuchen, ihn etwas zu verwischen."
(Proust 1979:172/172).
Werden dieselben kommunikativen Inhalte parallel auf verbaler und auf
nonverbaler Ebene emittiert, gelingt es, dem Kommunikationsprozess eine
höhere "Robustheit" zu verleihen: so dass ihre adäquate
Rezeption und Dekodierung selbst unter widrigen Situationsbedingungen
gesichert werden kann. Wenn jederzeit mit plötzlichem Lärm gerechnet
werden muss oder wenn die Partner sich aus grösserer Entfernung oder
fahrendem Auto miteinander zu verständigen suchen, ist es
beispielsweise ratsam, Grussworte durch begleitende Handgesten oder
umgekehrt: warnendes Winken durch zusätzliche Rufe zu unterstützen
(vgl. Birdwhistell 1970:107f.).
Generell haben solch mehrfach enkodierte Kommunikationsakte die
Eigenschaft, sich prägnanter aus dem Umfeld der übrigen (simultanen)
wahrnehmbaren Ereignisse auszudifferenzieren und dementsprechend auch in
der Erinnerung stärker haften zu bleiben. So bleiben beispielsweise
gesprochene Sätze besser im Gedächtnis haften, wenn sie von
ausdrucksvollen Körpergesten begleitet werden (vgl. Berger/Popelka
1971).
Blickkontakte haben beispielsweise häufig die Funktion, den Sinngehalt
gleichzeitig emittierter Verbaläusserungen zu unterstreichen, dem
gesamten Kommunikationsakt dadurch mehr Redundanz und
"Robustheit" zu verleihen und das Risiko, dass die Rede falsch
(z.B. ironisch statt ernsthaft) verstanden wird, stark zu reduzieren.
So hat sich in einer Experimentaluntersuchung von Ellsworth/Carlsmith
(1977) gezeigt, dass Kommunikatoren, die die Rezipienten während des
Sprechens häufig und lange anblicken, von diesen
- bei positivem Inhalt ihrer Rede günstiger beurteilt werden
- bei negativem Inhalt ihrer Rede ungünstiger beurteilt werden
als wenn - was beispielsweise bei Telephongesprächen zwangsläufig
der Fall ist - Blickkontakte fehlen.
- Während der Rezipient sprachlicher Äusserungen sein integrales
Aufmerksamkeitsfeld auf einen einzigen Sprecher ausrichten muss, um
sich auf den hohen Überraschungsgehalt verbaler Kommunikation
einzustellen, kann der Perzipient nicht-verbaler Verhaltensweisen
einen breiteren, unselektiveren Zugang zu seiner sozialen Umwelt
aufrechtzuerhalten: weil er eben mehrere Sinnesorgane zur Verfügung
hat und ganz besonders mit seinem visuellen Organ in der Lage ist,
simultan relativ komplexe, vieldimensional konstituierte Muster zu
registrieren.
Bei der Mimik beispielsweise können Stellungen und Bewegungen
verschiedener Gesichtspartien derart zu kohärenten Ausdrucksgestalten
verdichtet werden, dass es möglich wird, simultan mehrere
Gefühlszustände zur Kundgabe zu bringen. Elemente von Ungeduld,
Vorfreude, Ängstlichkeit u.a. können sich in derselben Synchronizität,
die ihrem subjektiven Erleben eigen ist, auch im Medium intersubjektiv
wahrnehmbarer Verhaltensweisen zum Ausdruck bringen, während ihre
verbale Explikation ein ihrem Wesen zuwiderlaufendes zeitliches
Nacheinander nötig machen würde (vgl. z.B. Plutchik 1962;
Ekman/Friesen 1981).
Nicht zuletzt dank diesem "Realzeitverhältnis" zwischen
Erleben und Kommunikationsverhalten können nonverbale
Ausdruckskundgaben einen auf verbalem Wege unerreichbaren Grad an
Authentizität und "Wahrhaftigkeit" erreichen: so dass sie
überall dort, wo solche Authentizität hoch geschätzt wird (z.B. in
psychotherapeutischen "encounter groups") gegenüber der
verbalen Ebene in Führung gehen.
- Während der sprachliche Kommunikationsfluss seine eigene zeitliche
Variabilität und Unvorhersehbarkeit dadurch erzeugt, dass es
normalerweise als inopportun, ja abstrus und psychopathologisch
angesehen wird, wenn jemand auch nur zweimal genau dasselbe sagt, so
sind die Variationszwänge beim nicht verbalen Verhalten viel weniger
streng normiert. Niemand wird allein deshalb negativ sanktioniert,
weil er sehnsüchtige Blicke, schelmisches Lächeln, unwilliges
Kopfschütteln oder selbst neurotisch wirkendes Mundzucken mehrmals
wiederholt: und von allen Individuen wird stillschweigend erwartet,
dass sie fortgesetzt dieselben Verhaltensanstrengungen aufwenden, um
einen bestimmten Habitus ihrer Körperhaltung, ihres Gesichtsausdrucks
oder des Tonfalls ihrer Stimme zu stabilisieren.
Aus all diesen Gründen fehlt das für verbale Kommunikation typische
Dilemma, dass sich aufgrund der Knappheit an Redezeit und Zuhörchancen
entweder eine asymmetrische Polarisierung zwischen einem Sprecher und
vielen Zuhörern oder aber eine Fragmentierung in zahlreiche unabhängige
Konversationsgrüppchen (häufig bilateraler Art) ergibt.
Vielmehr überwiegt ein relativ lose koordiniertes, dezentralisiert
gesteuertes Netzwerk multilateraler Emissions- und Rezeptionsaktivitäten:
ein Grundpegel anarchischer, aber gerade deshalb äusserst beständiger
"nicht-zentrierter Interaktion", bei dem jedes Individuum sich
die Freiheit wahrt, als autonomes Emissions- und Rezeptionszentrum
intersubjektiver Kommunikation zu fungieren:
"Alle Anwesenden stürzen sich in einen gemeinsamen Teich
nicht-zentrierter Interaktion, jeder Einzelne vermittelt jedem in der
Situation allein durch seine Anwesenheit, sein Benehmen, seine äussere
Erscheinung irgendwelche Informationen von sich, und jeder Anwesende nimmt
ähnliche Informationen über die anderen entgegen, zumindest insofern,
als er willens ist, von seinen Möglichkeiten, etwas zu erfahren, Gebrauch
zu machen."
"In diesem Bereich nicht-zentrierter Interaktion kann keinem
Teilnehmer 'offiziell' das Wort erteilt werden: es gibt kein offizielles
Zentrum für allgemeine Aufmerksamkeit." (Goffman, 1969:146;42).
So vermag das sich auf anspruchsloseste Weise ständig regenerierende
Geflecht sinnlicher Verhaltenswahrnehmungen dem kollokalen Sozialsystem zu
einer weitreichenden und zuverlässigen primären Integration und zu einem
Rahmen gesicherter gemeinsamer Situationsdefinitionen, Interpretationen
und Antizipationen zu verhelfen, innerhalb dem dann die sprachliche
Kommunikation gefahrloser ihre differenzierenden - häufig von
Asymmetrien, Desorganisation und Abspaltung begleiteten - Wirkungen
entfaltet.
"Oberhalb und jenseits dieser allgemeinen Teilnahme aber
beteiligen sich die voll integrierten Mitglieder einer besonderen
Begegnung zusätzlich an einer Interaktion zentrierter Art; in ihr ist die
Information eines Einzelnen als spezifischer Beitrag zu einem gerade
diskutierten Thema gemeint und hat gewöhnlich auch einen bestimmten
Adressaten, während die andern Mitglieder der Begegnung, und nur diese
anderen, sie ebenfalls aufnehmen sollen. So liegt eine allen gemeinsame
Basis nicht-zentrierter Interaktion einer nicht allen gemeinsamen Basis
zentrierter Interaktion zugrunde (oder mehreren solchen Basen)" (Goffman,
1969: 147).
Dieses "Basisrauschen" nicht-verbaler Kommunikation
konstituiert einerseits die Ausgangsbasis, auf der (z.B. indem sich jemand
plötzlich zum Redner aufschwingt, oder alle aufhorchen, um dem Gespräch
zweier Teilnehmer zuzuhören) sich ein viel schmalerer und im Zeitablauf
ausgeprägt variierender Überbau "zentrierter Interaktion"
aufbauen kann; und andererseits bildet es die jederzeit verfügbare
"Rückzugsbasis", auf die das Interaktionssystem nach
anstrengenden Phasen der Zentrierung jederzeit regredieren kann, ohne
seinen Charakter als soziales Interaktionssystem zu verlieren. So bleibt
ein Theaterpublikum nach beendeter Vorstellung zumindest noch eine
Zeitlang als nicht-zentriertes Feld einander stossender, musternder,
winkender und sich vor der Garderobe gefügig in die Schlange einreihender
Individuen erhalten; und in durchaus ähnlichem Aggregationszustand
pflegen sich ermüdete Schulklassen während der Pausen vom anstrengenden
zentrierten Unterricht zu erholen.
IV
Bekanntlich stösst man beim Versuch, die Anwesenheit einer Person
sowie ihre äussere Erscheinung als intentionale Handlungen (bzw. deren
Ergebnisse) aufzufassen, auf recht enge Grenzen, denn
- jeder Mensch ist dem unentrinnbaren Zwang ausgeliefert, jede Minute
des Tages irgendwo zu sein und andern Individuen einen bestimmten
Anblick zu bieten: völlig unabhängig davon, inwieweit er diese
ökologischen und physischen Parameter seiner Befindlichkeit
absichtsvoll kontrolliert;
- auf Grund harter physischer Gegebenheiten lassen sich die meisten
Absichten zur Manipulation solcher Zuständlichkeiten nur schwer oder
überhaupt nicht verwirklichen: z.B. weil man sich nicht gleichzeitig
oder kurz nacheinander an völlig verschiedenen Orten aufhalten kann,
oder weil biologisch fixierte Körpermerkmale (bedingt durch
Geschlecht, Alter u.a.) der Manipulation des äusseren
Erscheinungsbildes Widerstand entgegensetzen.
Am entgegengesetzten Pol höchster Intentionalisierung wäre wohl das
verbale Kommunikationsverhalten anzusiedeln, denn
- weil man (zumindest im Sinne physischer Kausalität) niemals
gezwungen ist, überhaupt etwas zu sagen, wird die Tatsache, dass ein
Sprechakt erfolgt, fast unweigerlich als Indiz für eine absichtsvolle
Handlung gewertet;
- weil man im Medium der Sprache mit gleichbleibender Mühelosigkeit
alles und jedes in beliebig variabler Diktion zum Ausdruck bringen
kann, wird - ausser in psychopathologischen Fällen - auch das Was und
Wie der Rede dem Sprecher als eigenselektiv-intentionale Handlung
zugerechnet.
Nicht-verbale Verhaltensweisen belegen nun zwischen diesen beiden Polen
eine intermediäre Position, oder besser: ein relativ breites Spektrum
mittlerer Positionen, das sich vom Bereich praktisch unkontrollierbarer,
physiologisch bedingter oder habitualisierter Verhaltensreflexe (Niesen,
Rülpsen, Gewohnheiten des Gehens, Händereichens, Lächelns u.a.) bis zu
völlig absichtsvoll gemeinten und verstandenen Handlungen erstrecken.
Wird die "persönliche Erscheinung" durch biologisch
zugeschriebene Körpereigenschaften noch direkt determiniert, werden
Verhaltensweisen durch sie nur noch konditioniert: indem sie einen
Variationsspielraum potentiell ausführbarer senso-motorischer Abläufe
begrenzen, ohne zu präjudizieren, ob, wann und wie oft eine spezifische
Verhaltensweise erfolgt.
Entsprechend wird der Tatbestand individueller Autonomie erst auf
dieser dritten Ebene zu einer derart regelmässigen, generalisierten
Erfahrung, wie dies für die Konstituierung selbstreferentieller
Persönlichkeitssysteme und intersubjektiver Sozialsysteme notwendig ist:
- Jedes Individuum erfährt sich selbst als ein Selektionszentrum, das
andauernd aus einer Vielzahl gleich zugänglicher Alternativen
auswählen kann und muss: so dass es für die Orientierung an Werten,
Normen, Präzedenzen, "Bedürfnissen" und vielen andern
Strukturierungshilfen sensibilisiert wird, die ihm diese
"Reduktion von Komplexität" erleichtern.
- Interagierende Individuen erfahren einander als andauernd
selbstbestimmende Akteuren und müssen damit leben, dass sie für ihre
eigenen Handlungen zur Verantwortung gezogen werden und die
Verhaltensweisen anderer als eigenselektive (also nicht durch
deterministische Kausalwirkungen hinreichend konstituierte oder
beeinflussbare) Ereignisse hinnehmen müssen.
Dieser Selektionszwang teilt mit dem physischen Körper die Eigenschaft,
den Menschen unentrinnbar über seine ganze (zumindest: wache)
Existenzdauer hinweg zu begleiten. Darf die Einsicht "Man nimmt mich
wahr, also bin ich" als konstitutiv für eine primäre, bereits dem
kleinsten Kind zugängliche selbstreferentielle Existenzerfahrung gelten,
so ist das Urteil "Ich muss wählen, also bin ich " dank ihrer
ähnlich zwingenden Evidenz geeignet, das Selbstbewusstsein des
Individuums als autonom handlungsfähiges Subjekt zu begründen.
Andererseits aber ist nicht-verbales Verhalten immer noch so weitgehend
in physische Bedingungs- und Einflussverhältnisse eingebunden, dass es
selten einen so hohen und unbestrittenen Grad der Intentionalisierung
erreicht, wie er für Sprechakte generell charakteristisch ist:
- Der Spielraum realisierbarer Intentionen wird immer noch durch
relativ spezifische, nicht manipulierbare Randbedingungen (Körperbau,
Wahrnehmungsfähigkeiten, motorische Kondition u.a.) erschwert oder
verunmöglicht, die zwischen verschiedenen Personen wie auch im
Verlaufe individueller Biographien auf unkontrollierbare Weise
variieren.
Deshalb kann es niemals eine ähnlich generalisierte
"Verhaltenskompetenz" geben, wie es eine "generalisierte
Sprachkompetenz" (vgl. 2.2.5) gibt. Denn in zahlreichen - eigenen
und fremden - Verhaltensweisen werden Individuen physisch-kausal
bedingte Zwangsläufigkeiten und Regularitäten entdecken, die den
Handlungscharakter vieler Verhaltensabläufe verringern (und die
Probleme des Selektionszwanges, der Kontingenz und verantwortlichen
Zurechnung entsprechend reduzieren).
- Individuen können sich nicht ähnlich souverän zum
"Verhalten" oder "Nichtverhalten" entschliessen,
wie sie sich jederzeit für das "Reden" oder
"Schweigen" entscheiden können. Zwar sind sie zumindest im
Schlaf oder bei Bewusstlosigkeit von Verhaltenszurechnungen
dispensiert: während sie auf dem fundamentaleren Niveau ihrer
"persönlichen Erscheinung" selbst dann noch unentwegt
sinnlich wahrnehmbare Stimuli emittieren.
Aber in ihrem normalen Wachzustand sind Individuen daraufhin angelegt,
ununterbrochen ein relativ hohes Niveau motorischer und sensorischer
Variabilität aufrechtzuerhalten: so dass "absolute
Bewegungslosigkeit" nur annäherungsweise und unter grössten
Anstrengungen erreichbar ist und als unnatürlichster - entweder auf
höchste intentionale Anspannung oder auf katatonischen Wahnsinn
hinweisender - Zustand gilt.
Dieser Basispegel ständiger motorischer Abläufe hat zur Folge, dass
jedes Individuum andauernd viel mehr Verhaltensstimuli emittiert, als es
zum Objekt aufmerksamer Beachtung und intentionaler Kontrolle machen kann.
Hinzu kommt, dass von aussen her selten eindeutig beobachtbar ist, auf
welche seiner Äusserungen ein Emittent momentan eine bewusste
Aufmerksamkeit fokussiert: so dass der intentionale Gehalt vieler
Verhaltensweisen zwielichtig bleibt und vom Akteur selbst anders als von
seinen Interaktionspartnern beurteilt wird.
Weil man schliesslich seine Augen immer irgendwohin wenden muss, kann
man immer bestreiten, mit dem Anblicken oder Anstarren einer Person eine
bestimmte Absicht (z.B. Kontakt aufzunehmen, Missbilligung auszudrücken
u.a.) zu verbinden; und mein vernehmbares Räuspern während einer
Diskussion muss nicht als "Kommentar" zum soeben gehörten Votum
aufgefasst werden, weil auch rein stimmphysiologische
Erklärungsmöglichkeiten zur Verfügung stehen (vgl. z.B. Luhmann 1972,
Kendon 1983: l4)
Gerade weil ihr Handlungscharakter so undeutlich ist und deshalb
verschiedenartigen und leicht revidierbaren Deutungen offensteht, sind
nicht-verbale Verhaltensweisen viel besser als verbale Äusserungen dazu
geeignet, um bei relativ hoher Erwartungsunsicherheit mit wenig Aufwand
und Risiko neue Interaktionsmöglichkeiten und Konsenschancen zu
explorieren. So können kollokale Individuen (z.B. auf "Begegnungsparties")
ihre Blicke ähnlich wie Pflanzen ihre Sporen um sich streuen: in
Erwartung, dass zumindest einer von ihnen "haften" bleibt und
einen kommunikativen Prozess auslöst, der zu einer Tanzaufforderung,
Bekanntschaft, Freundschaft oder noch weiter führen kann.
Das kontinuierliche "Grundrauschen" ständiger
sensorischer Wahrnehmungsprozesse - die selber nur sehr begrenzt
wahrnehmbar sind - hat zur Folge, dass Individuen nur geringe Kontrolle
und nur begrenztes Wissen darüber haben, welche der von ihnen
ausgesandten Verhaltensstimuli von wem wann wie wahrgenommen werden.
Besonders ausgeprägt trifft diese Problematik auf die Gesichtsmimik
zu: weil mimische Kundgaben
- ununterbrochen ausgesendet werden müssen, da das Gesicht
im Gegensatz zu den übrigen Körperteilen den Mitanwesenden permanent
in unverhüllter Nacktheit dargeboten wird und auch (im Gegensatz etwa
zu den Händen) in seiner Lage und Darstellungsperspektive kaum
manipuliert werden kann;
- von den Mitanwesenden mit besonders hoher Wahrscheinlichkeit
registriert werden: weil allein schon die Höflichkeit es gebietet,
seinen Partner mit einer gewissen (allerdings auch wieder begrenzten)
Häufigkeit und Zeitdauer ins Antlitz zu blicken (Ekman/Friesen 1969)
und es darüber hinaus als erwiesen gilt, dass im Gesichtsausdruck
besonders informationsreiche und authentische Kundgaben sichtbar
werden;
- vom Emittenten besonders schwer registrierbar und kontrollierbar
sind, weil ausgerechnet sein Gesicht, das für alle
Interaktionspartner im Zentrum visueller Aufmerksamkeit steht, sich so
weitgehend wie kaum ein anderer Körperteil seiner eigenen Wahrnehmung
entzieht.
Das hat zur Folge, dass die Selektivität der nonverbal übermittelten
Kommunikationen in hohem Masse den Aufmerksamkeitsleistungen und
Dekodierungsfähigkeiten des Rezipienten aufgebürdet wird: weil die
Vielfalt der permanent erzeugten Kundgaben ihm viel Autonomie überlässt,
das Wann, Was und Wie seiner Wahrnehmung selber zu bestimmen.
Dies wiederum bedeutet, dass im Verhältnis zwischen Selbst- und
Fremdwahrnehmung (wie auch zwischen den Fremdwahrnehmungen verschiedener
Beobachter) hohe Diskrepanzen entstehen können, die sich - wegen der
engen Kapazitätsschranken sprachlicher Kommunikation - niemals alle auf der Ebene verbaler Verständigung abbauen lassen.
Entsprechend bleibt alles ausserhalb verbaler Explikation (bzw.
Explizierbarkeit) stattfindende Handeln in dem Sinne "unvollständig
sozialisiert", als sich sowohl die Enkodierungs- wie die
Dekodierungsprozesse einer strengen Kontrolle durch intersubjektiv
verbindliche Regeln entziehen und jedes Individuum in gewissem Grade seine
höchst privaten (empirisch nie eindeutig verifizierten) Auffassungen
darüber aufrechterhält, wie es aussieht, sich verhält und dadurch
"auf andere wirkt".
V
Im Verhältnis zu den wenig differenzierbaren Ausdrucksebenen
persönlicher Anwesenheit und Erscheinung fungiert die Sphäre
nicht-verbalen Verhaltens als hierarchisch übergeordnete Ebene der
Steuerung und semantischen Spezifikation.
Beispielsweise ist die blosse Anwesenheit in einer Kirche ein in sich
selbst so wenig informationshaltiges Faktum, dass man nur aus dem Kontext
des dort praktizierten Verhaltens Schlüsse ziehen kann, ob touristische
Neugier, ästhetisches Erlebnisbedürfnisse oder gläubige Andacht die
Motive dafür bilden.
Und das öffentliche Auftreten in festlicher, schwarzer Kleidung ist
ein so unspezifisches Signal, dass man nur durch Kenntnis
- der im jeweiligen kulturellen Kontext geltenden
Kleidungskonventionen
- der aktuell vorliegenden Situation und Handlungsabsichten (z.B.:
einer Beerdigungszeremonie beizuwohnen, ein Orchester zu dirigieren
u.a.)
zu zuverlässigen Interpretationen gelangt.
Auf der andern Seite bildet die Sphäre nicht-verbaler Verhaltensweisen
ihrerseits das fundierende Substrat für alle verbale Kommunikation. Denn
niemand kann im kollokalen Interaktionsverhältnis auch nur einen Satz
äussern, ohne gleichzeitig (bzw. wiederum: ein bisschen vor dem
Zeitpunkt, wo der Satz vollendet und dadurch zum Gegenstand
intersubjektiven Verstehens geworden ist) in Tonfall, Mimik, Modulierung,
Blickweisen und Handbewegungen die situativen Rahmenbedingungen
mitzuliefern, die
- im physischen Sinne kausal notwendige Trägersubstrate der
Sprachäusserung darstellen;
- im symbolischen Sinne den semantischen Kontext mitkonstituieren,
innerhalb dem sich die präzise Sinndeutung des Gesprochenen vollzieht
(vgl. z.B. Poyotas 1981).
Weil eine sehr begrenzte, durch keinerlei Massnahmen wesentlich
vermehrbare Zahl verschiedener motorischer Verhaltensvollzüge für eine
unabgrenzbare Vielfalt verschiedener Bedeutungen in Anspruch genommen
werden muss, ist jede Verhaltensweise "semantisch defizient" und
verlangt nach einer sinnhaften Präzisierung, die häufig nur auf der noch
ungleich differenzierbareren Ausdrucksebene sprachlicher Kommunikation
gewährleistet werden kann (vgl. Kendon, 1981: 15, Freedman 1981: 151ff.).
So erhält das Fahneschwenken des Linienrichters ausschliesslich von
den kodifizierten Regeln des Fussballspiels seinen Sinn; und in den
Armbewegungen des zelebrierenden Priesters kann man mühelos die
Vorschriften der Messliturgie wiederfinden.
Aber auch (ja: gerade) sehr komplexe, zu einer übergreifenden
Moralhandlung koordinierte Verhaltensabläufe bleiben semantisch
unterdeterminiert, solange man den verbalen Kontext der Weisungen,
Vorschriften, Sanktionsandrohungen u.a. nicht kennt, in den sie
hineingehören. So kann man zwar dem Fällen eines Baumes durchaus einen
immanenten, aus dem zweckhaften Ineinandergreifen verschiedener
Verhaltensvorgänge erschliessbaren Sinn abgewinnen (vgl. Weber 1972: 4);
aber ohne Angabe eines verbalisierten semantischen Referenzsystems kann
man nicht wissen, ob es sich dabei um die Erfüllung einer dienstlichen
Vorschrift, die Urbarmachung von Neuland oder um delinquenten Waldfrevel
handelt.
Die mangelhafte "immanente Verständlichkeit" der meisten
Gesten rührt daher, dass im Vergleich zur grenzenlosen Mannigfaltigkeit
formulierbarer Sätze und Texte nur ein begrenztes Repertoire äusserlich
klar unterscheidbarer Körperbewegungen zur Verfügung steht: so dass
dieselben Bewegungsmuster je nach kulturellem und situativem Kontext mit
ganz unterschiedliche Ausdrucksfunktionen befrachtet werden müssen. Ganz
besonders armselig ist das Arsenal der sogenannten ritualisierten Gesten,
die den strengen Anforderungen genügen müssen, von jedermann ohne
besondere motorische Voraussetzungen ausführbar sowie ohne besondere
perzeptive Anforderungen wahrnehmbar zu sein.
Das "Lächeln", "Händchen halten",
"Kopfnicken" oder "Verneigen" sind einige dieser
Standardgesten, deren besondere Kompatibilität mit
physiologisch-anatomischen Voraussetzungen des menschlichen Organismus
dafür sorgt, dass sie in praktisch allen Kulturen vorkommen und überall
für eine grosse Vielfalt verschiedener Ausdrucksfunktionen Verwendung
finden (Morris/Marsh/Shaughnessy 1979; Kendon 1983: 35, Ekman/Friesen
1971).
Nur im Lichte des Gesamtkontexts einer sozialen Beziehung oder
situativen Bedingungskonstellation wird beispielsweise zweifelsfrei
deutlich, ob ein lang ausgehaltener wechselseitiger Blick als Ausdruck
inniger Liebe, als Artikulation einer dringenden Bitte, als bedrohliche
Ankündigung bevorstehender Aggressionsakte oder als erfolgreiche
Vorverständigung über eine homosexuelle Kontaktnahme gewertet werden
soll: und katastrophale Missverständnisse sind wahrscheinlich, wenn
hinsichtlich dieses umfassenden Interpretationsrahmens diskrepante
Auffassungen bestehen.
Natürlich ist es in der weiten Sphäre subinstitutioneller
Interaktionen häufig der Fall, dass Verhaltensabläufe nicht nur
hinsichtlich der Frage ob es Handlungen seien, sondern auch was für
Handlungen es seien, zwielichtig bleiben. Auch diese Mehrdeutigkeit kann
taktisch benutzt werden, um unverbindliche Initiativen zu eröffnen und
jederzeit zugängliche Rückzugsmöglichkeiten zu wahren: z.B. bei einem
"sphinxhaften Lächeln", das ebensogut als Zeichen für
freundschaftliches Einverständnis wie für mitleidige Verachtung gewertet
werden kann; oder bei einem innig-warmen Händedruck zum Abschied, der
nicht nur tiefes Bedauern über die Trennung, sondern auch die Gewissheit
(bzw. den Entschluss), dass es nicht so bald zu einer Wiederbegegnung
kommen wird, zum Ausdruck bringen kann.
In dem Masse, wie in einem kollokalen Interaktionssystem nonverbale
Kommunikationen vorherrschen, fehlt diesem die Möglichkeit, mit Hilfe
autonomer, endogener Prozesse den genauen Sinn der ausgetauschten
Kommunikationsakte zu spezifizieren: vor allem weil es im Gegensatz zur
verbalen Ebene nicht möglich ist, zur Verständigung über diesen Sinn
metakommunikative Prozesse stattfinden zu lassen.
Mit andern Worten: Kollokalsysteme bezahlen die genannten
Leistungsvorteile gestischer Kommunikationen teuer damit, dass sie an
Autonomie verlieren und auf den Import von Deutungsmustern angewiesen
sind, die ausserhalb ihrer selbst (z.B. auf der alokalen Ebene
gesellschaftlicher Institutionen) festgelegt worden sind. Je
undifferenzierter und intrinsisch vieldeutiger die Körpergebärden, desto
grösser ist der Bedarf an derartigen exogenen Selektionshilfen, um ihren
präzisen Sinn im Interaktionssystem zu fixieren und intersubjektiv zu
stabilisieren. Dies trifft in besonders hohem Masse für
Körperberührungen zu, die für den Rezipienten mit physischem Schmerz
und/oder einer Verletzung seiner Intimsphäre verbunden sind und deshalb
Gefühle der Bedrohung und Furcht auslösen, wenn nicht genau feststeht,
wie sie gemeint sind und welchen voraussehbaren Beschränkungen (in der
Intensität, Zeitdauer, Häufigkeit u.a.) sie unterliegen.
So ist es verständlich, dass Ärzte, Tanzlehrer, Physiotherapeuten,
Massschneider oder Polizisten ihre berufsnotwendigen Körperberührungen
meist innerhalb eines relativ scharf segregierten Situationskontexts
vollziehen, bei dem schon durch die Wahl der Örtlichkeit, die
instrumentale Ausstattung der Behandlungsräume, durch die Berufskleidung
und mannigfache andere Rahmenbedingungen der Interaktion jeder Zweifel
daran ausgeschlossen ist, dass eine rein funktional-professionelle, auf
die Lösung einer spezifischen Einzelproblematik ausgerichtete (und
deshalb transitorische) Sozialbeziehung besteht (vgl. Heslin/Alper 1983).
Und äusserst ritualisierte Schemata von "Takt" und
"Höflichkeit" müssen in Anspruch genommen werden, um
sicherzustellen, dass begrüssende Umarmungen oder Abschiedsküsse keine
sexuellen Konnotationen mehr enthalten oder auch nur als Ausdruck einer
innigen persönlichen Freundschaft gewertet werden (Heslin/Alper 1983).
Am Beispiel taktiler Körperkontakte wird auch am besten deutlich, dass
diese exogenen Situationsdefinitionen und Interpretationsmuster keineswegs
nur als kognitive Orientierungsschemata (d.h. zur Präzisierung bestimmter
Sinndeutungen) benötigt werden, sondern auch als normative
Motivationsfaktoren, denen die Kraft zukommen muss, gewisse emotionale und
verhaltensmässige "Spontanreaktionen", die teilweise wohl
biologisch mitgeprägt sind, zu neutralisieren.
Die Existenz derartiger "vornormativer" Elementarreaktionen
erscheint naheliegend auf Grund des empirischen Befundes, dass nur
Männer, nicht aber Frauen die Berührung einer ihnen wenig bekannten
Person des anderen Geschlechtes als lustvoll empfinden, und dass taktile
Kontakte unter Männern - unabhängig vom wechselseitigen
Bekanntschaftsgrad - als unangenehm empfunden werden (vgl. Heslin/Alper
1983).
Während verbale Äusserungen vom psychischen oder gar physiologischen
Apparat ihres Erzeugers her derart wenig präformiert sind, dass ihr Sinn
rein konventionell festgelegt werden kann (und sie ausserhalb solcher
Konventionen keinerlei Sinn besitzen), so muss sich der konventionelle
Sinngehalt nonverbaler Verhaltensweisen häufig gegen den Widerstand
elementarerer Deutungs- und Reaktionsweisen durchsetzen, die sich -
entweder auf Grund ihrer biologischen Prägung oder ihrer traditionalen
Habitualisierung - einer zweckgerichteten, absichtsvollen Umformung
entziehen.
Entsprechend muss ein höheres Mass an Sozialisation und Dauerdisziplin
aufgewendet werden, um nonverbale Verhaltensweisen aus derartigen
Primärbindungen zu befreien und für zusätzliche Sinndeutungen (deren
Mannigfaltigkeit und Variabilität sich korrelativ zur gesellschaftlichen
Gesamtdifferenzierung erhöht) verfügbar zu machen.
2.2.5
Verbale Kommunikation
I
Unter "kollokaler
Verbalkommunikation" sollen in erster Linie Gespräche unter
mitanwesenden Interaktionspartnern verstanden werden; in einem weiteren
Sinne aber alle sprachlichen Ausdruckskundgaben, die Individuen in
(wahrgenommener) Hör- und Sichtweite anderer vollziehen: z.B. indem sie
laute Selbstgespräche führen, Vorträge oder Lesungen abhalten oder bei
ihren Aesserungen in einem Telephongespräch auf zufällige Zuhörer im
selben Raume Rücksicht nehmen.
Unabhängig
von der genaueren Art der situativen Bedingungen oder subjektiven
Intentionen sind mit dem mündlichen Sprachgebrauch spezifische
sozio-strukturelle Formungen, funktionale Leistungskapazitäten und
Folgeprobleme verknüpft, die in der ausgesprochen hohen Variationsfähigkeit,
Intentionalität und Präzisierbarkeit sowie in den rigiden
Sequentialisierungszwängen des verbalen Mediums ihre Ursachen haben.
Diese
Gesetzmässigkeiten der kollokalen Rede werden am besten erkennbar, wenn man
sie als eine vierte, nicht nur im metaphorischen Sinne "höchste"
Ebene kommunikativer Verständigung begreift, die die Ausdruckspotentiale
der drei bisher diskutierten Medien bei weitem transzendiert, andererseits
aber vielfältige Bindungen an sie aufrechterhält, durch die sie sich z.B.
vom telephonischen oder schriftlichen Sprachgebrauch unterscheidet.
Das
Theorem der "einseitigen Fundierung" (vgl. 2.2.1) besagt, dass
alle nicht-verbalen Medien der Kommunikation unabhängig von der
sprachlichen Ebene funktionsfähig sind, während die Sprache andererseits
sie alle voraussetzt und sich nur auf ihrer Basis und mittels ihrer
konstituierenden Mitwirkung aktualisiert.
So
lassen sich einerseits sehr häufig völlig "sprachlose"
Kollokalverhältnisse finden, wo sich die Teilnehmer im Medium ihrer
physischen Anwesenheit und äusseren Erscheinung begegnen und sich
ausschliesslich mittels gestischer Kundgaben verständigen: z.B. im Strassenverkehr,
wo verbale Kommunikationen aus technischen und zeitlichen Gründen meist
unterbleiben, oder bei gut eingespielten Fussballmannschaften
oder Operationsteams, die nur in völlig
stummer Kooperation ihre maximale Reaktionsfähigkeit und Effizienz
erreichen.
Während
die nonverbalen interpersonellen Verhaltensabläufe und Wahrnehmungen fast
voraussetzungsfrei - und deshalb äusserst kontinuierlich, kaum bemerkt und
nur schwer kontrollierbar - immer weiter laufen und dem Kollokalsystem eine
verlässliche, nur durch simples Weggehen zerstörbare Integrationsbasis
verleihen, so bildet die Sphäre verbaler Kommunikation einen
vergleichsweise schmalbrüstigen und zerbrechlichen "Ueberbau",
der sich nur intermittierend auf Grund besonderer Aufmerksamkeits- und
Koordinationsleistungen der Mitglieder aus dem Dauerstrom nicht-verbaler
Kundgaben erhebt und auch dann oft nur einen Teil aller Anwesenden in sich
schliesst (vgl. Goffman 1969:14).
Andererseits
ist es eben nicht denkbar, unter Bedingungen der Kollokalität ein rein verbales Interaktionssystem zu finden, dessen Mitglieder ausser Redeäusserungen keine
anderen irgendwie als informativ aufgefassten Wahrnehmungen ihrer Person
aussenden würden, denn
-
bevor sie sprechen, haben
sie sich wechselseitig bereits als Personen aufgefasst, die in diesem Moment
am selben Ort anwesend sind, auf bestimmte Weise körperlich gebaut und
gekleidet sind, auf spezifische Art gehen, stehen oder sitzen und ihre
Zuwendung zueinander durch Bewegungen des Kopfes, Handbewegungen, Blicke
u.a. zum Ausdruck bringen
-
während sie
sprechen, können sie nicht anders, als ihre Rede im Medium spezifischer
nicht-verbaler Verhaltensfärbungen zum Ausdruck zu bringen: Vom Tonfall der
Stimme über die Allokation von Akzentuierungen und Sprechpausen bis zur
dauernd lebendigen Mimik und Gliedergestik spannt sich der Bogen
unvermeidlicher begleitender Ausdrucksweisen, die den sprachlichen
Kommunikationsfluss dauernd
begleiten und ihren Sinngehalt teils zusätzlich betonen, präzisieren oder
komplementär ergänzen, teils abschwächen und auf
schillernd-verunsichernde Weise mit ihm kontrastieren.
In
jedem Falle werden kollokale Sprecher einander eine insgesamt komplexere,
wegen ihrer Mehrdimensionalität schwerer in ein konsistentes Gesamtbild zu
integrierende Informationsfülle zukommen lassen als Telephonpartner,
die einander höchstens einige akustisch wahrnehmbare Begleitkorrelate
vermitteln, oder gar Briefeschreiber, deren
Adressaten den gesamten Sinngehalt der Botschaft aus den expliziten verbalen
Formulierungen zu entschlüsseln haben.
So
muss beispielsweise jeder Vortragsredner mit der Tatsache umgehen, dass er
seinem Publikum unvermeidlicherweise mehr von sich mitteilt, als den von ihm
verfassten und verlesenen Text (Goffman 1981: 162ff); und er muss deshalb
versuchen, auch diesen zusätzlichen, ihm selbst vielleicht am
allerwenigsten bewussten Strom von Ausdruckskundgaben in intentionale Bahnen
zu lenken. Und wer immer in heiklen und emotionalisierten Angelegenheiten
die mündliche Unterredung dem Briefschreiben vorzieht, muss damit rechnen,
gleichzeitig mit dem Sinn seiner Rede auch den sie motivierenden inneren
Erregungszustand zum Ausdruck zu bringen.
Vielleicht
lässt sich dem zwiespältige Charakter der mündlichen Rede am besten
dadurch Rechnung tragen, dass man sie als ein Interferenzphänomen zwischen
einem digitalen Kommunikationsmedium (Sprache) und mehreren
"analogen" Medien (persönliche Erscheinung, Gestik u.a.)
konzeptualisiert:
1)
Unter dem Aspekt, dass etwas gesagt wird, erscheint die gesprochene Rede als
Anwendungsfall eines konventionellen
sprachlichen Codes. Der
digitale Charakter dieses Mediums ist allerdings nur bei schriftlichen
Aeusserungen unverfälscht sichtbar, deren Sinngehalt sich vollständig aus
der Wahl oder Nichtwahl bestimmter Buchstabenreihungen, Wörter, Sätze u.a.
ergibt, ohne dass die Art der Drucktype, die Fleckenhaftigkeit des Papiers
etc. diesen Sinn im mindesten mitbeeinflussen würden.
Auch die mündliche Rede erhält durch den Sprachcode einen "lokutionären
Kerngehalt an Sinn", der allein auf etablierten Sprachregelungen und
-bedeutungen beruht und durch alle spezifischen Weisen der Aussprache und
Begleitgestik hindurch persistiert.
2)
Unter dem Gesichtspunkt, wie etwas gesagt wird, kann man die mündliche Rede als jene
spezifische Form sprachlicher Kommunikation identifizieren, die im Gegensatz
zur Schrift auf analogen (d.h.
kontinuierlich-variablen) Trägermedien beruht: z.B. auf der Art der Stimmführung
oder der begleitenden Gesichtsmimik, mit deren subtilen Ausprägungen das
Gemeinte und das Verstandene je nach der Differenziertheit des Ausdrucks-
und des Wahrnehmungsvermögens kovariiert (Kendon 1981: 3f, Knapp 1983).
Für
den einzelnen Sprecher entsteht aus diesem Nebeneinander zweier teils
substitutiver, teils komplementärer Medien ein reiches Arsenal kombinierter
Enkodierungsmöglichkeiten, denen allerdings auch entsprechend
differenzierte Dekodierungsfähigkeiten seitens der Rezipienten gegenüberstehen
müssen.
Die
partielle Substitutivität (d.h.
funktionale Aequivalenz) beider Medien eröffnet die Chance, sie
wechselseitig von allzu hoher Informationsfracht zu entlasten: z.B. indem
das Vorzeigen der Armbanduhr die
verbale Zeitangabe oder das modellhafte Vormachen einer Arbeitshandlung ausführliche Erläuterungen
ersetzt, oder indem der genauen Wortwahl und Satzformulierung weniger als im
Schriftverkehr Beachtung geschenkt werden muss, weil Intonation
der Stimme und begleitende Gesten
den gemeinten Sinn ohren- und augenfällig machen (vgl. Goffman, 1981: 190).
Genauso mag ein verbales Liebesgeständnis
ein Pärchen davon entlasten, die Intensität der Beziehung allein auf dem
Wege inniger Gesten zum Ausdruck zu bringen: ähnlich wie der
wortreich-monologisierende Schauspieler weniger leibliche Kundgaben als der
Pantomime benötigt, und der Vortragsredner durch blosse Sprechpausen jene Zäsuren
deutlich machen kann, die im schriftlichen Text durch explizite
Titelgliederungen bezeichnet werden müssen.
Und
die komplementären Funktionsmerkmale beider Kommunikationsebenen bieten
sich für eine Differenzierung des Uebermittlungsprozesses in dem Sinne an,
dass die konventionelleren und expliziter kodierbaren Aspekte einer
Botschaft ins verbale Medium eingekleidet werden und die personengebundenen,
nur diffus ausdrückbaren oder absichtlich in ungewisser Schwebe gehaltenen
Komponenten in der nicht-verbalen Sphäre verbleiben.
Vor
allem kommt den gestisch-mimischen und akustischen Begleitkundgaben sehr häufig
die Aufgabe zu, simultan mit der lokutionären Botschaft metakommunikative
Informationen über ihre illokutionäre Zielrichtung mitzuliefern: z.B. wenn
die Ernsthaftigkeit einer Mahnung im gemessenen oder schneidenden Charakter
der Stimmführung ihre Unterstützung findet, hinter der geäusserten Bitte
ein verzweiflungsvoller Hilfeschrei durchschimmert oder wenn
heiter-schmunzelnde Untertöne die Ironie in einer - an sich völlig
sachneutral formulierten - Aeusserung deutlich machen.
Einer der -
wenig thematisierten - unbestrittenen Vorzüge "persönlicher
Begegnungen" gegenüber fernmündlichem oder schriftlichem Verkehr
liegt ohne Zweifel darin, dass derartige illokutionäre Spezifikationen
-
simultan mit der verbalen Aeusserung geliefert werden, während sie
z.B. bei Briefen dem Referenztext (als metakommunikative
Verbalexplikationen) vor-, zwischen- oder nachgestellt werden müssen;
-
mit Hilfe eines überaus reichen Arsenals beliebig abstufbarer
Ausdrucksweisen kommunizierbar sind, während im Sprachcode dafür nur
wenige, relativ standardisierte Formeln zur Verfügung stehen;
-
im Interesse der Offenheit und Flexibilität des Gesprächsfortgangs
relativ unverbindlich und in ihrer Bedeutung unbestimmt gehalten werden können:
während Schriftlichkeit den Zwang in sich schliesst, sich explizit und
irreversibel festzulegen und dem Emittenten die Rückzugsmöglichkeit
entzieht, "es in Wirklichkeit nicht so gemeint zu haben." (vgl.
Kendon 1981:13f; Luhmann 1972).
Zu
den häufigsten und unentbehrlichsten illokutionären Begleitgesten des mü |