UNIVERSITY OF ZURICH - INSTITUTE OF SOCIOLOGY
 

Prof. Hans Geser 

Elementare soziale Wahrnehmungen
und Interaktionen

Ein theoretischer Integrationsversuch

(29 Dezember 1996)

ZWEITES KAPITEL

DIE KOMPLEXE MEHREBENENSTRUKTUR KOLLOKALER INTERAKTIONE

 

2.2 Vier komplementäre Ebenen sinnhafter Kommunikation

 

2.2.1 Zur Hierarchie der vier Kommunikationsebenen

Nichts wäre verfehlter als das reduktionistische Vorurteil, dass man bei der Analyse kollokaler Sozialbeziehungen gewissermassen auf die einfachsten Elementarbausteine der sozialen Welt stossen könnte, aus deren Kombinationen und Abwandlungen dann alle die komplexeren Erscheinungen (Gruppen, Organisationen, Institutionen, Gesellschaften) konstruierbar seien. Vielmehr findet man gerade in dieser urtümlichsten und alltäglichsten, universellsten und voraussetzungslosesten Sphäre menschlicher Sozialität besonders vielschichtige strukturelle Aufbauprinzipien vor: weil die verschiedenen Ebenen physischer, senso-motorischer, sinnhafter und sprachlicher Wechselwirkungen weniger als anderswo voneinander ausdifferenziert und verselbständigt sind, sondern sich auf diffuse Weise wechselseitig durchdringen.

Konkret bedeutet dies, dass sich die sinnhaften und kommunikativen Verhältnisse anwesender Personen niemals nur im Austausch intentionaler Handlungen oder Sprechakte erschöpfen: weil jede in der Lage ist, auch die physische Körperlichkeit, die biologischen Bedürfnisse oder die unwillkürlichen senso-motorischen Verhaltensweisen der anderen sinnhaft zu erleben und sprachlich zu thematisieren. Und weil jeder Teilnehmer weiss, dass dies wechselseitig geschieht, werden alle versuchen, durch selektive Manipulation ihrer rein physischen Kundgaben auf ihre Partner gewisse Wirkungen zu erzielen und ihnen bestimmte Mitteilungen zukommen zu lassen, welche die Kommunikationen auf höheren Ebenen teils unterstützen, teils abschwächen oder gar konterkarieren.

Charakteristisch für Kollokalität ist deshalb, dass gleichzeitig mehrere, völlig verschiedenartige Trägermedien für teils intentional gesendete, teils unabsichtlich emittierte, immer aber sinnhaft dekodierbare Kundgaben zur Verfügung stehen. Im Sinne der vorhin (vgl. 2.1) explizierten theoretischen Prinzipien ist ihr Verhältnis zueinander derart, dass jedes niedrigere Medium als notwendige Ausgangsbasis für alle "höheren" fungiert, und dass mit zunehmender "Höhe" des benutzten Kanals

  1. immer komplexere und variablere Botschaften gesendet werden können,
  2. die Enkodierungs- und Dekodierungsprozesse besser kontrollierbar und intentional gestaltbar werden,
  3. die "Temporalisierung" zunimmt: so dass Übermittlungsprozesse mehr Zeit beanspruchen und dem Selektivitätsdruck der Zeitknappheit unterliegen.
Im Minimum ist es notwendig, die folgenden vier Niveaus sinnhaften Ausdruckhandelns und Erlebens voneinander zu unterscheiden, die für den soziologischen Beobachter in Termini relativ objektiver Unterscheidungsmerkmale identifizierbar sind und aus demselben Grund auch von den sozialen Akteuren selbst als voneinander differenzierte Ebenen interpersoneller Erfahrung wahrgenommen werden:
  1. "Anwesenheit": Das wechselseitig evidente Faktum des räumlichen Hierseins einer Person in ihrer physischen Körperlichkeit ist der generellste, fundamentalste Ausgangspunkt für alle spezifischere interpersonelle Erfahrung, Interaktion oder Kommunikation. Als undifferenziertestes individuelles "Basisverhalten" ist der Ausdruckswert schieren Anwesendseins normalerweise derart gering, dass der "subjektive Sinn", den der Anwesende damit verbindet, meist nur in einem grösseren Horizont von Situationsbedingungen und Verhaltenserwartungen. erschlossen werden kann.
  2. "Persönliche Erscheinung": Sie umfasst alle an der physischen Körperlichkeit festgemachten, zumindest im aktuellen Interaktionskontext relativ invarianten Merkmale (Hautfarbe, Geschlecht, Gesichtszüge, Haltung, Frisur, Kleidung u.a.), mit denen ein Individuum den Mitanwesenden ein teils absichtlich manipuliertes, teils nicht manipulierbares Simultanbild seiner Persönlichkeit vermittelt. Setzt sie einerseits "Anwesenheit" voraus, so fungiert sie selber wieder als der Boden, aus dem alle variableren Kundgaben (Gestik, Sprechakte) herauswachsen und ihre spezifische Deutung gewinnen.
  3. "Gestik": bildet den zusammenfassenden Ausdruck für alle variablen Verhaltenskundgaben, wie sie einerseits bei intentionalen Akten nichtverbaler Kommunikation, andererseits aber genauso als unbeabsichtigte Begleiterscheinungen senso-motorischer Abläufe oder Handlungsvorgänge auftreten und dank ihrer objektiven Wahrnehmbarkeit als Symptome für innere Gefühlszustände, Motivationen, Fähigkeiten oder Absichten eines andern Subjekts fungieren.
  4. "Sprache": umfasst die Gesamtheit akustischer Äusserungen, die im Medium eines konventionellen Codes der Laut-, Wort- und Satzbildung enkodiert sind und durch Benutzung desselben Codes dekodiert werden müssen. Es ist die Kommunikationsebene mit der höchsten Kapazität für intentionale Steuerung und mit dem grössten Reichtum an inhaltlichen Spezifizierungen, aber andererseits auch mit den restriktivsten Anforderungen an sachliche Selektivität, soziale Kontrolle und zeitliche Sequentialisierung.


In der Terminologie von Ruesch/Kees wären "Anwesenheit" und "persönliche Erscheinung" dem Niveau der "object language" (zu der auch Wohnungseinrichtungen, Schmuckstücke und andere Ausdrucksgegenstände gehören) zuzurechnen, während der Begriff der "Gestik" weit genug gespannt sein soll, um alle mit dem Konzept der "action language" bezeichneten kommunikativen Verhaltensäusserungen zu umfassen. Die verbale Kommunikationsebene schliesslich koinzidiert mit dem Niveau der "sign language", die alle durch konventionell festgelegte Symbole konstituierten Sinnbedeutungen umfasst (vgl. Ruesch/Kees 1956; Kendon 1981: 5gff).

Vom kollokalen Sozialsystem aus gesehen bilden die beiden unteren Ebenen ("Anwesenheit" und "äussere Erscheinung") dank ihrer geringen Variabilität und Differenzierbarkeit in erster Linie Quellen systemischer Integration und Grundlagen struktureller Stabilisierung. Die beiden "höheren" Ebenen dagegen sind genau konträr dazu Quellen der Differenzierung und der prozessualen Dynamik, mit deren Hilfe sich das Sozialsystem zur Umwelt hin öffnen und seine inneren Zustände in dauernder Bewegung halten kann. Diese potenzierte Spannweite zwischen stabilen und labilen, strukturellen und prozessualen, integrativen und adaptiven Systemkomponenten ist wahrscheinlich der entscheidende Vorzug kollokaler Sozialsysteme, aus dem sich ihr universelles Vorkommen und ihre funktionale Unentbehrlichkeit (selbst in ausgeprägt alokalen oder translokalen Systembildungen (vgl. Kap. 1) erklärt.
 
 

2.2.2. "Anwesenheit"

Viele soziale Systeme stützen sich auf irgendein materielles Trägermedium ab, um zumindest ihrer Existenz, meist aber auch ihrer Reichweite und besonderen Identität, einen objektiv sichtbaren, für Mitglieder und Aussenstehende gleichermassen evidenten Ausdruck zu verleihen.

So erhalten Staaten durch ihr Territorium, Kirchen durch ihre Gotteshäuser, Städte durch ihre architektonische "sky line", Familienhaushalte durch ihr Eigenheim, transitorische "Miteinanders" durch gemeinsam in Beschlag genommene Tische, Bänke u.a. ihre Verankerung in der physischen Welt: also durch Inanspruchnahme materieller Substrate, die praktisch voraussetzungslos (d.h. ohne besondere Qualifikationen und Aktivitäten seitens der Emittenten und Rezipienten) wahrnehmbar sind, im Zeitablauf invariant bleiben und unabhängig vom Wechsel der beteiligten Personen und von Wandlungen sozialer Strukturen und kultureller Muster dieselbe Bedeutung und Integrationskraft beibehalten (vgl. z.B. Simmel, 1908a: 474).

Mit diesem Höchstmass an zeitlicher, sozialer und sachlicher Generalisierung unterscheiden sich physische Substrate von symbolischen Trägermedien, die immer nur in Termini spezifischer Inhalte konstituiert sind und die Identität des Sozialsystems deshalb untrennbar an die Aufrechterhaltung besonderer Fixierungen (Normen, Zielsetzungen, Wertorientierungen u.a.) binden.

Beispiele dafür wären Schriftdokumente (Verfassungen, Statuten, "charters" u.a.), durch die formale Organisationen eine von physischen Bindungen zwar unabhängige, dafür aber inhaltlich festgelegte und den strukturellen und kulturellen Variationsspielraum einengende Identität zugewiesen erhalten, oder konsensuale subjektive Identifikationen (z.B. über gemeinsame Zugehörigkeit zu politischen Gesinnungsgruppen, Nationalitäten, Klassen, sozialen Bewegungen u.a.) die immer von labilen innerpsychischen Vorgängen abhängig bleiben. Dementsprechend sind vor allem jene Sozialsysteme auf physische Substrate als Garanten ihrer Identität angewiesen, die infolge hoher Fluktuationen und Unberechenbarkeiten ihrer Umwelten und/oder Binnenverhältnisse gezwungen sind, ihre Existenz auf einer von konkreten Werten, Zwecken, Handlungsweisen oder Organisationsformen unabhängigen Grundlage festzumachen: z.B. stationäre Lebensgemeinschaften oder Siedlungsagglomerate (Dörfer und Städte), denen die Dauerhaftigkeit und sinnliche Prägnanz ihrer architektonischen Strukturen dazu verhilft, ihre Identität über beliebig wechselnde Mitgliederzusammensetzungen, Zwecksetzungen, Interaktionsprozesse, Konfliktsituationen oder politische Machtverhältnisse hinweg aufrechtzuerhalten.

Die folgenreiche Besonderheit kollokaler Sozialsysteme besteht nun darin, dass sie konkrete, körperlich anwesende menschliche Personen als ihr basales physisches Trägermedium benutzen: so dass sie einerseits von andern physischen Medien (Territorien, Gebäuden u.a.) und andererseits von symbolisch-kulturellen Identitätsträgern (Zielsetzungen, Ideologien u.a.) relativ unabhängig werden.

Zwar trifft es nicht nur manchmal, sondern im typischen Normalfalle zu, dass "Anwesenheit" mit andern konstituierenden Medien sozialer Zugehörigkeit koinzidiert: z.B. wenn formale Mitglieder derselben Organisation im vorbestimmten Büroraum miteinander regelmässig kooperieren, Familienmitglieder am gemeinsamen Wohnsitz miteinander interagieren, oder wenn sich freiwillige Anhänger einer sozialen Bewegung zur gemeinsamen Kundgebung treffen. In allen diesen Fällen aber gilt, dass das wechselseitig konstatierte Faktum, physisch im selben Raum anwesend und deshalb kommunikativ erreichbar zu sein, als notwendige Ausgangsbasis für jeder kollokale Systembildung fungiert, oder vielleicht besser: dass erst dadurch jene niedrigste, undifferenzierteste, evidenteste, konsensualste und generellste Ebene der Assoziierung konstituiert ist, an der selektivere und variablere Sozialbeziehungen erst anknüpfen können.

Auf Grund der Tatsache, dass auch menschliche Personen physische Objekte sind, sind einige funktionale Korrelate von "Anwesenheit" durchaus mit den Eigenschaften anderer physischer Substrate der sozialen Systembildung identisch:
 
 Erstens bildet das körperliche Hiersein ein Faktum von unübertrefflicher Objektivität: Alle Beteiligten können praktisch voraussetzungsfrei und völlig evidenterweise zum gemeinsamen Schluss gelangen, dass sie selbst und die andern anwesend sind, und alle wissen zweifelsfrei, dass alle anderen dies zweifelsfrei wissen.

Zweitens sind alle Individuen unter dem Gesichtspunkt ihrer Anwesenheit betrachtet auf fundamentale Weise gleich, denn jeder Mensch ist allein dadurch, dass er existiert, mit einer Vielzahl von identischen physikalischen und biologischen Körpereigenschaften ausgestattet und trägt diese Körperlichkeit als sein invariantestes, unmanipulierbarstes, nur durch seinen Tod eliminierbares Merkmal mit sich herum. Trotz kontinuierlicher Variabilität räumlicher Distanzen findet auf "natürliche" Weise eine relativ scharfe taxonomische Differenzierung der Menschheit in "Anwesende" und in "Abwesende" statt: eine Dichotomisierung, die z.B. von formalen Organisationen mit ihrer Unterscheidung zwischen "Mitgliedern" und "Nicht-Mitgliedern" auf viel anspruchsvollere Weise artifiziell hergestellt und mit Hilfe spezieller Arrangements (Eintrittsprozeduren, Registrationen u.a.) aufrechterhalten werden muss. Im gemeinsamen Gegensatz dazu stehen all jene nicht-kollokalen informellen Kollektive, die variable Ausprägungen subjektiv empfundener und intersubjektiv anerkannter "Zugehörigkeit" erlauben (Gesinnungsgruppen, soziale Schichten, Parteisympathisanten u.s.w.) zulassen und dementsprechend nicht in der Lage sind, ihre Grenzen autonom zu definieren.

Drittens stellt "Anwesenheit" stellt eine für sich ausdifferenzierbare, völlig inhaltsfrei konstituierte Rahmenbedingung für soziale Interaktion und Strukturbildung dar, dank der Kollokalsysteme eine jenseits aller spezifischen Themen, Zielsetzungen, Aktivitäten u.a. stabilisierbare, "infrastrukturelle" Integrationsbasis erhalten. Daraus beziehen sie eine potentiell unbegrenzte, z.B. in Beziehungen lebenslanger Partnerschaft oder Hausgemeinschaft arg strapazierte Elastizität.
Demgegenüber sind translokale Beziehungen (z.B. via Telephon oder Briefwechsel) dadurch ausgezeichnet sind, dass sie ohne diese generalisierte Basisebene immer gleich auf dem Niveau inhaltlich spezifischer symbolischer Kommunikation einsetzen müssen.
 

Insofern nun aber die physischen Objekte menschliche Personen sind, sind mit "Anwesenheit" als Strukturbildungsprinzip andererseits einige Schranken und Risiken verbunden, die es als universelles Medium der Systemintegration - im Vergleich zu Territorien oder Gebäuden - weniger geeignet machen:

  1. Die soziale Generalisierbarkeit ist gering, weil es häufig nicht substituierbare partikuläre Personen sind, deren Anwesenheit die besondere Identität des jeweiligen Sozialsystems garantiert.
  2. Die zeitliche Generalisierbarkeit ist beschränkt, weil jedes Mitglied durch Wegbleiben oder Weggehen jederzeit die Möglichkeit hat, die Struktur des Sozialsystems zu modifizieren oder gar seine Auflösung herbeizuführen.
Zu einer Quelle der Unsicherheit und Systemgefährdung wird die "Anwesenheit" vor allem in dem Masse, als sie als eine absichtliche Handlung aufgefasst wird, die in einem Horizont verschiedener Alternativen ausgewählt wurde und durch freien Willen diskontinuiert werden kann (bzw. könnte). Genau im selben Masse wird die "Anwesenheit" andererseits aber auch zu einer kommunikativen Kundgabe, die sich zum Ausdruck bestimmter - allerdings diffus bleibender und ungerichtet emittierter - Mitteilungsakte eignet.

Der Handlungscharakter von Anwesenheiten ist nun aber äusserst variabel und kann überdies leicht strittig und unentscheidbar bleiben, weil die selbstreferentiellen Auffassungen des Akteurs mit den Perspektiven seiner Interaktionspartner (und diese wiederum mit den Deutungen externer, z.B. sozialwissenschaftlicher, Beobachter) - keineswegs übereinzustimmen brauchen.

So wird dem Kleinkind der Aufenthalt in seiner Familie kaum als freiwillige, kontingente Handlung zugerechnet werden; und mein zufälliger Kabinengenosse auf der Schiffsreise ist höchstens insofern "freiwillig" in meiner Nähe, als er es unterlassen hat, aus Abneigung gegen mich um eine andere Koje nachzusuchen.

Unstrittigen Handlungscharakter aber haben jene Anwesenheiten, die auf expliziten vorgängigen Vereinbarungen beruhen (Besuche, Rendez-vous, Vertragsgespräche u.a.), und/oder zu deren Zustandekommen besondere Ortsveränderungen (Reisen u.a.) notwendig waren.

Physische Anwesenheit wird rasch zu einem knappen Gut, wenn Individuen wegen vielseitiger sozialer Inanspruchnahmen, Rollenverpflichtungen und Mitgliedschaften genötigt sind, sich simultan oder in rascher Folge an verschiedenen Orten aufzuhalten.

In dem Masse, wie diese Verknappung nicht durch intensivere Lokomotionen (z.B. durch schnelle Autofahrten, Flugreisen u.a.) gemildert werden kann, muss sie durch eine verstärkte Selektivität in der Auswahl der Örtlichkeiten und/oder eine intensivere Ökonomisierung des Zeitbudgets bewältigt werden: so dass räumliche Aufenthalte zunehmend den Charakter intentionaler, kontingenter Entscheidungshandlungen gewinnen.

So müssen moderne Individuen mit wachsender Differenzierung ihres Rollensets immer mehr mit der Tatsache zurechtkommen, dass ihnen sowohl die Orte ihrer An- und Abwesenheit wie die jedem Aufenthalt gewidmeten Zeitspannen als absichtsvolle, häufig gar begründungsbedürftige Handlungen zugerechnet werden.

Das "Anwesenheitsmanagement" wird vor allem für vielbeschäftigte Elitepersonen (bzw. ihre agendaführenden Sekretärinnen) zu einem ständig akuten Problem: aber auch zur permanenten Chance, allein durch den Akt ihres Erscheinens, Nichterscheinens oder Weggehens an bestimmten Orten und zu gewissen Zeiten Ausdruckshandlungen mit klar verständlichem Symbolgehalt zu vollziehen.
So kann ein Generaldirektor allein durch häufiges Herumgehen im Betrieb sein generelles Interesse für die Belegschaft und die konkreten Fabrikationsabläufe so überzeugend bekunden, dass seine spezifischen Aeusserungen während des Umgangs (Fragen, Aufmunterungen, Lobzuweisungen u.a.) vergleichsweise zweitrangig sind; und jeder Minister kann durch die Wahl der von ihm besuchten Verbandstagungen, Messeeröffnungen u.a. politische Bewertungen ausdrücken und Signale setzen, die weitherum verstanden werden. Umgekehrt können "graue Eminenzen" auf den Verlauf formeller Entscheidungsprozesse in dem Masse Einfluss nehmen, als man ihre Abwesenheit als kontingent ansieht und jederzeit damit gerechnet werden muss, dass sie bei einem für sie ungünstigen Verlauf der Dinge "persönlich intervenieren".

In hochdifferenzierten urbanen Gesellschaften wird praktisch jedermann dazu neigen, seine An- und Abwesenheiten nicht nur auf Grund seiner subjektiven  Präferenzen, sondern auch unter dem Gesichtspunkt festzulegen, welche kommunikativen Kundgaben darin mitimpliziert sind und wie andere voraussichtlich darauf reagieren.

Jeder Student kann seinem Professor allein durch regelmässigen Besuch der Vorlesung auffälliges Interesse bekunden, weil diese dauernde Anwesenheit angesichts der Vielfalt alternativer Studienbeschäftigungen nicht selbstverständlich ist; durch dauernde Tagespräsenz im Haushalt drückt eine moderne, von Emanzipationsideen durchdrungene Ehefrau unweigerlich aus, dass sie im Interesse ihrer Familie bereit ist, auf eine Berufsarbeit zu verzichten; und jedermann kann durch Pünktlichkeit seine Treffpartner davon überzeugen, dass er die Zusammenkunft für hinreichend wichtig ansieht und dass er über genügend Selbstdisziplin verfügt, um diese Bewertung in seinem Verhalten zum Ausdruck zu bringen.

Der Ausdruckswert von Anwesenheit kann artifiziell gesteigert werden, wenn es gelingt, andere von der Vielfältigkeit konkurrierender Einladungen und Anwesenheitspflichten etc. zu überzeugen: so dass z.B. das Erscheinen zu einer Einladung selbst dann als Kundgabe besonderen Interesses und Wohlwollens für den Gastgeber erscheint, wenn man beim besten Willen nicht wusste, wie man den freien Abend sonst hätte gestalten sollen.

So mögen hochrangige Personen sich zum Teil deshalb als vielbeschäftigt, ja "chronisch überlastet" darstellen, weil dieser Mythos ihnen die willkommene Möglichkeit gibt, nicht nur alle Abwesenheiten zu entschuldigen, sondern jede Anwesenheit als einen höchst selektiven Akt darzustellen, der z.B. einen besonderen Respekt gegenüber einer Person oder ein überdurchschnittliches Interesse für eine Veranstaltung bekundet. Wer nicht durch den anspruchslosen Akt des blossen "Hierseins" in der Lage ist, hinlänglich deutliche und verständliche Mitteilungen auszudrücken, sieht sich stärker damit belastet, die ungleich anstrengenderen Ausdrucksebenen der "persönlichen Erscheinung", des Verhaltens oder des Gesprächs als Trägermedien intentionaler Kundgaben zu benutzen.

Die fundamentale Bedeutung "gemeinsamer Anwesenheit" für die Basisintegration sozialer Systeme entsteht aus der doppelten Tatsache, dass die "Befindlichkeit im selben Raumabschnitt"

  1. eine elementare Basishandlung darstellt, die von allen Individuen mit normaler motorischer Leistungsfähigkeit praktisch voraussetzungslos erbracht werden kann und die zu ihrer Kontinuierung keine besonderen Fähigkeiten oder Anstrengungen erfordert;
  2. ein der physischen Umwelt zugehöriges objektives Faktum darstellt, das vom Subjekt selbst, seinen Partnern und Beobachtern (normale sensorische Leistungsfähigkeit vorausgesetzt) praktisch voraussetzungslos und auf völlig evidente Weise konsensual wahrgenommen werden kann.
Die anspruchslose Erzeugbarkeit (a) des räumlichen Beisammenseins hat zur Folge, dass "gemeinsame Anwesenheit" als höchst unselektives und  extensives Medium sozialer Kollektivierung wirksam sein kann: weil sich hier unterschiedlichste Individuen im Vollzug einer völlig identischen "Basishandlung" zusammenfinden, die nur im quantitativen Aspekt ihrer zeitlichen Erstreckung variiert werden kann, sich aber sonst in jeder qualitativen Hinsicht als völlig undifferenzierbar erweist. So können manche sozialen Bewegungen oft nur dadurch eine eindrucksvolle Grösse und innere Geschlossenheit demonstrieren, dass sie die Handlungserfordernisse der Teilnehmer streng auf reine Anwesenheiten (z.B. an Demonstrationen, Sternmärschen, Versammlungen, Mahnwachen u.a.) beschränken. Denn sobald darüber hinaus ein spezifischeres und variableres Verhalten gefordert wird, werden die vielfältigen Unterschiede in der Motivation, Qualifikation und bei normativen Orientierungen oder Zielsetzungen verschiedener Teilnehmer deutlich: so dass das Kollektiv schrumpft, in verschiedene Teile auseinanderbricht oder sich intern in Subgruppen mit unterschiedlichen Zielsetzungen und Aktivitätsformen fragmentiert.
 

Die anspruchslose Wahrnehmbarkeit (b) gemeinsamer räumlicher Präsenz bedeutet vor allem, dass "Anwesenheitskontrolle" die verbreitetste, weil mit geringstem Aufwand an individueller Aktivität und sozialer Organisation praktizierbare, Form sozialer Kontrolle darstellt, die ganz besonders in den folgenden zwei Fällen in den Vordergrund tritt:

  1. in mangelhaft organisierten, intern wenig differenzierten sozialen Kollektiven: z.B. in informellen sozialen Bewegungen und  Gesinnungsgruppen, wo die Tatsache, Häufigkeit und Länge der Anwesenheit (an Veranstaltungen u.a.) als einziges Kriterium für die faktische Zugehörigkeit und für den Intensitätsgrad der Teilnahme fungiert;
  2. in Organisationen, die aus sachlichen Gründen über keine operationalen Massstäbe des Verhaltens oder seiner Ergebnisse verfügen: z.B. in öffentlichen Verwaltungen, wo die Anwesenheitskontrolle als Substitut für Leistungsmessungen oder Erfolgsbewertungen Verwendung findet.
Diese Gewinne an Objektivierbarkeit und Quantifizierbarkeit werden aber dadurch teuer bezahlt, dass sich aus dem undifferenzierbaren Faktum physischer Anwesenheit kaum gültige Schlüsse auf intraindividuelle Merkmale (Motivationen, Qualifikationen, Verhaltensneigungen u.a.) oder auf die Qualität interpersoneller Beziehungen  gewinnen lassen. Denn genauso wie die Teilnahme an einer Beerdigungszeremonie nicht als hinreichender Beweis für innige gefühlsmässige Anteilnahme gewertet werden kann, darf aus der überdurchschnittlichen wöchentlichen Aufenthaltsdauer im Amtsbüro nicht zwingend auf eine überragende berufliche Leistungskraft geschlossen werden: und manch regelmässiges Erscheinen an Sitzungen mag allein dadurch motiviert sein, auf möglichst arbeitssparende Weise ein möglichst sichtbares Zeichen von Interesse, Zuverlässigkeit u.a. zu setzen.
 
 

Bei länger andauernder gemeinsamer Anwesenheit werden schliesslich zusätzliche Quellen sozialer Systemstabilisierung erschliessbar, die mit den regelhaften, berechenbaren physiologischen Funktionsweisen menschlicher Organismen zusammenhängen.

So braucht man höchstens drei bis vier Stunden in einer kleinen Gruppe zusammenzusitzen, bis die gemeinsame Einnahme einer Mahlzeit zu einem allerseits konsensfähigen, weil durch ununterdrückbare Hungergefühle gestützten, Anliegen wird: ein Unterfangen, über dessen Wünschbarkeit die Partner ungeachtet ihrer übrigen Meinungsdifferenzen und Konflikte in erlösender Gemeinsamkeit der Bedürfnisse miteinander konvergieren, und bei dem sie eine neue Ausgangsplattform für expressive und sozio-emotional motivierte soziale Interaktions- und Verständigungsprozesse (im Medium der "Geselligkeit") finden.

Ähnlich erklärt sich der hohe Routinisierungsgrad der meisten kommunalen Verwaltungstätigkeiten und Dienstleistungen hinreichend aus der einfachen Tatsache, dass mit dem andauernden Zusammenwohnen zahlreicher Einzelpersonen und Familien viele äusserst berechenbare Bedürfnisse und Ansprüche (nach Frischwasserangebot, Elektrizitätsversorgung, Abwasserkanalisation, Schneereinigung u.a.) erwachsen, für deren Erfüllung ebenso stabile, standardisierbare Verfahrensweisen, Organisationsstrukturen und Technologien zur Verfügung stehen.

"Totale Institutionen" wie z.B. geschlossene Anstalten, Schiffsbesatzungen oder Militärgarnisonen zeigen in ihrem Strukturaufbau regelmässig hohe "induzierte Stabilitäten" auf Grund der Tatsache, dass die integral eingebundenen Insassen mit höchster Berechenbarkeit immer dieselben - sich andauernd reproduzierenden - Grundbedürfnisse artikulieren und dadurch auch höchst verlässliche Ansatzpunkte für Strategien der Sanktionierung und Sozialkontrolle bieten (vgl. Goffman, 1973: 54ff.).

Die schwerwiegendsten, gerade unter modernen gesellschaftlichen Verhältnissen immer auffälligeren Leistungsschwächen aller auf dem Prinzip der "Anwesenheit" konstituierten Sozialsysteme entstehen aus der Tatsache, dass Mitgliedschaftsrollen, Statusverhältnisse,, Kooperationsbeziehungen und alle andern Elemente der Binnenstruktur nur dadurch stabil gehalten werden können, dass die Teilnehmer drastische Beschränkungen ihrer räumlichen Mobilität auf sich nehmen. Verständlicherweise wird mit vielerlei Mitteln versucht, den Status "prinzipieller Anwesenheit" wenigstens partiell vom Zustand dauernder physischer Präsenz unabhängig zu machen: indem man stellvertretend für den eigenen Körper symbolische Markierungen verwendet, um Phasen temporärer Abwesenheit zu überbrücken oder um sich gar bei beliebig seltener Anwesenheit immer den Zugang zu einer kollokalen Teilnehmerrolle zu sichern. Am besten scheinen dazu "persönliche Gegenstände" (z.B. Badetücher am Strand, Jacken im Eisenbahnabteil, Handtaschen auf Wartezimmerstühlen) geeignet, die mit der partikulären Persönlichkeit des Besitzers symbolisch derart stark assoziiert werden, dass man den Respekt und die Berührungsscheu, den man seinem Körper gegenüber verspürt, zumindest teilweise auf sie überträgt (Goffman 1974: 71ff.).

Vor allem Individuen in höheren Statusrängen sind auf einen extensiven Gebrauch derartiger Körpersubstitute angewiesen, um ihre vielfältigen Einbindungen in kollokale Interaktionsfelder mit ihren ebenso ausgeprägten Bedürfnissen nach räumlicher Mobilität in Einklang zu bringen. Dies geschieht dadurch, dass sie eine besonders grosse Zahl physischer Gegenstände und Einrichtungen (z.B. Büros, Ferienvillen u.a.) exklusiv mit ihrer "Persönlichkeit" imprägnieren, andererseits aber darüber hinaus auch rein institutionelle Hilfen in Anspruch nehmen, um sich dauernde Zugangschancen (z.B. zum familieneigenen Kirchenstuhl oder zum Stammplatz im bevorzugten Speiserestaurant) zu sichern.
 

2.2.3 "Persönliche Erscheinung"

In der praktischen interpersonellen Wahrnehmung mag es kaum gelingen, das reine raum-zeitliche "Hiersein" eines Individuums zu verifizieren, ohne gleichzeitig auch verschiedene Aspekte seines besonderen "Soseins" in den Blick zu bekommen (vgl. Schütz, 1974: 182ff).

Dennoch bleibt diese Unterscheidung von höchster analytischer Relevanz, weil alle über die schiere "Anwesenheit" hinausgehenden personellen Attribute und Kundgaben einen ungleich spezifischeren und variableren Charakter haben, und auf Seiten des Emittenten wie des Rezipienten mehr Spielraum für eigenselektive Gestaltung und Deutung offenlassen,

Am wenigsten treffen diese Eigenheiten allerdings auf die relativ invariante Ausdrucksebene der "äusseren Erscheinung" zu, die einerseits am unmittelbarsten auf dem Basisfaktum der "Anwesenheit" ruht, auf der andern Seite aber ihrerseits als Fundament und Deutungsrahmen für alle variableren Äusserungen auf der Ebene der Gestik (2.2.4) oder auf verbalem Niveau (2.2.5) fungiert.

Normalerweise kann ich die Verhaltensäusserungen und Sprechakte eines anwesenden anderen Individuums nicht einmal wahrnehmen, geschweige denn adäquat interpretieren, bevor ich dieses nicht in intuitiver, höchst synthetischer Weise im Medium seiner spezifischen "äusseren Erscheinung" wahrgenommen habe: in den Aspekten seiner körperlichen Verfassung, seiner Bekleidung und Physiognomie, die sich "spontan" (d.h. für mich als Wahrnehmenden unvermeidbar und unkontrollierbar) zu einem komplexen Simultanbild der Gesamtperson und ihrer aktuellen Befindlichkeit zusammenfügen.

Auf ebenso unkontrollierbare Weise wird dieses Bild als äusserliches Korrelat einer - direkt nicht beobachtbaren - persönlichen Charakterstruktur gedeutet, der man ein analoges Mass an Konsistenz, Invarianz und Situationsunabhängigkeit unterstellt.
 
 "Das Gesicht aber... ist das Symbol all dessen, was das Individuum als die Voraussetzung seines Lebens mitgebracht hat, es ist abgelagert, was von seiner Vergangenheit in den Grund seines Lebens hinabgestiegen und zu beharrenden Zügen in ihm geworden ist. Das Gesicht bewirkt, dass schon aus seinem Anblick, nicht erst aus seinem Handeln, verstanden wird. Das Gesicht, als Ausdrucksorgan, betrachtet, ist sozusagen ganz theoretischen Wesens, es handelt nicht, wie die Hand, wie der Fuss, wie der ganze Körper: es trägt nicht das innerliche oder praktische Verhalten des Menschen, sondern es erzählt nur von ihm. In irgendeinem, freilich schwankenden Masse, wissen wir mit dem ersten Blick auf jemanden, mit wem wir es zu tun haben (Simmel 1908b: 485)."

Dieser diffus-holistischen Auffassungsweise steht nun allerdings eine ausgesprochen differenzierte, durch das komplementäre Zusammenwirken mehrerer kommunikativer Ausdrucksebenen gekennzeichnete Konstitutionsweise der "persönlichen Erscheinung" gegenüber.

Nach Massgabe des Kriteriums, wie eng sie mit dem Niveau zugeschriebener biologischer Körpermerkmale einerseits oder dem Niveau intentional manipulierbaren Verhaltens andererseits in Verbindung stehen, müssen mindestens die folgenden vier Ebenen analytisch auseinandergehalten werden:

  1. Auf Grund von Alter, Geschlecht, Hautfarbe und anatomisch bedingten Charakteristika bringt jedes Individuum an alle kollokalen Interaktionsfelder eine invariante Konstellation fundamentalster physischer Eigenschaften mit, die praktisch im selben Wahrnehmungsakt, mit dem man die Anwesenheit der Person registriert, mitaufgefasst werden. Ihre weite Entfernung von der Ebene intentionalen Handelns verdankt diese Ausdrucksebene also der Tatsache, dass der Emittent nicht in der Lage ist, auf das Ob, Wie, Wann und Wo solcher Kundgaben wesentlich Einfluss zu nehmen, und der Rezipient (vor allem bei nichtvisuellen, z.B. akustischen oder olfaktorischen Reizen) genau so wenig Autonomie hat, sich ihrer Wahrnehmung zu entziehen.
  2. Auf der zweiten Ebene finden sich jene ebenfalls im Medium biologischer Körperlichkeit transportierten  Eigenschaften, die aber als Ergebnisse vorangegangenen Verhaltens aufgefasst werden können.
  3. In nächster Nähe zur Ebene (1) stehen Merkmale, die auf Grund eines irreversiblen organischen Eingriffs (z.B. einer chirurgischen Operation) jetzt zu den zugeschriebenen Körpermerkmalen zu zählen sind, oder habitualisierte Körperhaltungen, die sich auf Grund langer Eingewöhnung einer intentionalen Manipulation entziehen. Ein Illustrationsbeispiel für den letzteren Fall findet sich in der Gewohnheit englischer Oberschichtkreise, ihren Kindern eine höhere Stellung der Augenbrauen anzuerziehen (vgl. Birdwhistell 1968: 381).
    Zu einem Bereich mittlerer Fixiertheit gehören Körpermanipulationen, die - wie z.B. das Färben der Haare oder das Ansetzen von Bartwuchs - zwar reversibel sind, dem Individuum aber dennoch längerfristig ein stabiles, in allen Kollokalfeldern auf identische Weise zur Geltung kommendes Erscheinungsbild verleihen. Dadurch kontrastieren sie mit jenen nur kurzfristig wirksamen Manipulationen (Schminke, Rasur, Abendfrisur), die häufig im Hinblick auf eine einzelne kollokale Interaktionsphase (z.B. eine Party oder einen Opernveranstaltung) vollzogen werden und bei deren längerem Andauern Schaden zu nehmen drohen.
  4. Drittens wird die "persönliche Erscheinung" in zentraler Weise durch materielle Accessoires wie z.B. Kleidungsstücke, Brillen, Schmuckstücke, Schirme, Handtaschen u.a.) mitkonstituiert, die - obwohl faktisch von ihrem Besitzer jederzeit entfernbar - an seine Person temporär oder dauernd assimiliert sind: indem er exklusive Nutzungsrechte auf sie geltend macht und sie häufig auch mit physischen Charakteristika (z.B. seinen Körpergerüchen) "imprägniert".
  5. Einige dieser Utensilien (z.B. die meisten Kleidungs- oder Schmuckstücke) teilen mit den körperlichen Ausdruckskundgaben der Ebene (2) die Eigenschaft, dass sie vor dem Eintritt ins Kollokalfeld fixiert worden sind und während der Dauer der Interaktionsteilnahme unverändert bleiben. Andere Gegenstände (wie z.B. Hüte, Handschuhe, Mäntel) sind gerade daraufhin angelegt, innerhalb desselben Interaktionsprozesses an- und abgelegt zu werden und dem Individuum zu einer gewissen (selbstkontrollierten) Modifizierbarkeit seines äusseren Erscheinungsbildes zu verhelfen.
  6. Schliesslich ist nicht zu unterschätzen, in welchem Ausmass auch vom menschlichen Körper völlig unabhängige äussere Objekte das persönliche Erscheinungsbild mitkonstituieren: z.B. kostbare Büro- oder Wohnungseinrichtungen,, die sich - als "Bühnenrequisiten" - zusammen mit der Kleidung, Körperhaltung usw. zu einem Gesamteindruck von "Vornehmheit" verbinden. Ein grosser Teil der Konsumgüterwerbung ist damit befasst, verschiedensten Objekten (z.B. Häuser, Möbel, Autos etc.) zu einem derartigen Status zu verhelfen und dadurch jenes Repertoire an individuellen Ausdrucksmöglichkeiten anzureichern, die den Individuen für freie intentionale Gestaltung zur Verfügung stehen.
Aus dem Zusammenwirken dieser vier Ausdrucksebenen können im kollokalen Feld bereits vorgängig jeder Interaktion und Kommunikation relativ spezifische interpersonelle Typifikationen und Erwartungshaltungen entstehen, die den Einsatz gestischer oder verbaler Kommunikationsmedien
  • einerseits überflüssig machen: weil wichtige Strukturprämissen der sozialen Beziehung bereits hergestellt sind, die z.B. im translokalen Brief- oder Telephonkontakt völlig im Medium der Sprache erarbeitet werden müssen;
  • andererseits erleichtern: weil viele Verhaltensweisen oder Aussagen rascher und adäquater verständlich werden, wenn man sie auf der Folie eines aus vorgängigen Körperwahrnehmungen konstituierten Persönlichkeitsbildes interpretiert.
Die relativ hohen Unkontrollierbarkeiten und Unvorhersehbarkeiten kollokaler Interaktionsprozesse (vgl. Kap. 4) entstehen vor allem daraus, dass praktisch alle intentionalen Handlungen und Sprechakte unvermeidlicherweise über das Medium der "äusseren Erscheinung" vermittelt werden, deren zweifache Problematik darin beruht, dass sie
  1. auf Grund ihrer Verankerung in  körperlichen Merkmalen nur in begrenztem Masse autonom gestaltet und verändert werden kann;
  2. als Ausgangsbasis für spekulative - d. h. nicht auf empirische Evidenz gegründete - Schlussfolgerungen über die "dahinter" stehende persönliche Charakterstruktur fungiert.
So liegt es offensichtlich sehr nahe, körperlich besonders attraktiven Personen auch verschiedenste andere positiv bewertete Eigenschaften auf psychischer und charakterlicher Ebene zu attribuieren und ihnen - was durchaus zur "self-fulfilling prophecy" werden kann - überdurchschnittliche Mobilitätschancen auf dem Heiratsmarkt oder in der beruflichen Arbeitswelt zu attestieren (vgl. z.B. Dion/Berscheid/Walster 1972).

Derartige Voreingenommenheiten mögen sehr wohl dazu führen, dass physisch anziehende Individuen häufiger eine fortgesetzte Zuwendung ihrer Interaktionspartner erfahren und dadurch automatisch auch bessere Chancen zur verhaltensmässigen und verbalen Selbstdarstellung erhalten, während unattraktive oder gar abstossend-hässliche Personen gegenüber ihren zum Rückzug neigenden Interaktionspartnern oft keine Gelegenheit finden, ihre anfänglich negative Eindruckswirkung durch die Artikulation umso positiverer Eigenschaften auf Handlungsebene (Hilfsbereitschaft, Kunstfertigkeit, rhetorische Überzeugungskraft u.a.) zu kompensieren.

Generell mag die Invarianz des äusseren Erscheinungsbildes eines Individuums dazu verführen, ihm über Gebühr auch konstante Persönlichkeitsmerkmale und innerpsychische Eigenheiten zuzurechnen, und das Interaktionsverhältnis mag dadurch erschwert werden, dass die variablen Äusserungen einer Person mit den aus dem "Erscheinungsbild"" hergeleiteten Erwartungshaltungen in ein konkurrierendes, konfliktives Verhältnis treten. So können insbesondere Individuen mit einem sichtbaren äusseren Gebrechen in der kollokalen Situation besondere Erschwernisse erfahren: weil man das sinnlich hervorstechende Einzelmerkmal ihrer Lähmung, Blindheit, Senilität u.a. zum Anlass nimmt, um sie auf generalisierte Weise zu stigmatisieren und alle ihre Verhaltensregungen nur unter dem einen Gesichtswinkel ihres physischen Handikaps (und dem damit assoziierten Zustand dauernder, "Hilfebedürftigkeit") zu interpretieren (vgl. Goffman 1971:87). Bei jedem Neubeginn einer Bekanntschaftsbeziehung wird sich diese Problematik wieder verschärfen: weil erstmalige Interaktionspartner sich zuerst am körperlichen Erscheinungsbild (als der periphersten, sichtbarsten "Ausdruckskundgabe" einer Person) orientieren werden, selbst wenn sie guten Willens sind, in nachfolgenden, viel zeitaufwendigeren Beobachtungs- und Kommunikationsprozessen "sich eines Besseren belehren zu lassen".

Experimentelle Untersuchungsergebnisse zeigen deutlich, dass Individuen am prägenden Primäreindruck, den sie bei ihrer ersten Begegnung voneinander gewinnen, stark festzuhalten pflegen, sofern sie sich nicht durch drastische Informationen gegenteiliger Art zu einer Modifikation genötigt sehen (vgl. Luchins, 1957; Anderson/Hubert 1963; Zimbardo 1980:145f.)

Wer den risikoreichen, wenig beeinflussbaren Wirkungen seines körperlichen Erscheinungsbildes weniger ausgeliefert sein will, hat deshalb zwei völlig gegensätzliche Strategien offen: er kann sein soziales Feld auf relativ intime, langfristige Beziehungen einschränken, in denen seine variableren, autonomer gestaltbaren (aber die Zeit und Aufmerksamkeit seiner Partner stärker beanspruchenden) Ausdruckskundgaben besser zur Geltung kommen; oder er kann sich auf translokale Interaktionen (z.B. Telephon- oder Briefkontakte) verlegen, bei denen die diffusen und unkontrollierbaren Ausdruckskundgaben seines physischen Erscheinungsbildes aus rein technischen Gründen ausgefiltert bleiben.

Die Manipulation der äusseren Erscheinung stellt - aufbauend auf das "Anwesenheitsmanagement" - eine zweite Ebene intentionalen Handelns und interpersonellen Kommunizierens dar, die teils substitutiv, teils komplementär zur Ebene variabler Gestik und Sprechakte zur gezielten Selbstdarstellung und Fremdbeeinflussung eingesetzt werden kann.

Wie im Falle von An- und Abwesenheit kann die Frage, inwiefern z.B. ein "jugendliches Gesicht", ein "gutsitzendes Kleid" oder gar ein "muskulöser Körperbau" Ergebnisse kontingenten Handelns oder nicht manipulierbarer physischer Einwirkungen sind, je nach Situation sehr unterschiedlich beantwortet werden, und Fremddeutungen brauchen natürlich keineswegs mit Selbstzurechnungen zu koinzidieren. So bestehen notorische Unsicherheiten über das genaue Lebensalter, in denen ein Kind für seine Bekleidung und Frisur die Eigenverantwortung übernimmt oder das jugendliche Aussehen einer Dame nur noch auf aufwendiger, raffinierter Toilette beruht.
 
Vor allem die Präsentation einer "gepflegten äusseren Erscheinung" macht einen ständigen Aufwand an Wachsamkeit, Korrekturmassnahmen u.a. nötig, um den erforderlichen "unwahrscheinlichen" Ordnungszustand der eigenen Kleidung, Frisur u.a. gegen ständige Entropisierungstendenzen zu verteidigen: und dies unter der erschwerten Bedingung, dass Ego selbst viel weniger gut als alle seine kollokalen Beobachter in der Lage ist, sich selbst rundum zu inspizieren.

"Eines der augenfälligsten Mittel, mit dem der Einzelne seine situationelle Anwesenheit belegen kann, ist die disziplinierte Handhabung seiner persönlichen Erscheinung oder seiner `persönlichen Fassade', das heisst des Komplexes von Kleidung, Aufmachung, Frisur und anderer Oberflächendekoration seiner Person. An öffentlichen Orten in der westlichen Gesellschaft soll sich der Mann, der einer bestimmten Schicht angehört, in der Situation adrett gekleidet, rasiert, gekämmt, mit frischem Gesicht und gepflegten Händen präsentieren; für Frauen gelten ähnliche und noch weitere Auflagen. Zu beachten ist, dass in diesen Fragen der persönlichen Erscheinung nicht nur der Besitz der notwendigen Ausstattung zur Auflage gemacht wird, sondern auch die Ausübung einer ständigen Kontrolle, um alles in untadeligem Zustand zu erhalten." (Goffman 1969:36).
 

 
Der gezielte Einsatz der "äusseren Erscheinung" als Kommunikationsmedium wird durch die folgenden funktionalen Eigenschaften begünstigt:

  1. Laufende Prozesse gestischer oder verbaler Kommunikation werden von Sebstdarstellungsaufgaben entlastet: weil die erforderlichen Anstrengungen zeitlich vor dem Eintritt ins Interaktionsverhältnis (z.B. bei der Morgentoilette) getätigt werden. Mit Anzug, Gilet und Krawatte kann ich den ganzen Tag über bei beliebigen Partnern als "gepflegte Erscheinung" wirken und habe dadurch eine ohne weitere Bemühungen stabil bleibende, gesicherte Plattform, die ein Basisvertrauen in meine persönliche Normalität und Handlungsfähigkeit erzeugt, so dass ich mich ungestörter allen spezifischeren, variableren Selbstdarstellungshandlungen zuwenden kann.
  2. Meine Körpererscheinung ist ein trotz hoher Komplexität synchron gesendetes, ohne jeden Zeitverzug wahrgenommenes und entschlüsseltes "Makrosignal", durch das ich grundlegende und von momentanen Dispositionen relativ unabhängige Charakteristika meiner Gesamtpersönlichkeit zum Ausdruck bringen kann. In Gestik und Sprache sind demgegenüber nur zeitlich sequenzierte Bruchteile artikulierbar, die überdies immer mit den Spezifika der äusseren Situation, der inneren Stimmung u.a. imprägniert bleiben.
  3. Als unadressiert ausgesandtes, universell wahrnehmbares Signal liefert die äussere Erscheinung ein Instrument äusserst extensiver, auch unplanmässiger Bewirkung: so dass ihre Bedeutung vor allem in dem Masse steigt, als Zahl und Identität der relevanten Interaktionspartner unvorhersehbar variieren, bzw. wenn man auf Partner positiv wirken will, die (noch) keine differenzierteren Eindrücke besitzen oder mangels weiterer Interaktion ausschliesslich auf den äusserlichen Ersteindruck verwiesen bleiben.
Die Identifikation einer bestimmten Person als "Kind", "Frau", "Offizier", "Greis" oder als "invalid", "dick", "bleichgesichtig" oder "kleinwüchsig" ist das Ergebnis eines (im Normalfall visuellen) intuitiv-gesamtheitlichen Wahrnehmungsaktes, der "augenblicklich" (d.h. ohne subjektiv erlebten Zeitverzug) stattfindet und deshalb bereits abgeschlossen ist, wenn ich zu registrieren beginne, welche Verhaltensabläufe diese Person momentan vollzieht. Deshalb steht mir das Personenbild immer schon als ein informationsreicher Interpretationsrahmen zur Verfügung, der mir dazu verhilft, bereits vollzogene Handlungen sinnhaft zu deuten und Erwartungen über zukünftige Verhaltensweisen zu generieren.

Erst nach längerem Beisammensein (möglichst in verschiedenartigen Situationen) habe ich so viele Verhaltensweisen meines Partners beobachtet, dass ich in der Lage bin, aus ihnen ein eigenständiges, mit dem intuitiven Anfangsbild konkurrierendes Modell der durch sie zum Ausdruck kommenden Persönlichkeit zu konstruieren: der Invalide ist bewegungsfähiger, als ich gedacht habe, das schmächtige Kind besitzt Körperkräfte, die man ihm nie zugetraut hätte.

Derartige Urteilsbildungen sind voraussetzungsreich, zeitaufwendig und deshalb chronisch knapp: so dass sie sich tendenziell auf den engeren Kreis meiner regelmässigen Interaktionspartner begrenzen, während es im viel umfangreicheren Feld oberflächlicher und transitorischer Interaktionspartner nötig ist, sich auf das anstrengungslos erworbene (aber entsprechend unkontrollierbar konstituierte) "Bild der äusseren Erscheinung" zu verlassen.
 

In der modernen. urbanen Gesellschaft besteht die paradoxe Situation, dass

  • auf der einen Seite die Nachfrage nach informationsreichen Ausdrucksformen der persönlichen Erscheinung sehr gross ist: weil häufig neue Kontakte geknüpft werden und besonders zahlreiche Sozialbeziehungen punktuell und transitorisch bleiben;
  • andererseits das Angebot an derartigen Orientierungshilfen geringer ist als in früheren, ständisch formierten Agrargesellschaften, in denen jedermann in Kleidung und Habitus sichtbar zur Schau getragen hat, welcher sozialen Gruppe (Klasse, Berufsstand, Zivilstand u.a.) er angehörte.
  •  

 

2.2.4 "Gestik"

I

Im breitest möglichen Wortsinne sollen mit dem Begriff der "Gestik" alle nicht-verbalen, auf körperlichen Bewegungsabläufen beruhenden persönlichen Kundgaben verstanden werden, die für den Emittenten selbst und/oder die kollokalen Anderen Objekte sinnhafter Wahrnehmung und Deutung bilden. Nur zu einem sehr kleinen Teil handelt es sich dabei um intendierte Äusserungen, die - z.B. substitutiv für Worte - eine verständliche Mitteilung vom Sender zum Empfänger transportieren. Zum grösseren Teil sind es ungeplant emittierte Manifestationen, wie sie als Korrelate unkontrollierbarer senso-motorischer oder gar physiologischer Vorgänge (z.B. Rülpsen, Schnarchen, nervöse Zuckungen u.a.) oder als Begleiterscheinungen innerpsychischer Zustände (z. B. Mimik) entstehen.

Ähnlich wie die schiere räumliche "Anwesenheit" sichergestellt sein muss, bevor die spezifischeren und variableren Manifestationen der "persönlichen Erscheinung" wirksam werden können, so können die noch ungleich volatileren Körpergesten wiederum nur auf der Grundlage einer vorgängig konstituierten "persönlichen Erscheinung" generiert und sinnhaft gedeutet werden. Dieselbe Handbewegung gewinnt je nachdem, ob ein Kleinkind, Verkehrspolizist, Dirigent oder Priester sie vollzieht, völlig verschiedene Konnotationen, und der "jugendliche Schritt" kann sich erst im Kontrast zur leiblichen Fülle oder zum greisenhaften Alter als etwas Bemerkenswertes, Überraschendes profilieren.

Die Verwobenheit beider Ebenen wird am Zwischenbereich jener "habituellen Leibkundgaben" deutlich, die sowohl der invarianten Sphäre der Körpererscheinung wie dem labileren Niveau der Gestik zugerechnet werden können: z.B. im Falle der Körperhaltung, die durch ständige Aktualisierung eingeübter Muskelanstrengungen aufrechterhalten werden muss, oder bei Gewohnheiten des Gehens, Nasenrümpfens oder Umsichblickens, die beim besten Willen nicht unabhängig von der leiblichen Gesamterscheinung wahrgenommen werden können.
 

II

Genauso wie die Merkmale der "persönlichen Erscheinung" gelten Gesten in jedem Falle als "Äusserungen": d.h. als empirische Indikatoren intraindividueller Geschehnisse oder Dispositionen, die sich einer direkten Beobachtbarkeit entziehen. Ihre spezifische Funktion besteht darin, den kognitiven Zugang zu den zeitlich variablen Zuständen und Ablaufprozessen eines erlebenden und handelnden Individuums sicherzustellen: wobei die gewichtigen Vorteile gegenüber der sprachlichen Kommunikation darin bestehen, dass

  1. in den Gesten viele intraindividuelle Tatbestände auf relativ unmittelbare Weise sichtbar werden, während Worte immer als höchst vermittelte (weil von den bewussten Mitteilungsabsichten des Emittenten gesteuerte) Äusserungen gedeutet werden müssen;
  2. Individuen zum selben Zeitpunkt ein reiches Spektrum verschiedener Verhaltensweisen (z.B. Gesichtsmimik, Handbewegungen u.a.) aussenden können, während Sprechakte auf strenges zeitliches Nacheinander verwiesen sind - und deshalb mit dem vieldimensionalen Reichtum psychischer Abläufe oft nicht Schritt halten können;
  3. nonverbale Gesten als "analoges" Kommunikationsmedium einer kontinuierlichen Abstufung zugänglich sind, während die Sprache als "digitales" Medium immer dazu zwingt, zwischen diskreten semantischen Alternativen (Begriffen, Satzbildungen u.a.) eine definitive Wahl zu treffen (vgl. Ruesch 1955; Sebeok 1962; Watzlawick/Beavin/Jackson 1967; Wilden 1977).
Diese letztere Eigenschaft erweist sich überall dort als Vorzug, wo auch die zu enkodierenden Tatbestände (Objekte, Zustände oder Ereignisse) den Charakter kontinuierlicher Variabilität besitzen:
  1. Bei der Darstellung physischer Objekte, wo es mittels Gesten gelingt, etwa die Grösse eines Kreises oder die Form einer Vase "ikonisch" (d.h. durch Erzeugung einer der "wahren Form" genau entsprechende oder wenigstens isomorphe Handbewegung) zu symbolisieren (Graham/Argyle 1975).
  2. Beim Ausdruck innerpsychischer Zustände, wo die Verbalsprache eine Entscheidung zwischen kategorial separierten Begriffsbestimmungen ("grosse Wut", "entsetzliche Enttäuschung" etc.) aufzwingt, während es etwa im Medium mimischer Ausdruckskundgaben viel besser gelingt, den feinabgestuften Intensitäten und subtilen qualitativen Ausprägungen solcher Stimmungslagen Rechnung zu tragen.
Dank dieser Affinität zur psychischen Systemebene sind Körpergesten dazu geeignet, innersubjektives Erleben in einer mittels Verbalisierung unerreichbaren Differenziertheit für intersubjektive Kommunikation zu erschliessen: (vgl. Bateson 1968).

So besteht die hauptsächliche Funktionsleistung der Schauspielkünste darin, den defizienten Ausdrucksgehalt eines invarianten Sprachtextes durch variablere nonverbale Ausdrucksmittel (Kostümierung, Körperbewegung, Tonfall, Bühnenszenerien u.a.) zu komplettieren und dadurch z.B. Sphären subjektiven Erlebens (wie z.B. variierende Gefühlsintensitäten), die keiner digital-begrifflichen Artikulation fähig sind, einer intersubjektiven Vermittlung und ästhetischen Gestaltung zugänglich zu machen.
 

Im Sinne von Ekman/Friesen (1981) können innerhalb der gesamten Sphäre nonverbaler Kommunikation drei Ebenen der Enkodierung identifiziert werden, die sich danach unterscheiden, ob das Verhältnis zwischen Zeichen und Bezeichneten auf physisch determinierten oder auf konventionell definierten Zuordnungen beruht.

  1. Zur äusserst umfassenden Sphäre "intrinsisch kodierter" Gesten gehören alle in der Gegenwart anderer vollzogener Verhaltensweisen, die simultan als Akte physischen Bewirkens und als Akte kommunikativen Ausdrucks fungieren.
  2. Wer eine Ohrfeige verteilt, das Fenster öffnet oder sich intensiv lesend über ein Buch beugt, erzeugt einerseits ein objektives Geschehen und andererseits gleichzeitig auch eine intersubjektive Mitteilung, dass sich genau dieses Geschehen vollzieht. Das reflektierte Mitberücksichtigen der kommunikativen Aspekte mag dann vielleicht dazu verleiten, sich etwas demonstrativer als "notwendig" über das Buch zu beugen, oder zu hoffen, dass auch eine nur angedeutete, nicht schmerzhafte, Ohrfeige ihre Sanktionswirkung tut. Eine der folgenschwersten Spezifika kollokaler Sozialsysteme besteht darin, dass praktisch alle äusserlich wahrnehmbaren Verhaltensweisen auch als "auf sich selbst verweisende Symbole" fungieren: so dass es nicht gelingt, sie aus solch kommunikativen Bindungen loszukoppeln und kompromisslos auf rein sachliche Bewirkungen hin zu orientieren (vgl. 3.4).
  3. Die zweite Sphäre der "extrinsisch kodierten" Gesten umfasst all jene Verhaltensvorgänge, die zu demjenigen, was sie ausdrücken in einem "ikonischen" Verhältnis stehen: und sich somit zum Bezeichneten nicht mehr in einem Kausalverhältnis, aber immerhin noch in einem isomorphen Abbildverhältnis befinden. Die Entlastung von physischen Bewirkungen hat zur Folge, dass verschiedenartige und auch mit sehr geringem Aufwand an Energie oder Qualifikation vollzogene Handlungen hinreichend sein können, um den rein kommunikativen Zweck zu erfüllen: so dass es durchaus möglich ist, mit sachten Handbewegungen ein gewaltiges Orchester zu dirigieren, oder mit der blossen Drohfaust eine dem tätlichen Angriff vergleichbare Einschüchterungswirkung zu erzielen.
  4. Zur dritten, der verbalen Ebene verwandtesten Sphäre "konventioneller" Gesten ("arbitrary extrinsic coding") gehören Ausdruckskundgaben, die mit dem symbolisierten Tatbestand in einem völlig willkürlich festgelegten Zuordnungsverhältnis stehen - und deshalb zu ihrer intersubjektiven Verständlichkeit einer umso festeren Verankerung auf der kulturellen Ebene bedürfen. Paradoxerweise bedeutet die "Willkürlichkeit" derartiger Symbolhandlungen (wie z.B. Händeschütteln, Kopfnicken, Applaudieren etc.) keineswegs, dass sie von den Akteuren nach Belieben umdefiniert, eliminiert oder neu erzeugt werden könnten. Ganz im Gegenteil haben konventionell festgelegte Symbole (wie z.B. auch Sprachbegriffe) die Eigenschaft, besonders ritualisiert zu sein und sich der deliberaten Kreation oder Manipulation viel weitgehender als z.B. ikonische Gesten zu entziehen. Denn weil jede intrinsische Bezüglichkeit zum bezeichneten Referenten fehlt, wird es bei jeglicher Modifikation der Bedeutungszuordnungen erforderlich, sehr umfassende Prozesse sozialer Diffusion, Konsensbildung, Sozialisierung und Tradierung stattfinden zu lassen.
Während sich verbale Äusserungen (z.B. Begriffe, Sätze u.a.) zu Formtypen verdichten, die völlig unabhängig davon, auf welche Weise sie gesprochen oder geschrieben werden, dieselbe invariante Bedeutung beibehalten, so bleibt der präzise Sinngehalt der meisten nonverbalen Gesten unauflöslich an die spezifische Art und Weise ihrer Ausführung gebunden. So können sich Emittenten durch Verfeinerung ihrer motorischen Selbstkontrolle immer reichhaltigere und subtilere Fähigkeiten zu nonverbalen Ausdruckskundgaben erschliessen; und die dekodierenden Rezipienten können sich durch Differenzierung ihres Wahrnehmungs- und Interpretationsvermögens in die Lage versetzen, immer feinere Nuancierungen (des Gesichtsausdruckes, der Handbewegungen u.a.) zu registrieren und adäquat zu verstehen:

"Die kommunikative Bedeutung des Tonfalls, in den ich diese Redeäusserung kleide, des genauen Zeitpunkts (im Verhältnis zu den Voten meiner Konversationspartner), zu dem ich sie ausspreche, der Geschwindigkeit, mit der ich die Worte einander folgen lasse etc. etc., all dies hängt völlig von der Fähigkeit der Rezipienten ab, genau diese Merkmale richtig zu erfassen." (Kendon 1981:3f.)

Weil man nicht sprechen kann, ohne auf eine bestimmte Weise zu sprechen, sind alle kollokalen Redeäusserungen zwangsläufig mit einer Aura "intrinsischer" nonverbaler Begleitäusserungen behaftet, die vom Sprechakt selbst nicht ablösbar sind. Darüber hinaus aber scheint es generell üblich zu sein, alles kollokale Sprechen auch in ein Milieu "extrinsischer" Gestik einzubetten: vor allem durch äusserst fein differenzierte Gestikulationen (der Hände u.a.), die mit den sprachlichen Äusserungen in einem dicht verwobenen komplementären Parallelitätsverhältnis stehen (vgl. Kendon 1983:17).

So scheint der Spracherwerb während des ontogenetischen Reifungsprozesses eines Individuums keineswegs mit einem Verlust an Gestik einherzugehen: vielmehr werden die beim Kleinkind "frei flottierenden" nonverbalen Verhaltensweisen gleichsinnig ausdifferenziert und mit den verbalen Ausdrucksprozessen immer perfekter integriert (vgl. Bates 1979; Kendon 1983:24).
 

Wenn kollokale Sozialsysteme unter verschiedensten Situationsbedingungen fast voraussetzungslos und unvermeidlich entstehen und zu ihrer Kontinuierung (abgesehen von fortgesetzter Anwesenheit) keiner besonderen strukturellen Vorkehrungen bedürfen, so ist dies vor allem der Existenz und permanenten Aktiviertheit der fundierenden nonverbalen Kommunikationsebene zu verdanken, die als "Auffangebene" verfügbar ist, wenn die voraussetzungsreichere verbale Kommunikation versagt.

Häufig nur rudimentär ausdifferenziert, stellt sie eine entwicklungsfähige "Kommunikationsreserve" dar, deren Kapazität nur in Ausnahmesituationen voll ausgeschöpft werden muss: z. B. wenn Taubstumme oder Angehörige verschiedener Sprachgruppen miteinander in Beziehung treten, oder wenn strikte institutionelle Normen Schweigen gebieten.

So waren die Indianer der "great plains" auf eine hoch differenzierte Zeichensprache als "lingua franca" verwiesen, als sie im Zuge rascher Stammesexpansion erstmals miteinander in Berührung traten, genauso wie verheiratete armenische Frauen, die durch Redeverbot (während des Essens) zum Austausch vielfältiger Gesten genötigt werden (vgl. Kendon 1983:37).

Während der Entstehungsprozess einer neuen Verbalsprache Jahrhunderte benötigt und sich - im starken Kontrast zur hohen Intentionalität des Sprachgebrauchs - einer absichtsvollen Steuerung weitgehend entzieht, können gestische Zeichensprachen innerhalb eines kontinuierlichen und relativ geschlossenen kollokalen Feldes ziemlich rasch zur Ausdifferenzierung gelangen. Diese höhere Evolutionsfähigkeit ist zum Teil sicher der Tatsache zu verdanken, dass viele nonverbale Gesten einen "ikonischen" Charakter tragen: d.h. mit demjenigen, was sie bezeichnen, in einem intrinsischen Isomorphieverhältnis (anstatt bloss einem konventionellen Zuordnungsverhältnis) stehen (Ekman/Friesen 1981).

Während selbst intimste Unterredungen und Konversationen in Form und Sinngehalt fest in der Konventionalität der Sprache verhaftet (und deshalb auch für beliebige Dritte verstehbar) bleiben, so eignen sich nonverbale Gesten als Trägermedium für die Ausdifferenzierung partikularistischer Verständigungscodes, deren Geltung sich strikte auf das Interaktionsfeld zwischen partikulären Einzelindividuen beschränkt.

Die geringere Einbindung in systemexterne, kulturell verankerte Codestrukturen muss dann allerdings mit umso stärkeren Restriktionen systeminterner Art erkauft werden: indem Gestensprachen zu ihrer Entstehung und Reifung auf aussergewöhnlich stabile und langfristig bestehende kollokale Interaktionsverhältnisse angewiesen sind und in ihrer Geltung meist auf jene Individuen beschränkt bleiben, die sich bereits an ihrer Genese mitbeteiligt haben.

So hat Knapp bei konnubialen Ehepaaren einen langfristigen Perfektionierungsprozess der dyadischen nonverbalen Kommunikation beobachten können, der bei beiden Partnern von einer Zunahme der Enkodierungs- wie auch der Dekodierungsfähigkeiten begleitet ist und in folgenden konsistenten Entwicklungen seinen Ausdruck findet:

  1. Ein immer breiteres Spektrum immer feinerer Verhaltensnuancen wird in den kommunikativen Austausch einbezogen.
  2. Anstelle kulturell stilisierter (d.h. auch anderswo verwendeter) Ausdrucksformen werden immer mehr rein bilateral definierte "Sprachregelungen" verwendet: d.h. es wird eine vom Kontext separierte "Mikrokultur" aufgebaut, die es äussern Beobachtern (inkl. Soziologen) zunehmend erschwert, die Kommunikation zu verstehen.
  3. Die Kapazität der Informationskanäle nimmt zu: indem es gelingt, innerhalb derselben Zeitspanne immer zahlreichere Kommunikationsakte stattfinden zu lassen.
  4. Indem eine wachsende Zahl funktional äquivalenter Ausdrucksweisen für denselben Sinngehalt zur Verfügung steht, wächst die Chance, unter beliebigen situativen Bedingungen (z.B. bei unterschiedlichen räumlichen Distanzen) zuverlässig zu kommunizieren.
  5. Der gestische Austausch wird in dem Sinne habitualisiert, dass die Partner sowohl zur Enkodierung wie zur Dekodierung immer weniger Aufmerksamkeit aufwenden müssen und deshalb zunehmend in der Lage sind, ihre Kommunikation "beiläufig" (d.h. ohne Behelligung ihrer übrigen Aktivitäten) stattfinden zu lassen (vgl. Knapp 1983).
Indem die der nonverbalen Ausdrucksebene eigenen funktionalen Leistungsvorteile auf diese Weise immer stärker zur Entfaltung gelangen, wird sie fähig, um
  • komplementär zur Sprache dem Sozialsystem sehr subtile und flexible, voraussetzungslos zugängliche und höchst zuverlässige Möglichkeiten der interpersonellen Akkordierung zu erschliessen, die für den Vollzug anspruchsvoller Kooperationsleistungen (z.B. in medizinischen Operationsteams) grösste Bedeutung haben (vgl. Goffman 1983);
  • substitutiv zur Sprache einen grösseren Anteil der gesamten intrasystemischen Kommunikation zu absorbieren, so dass sich die Teilnehmer auf verbaler Ebene mit einem "restringierten Code" begnügen können, bei dem die meisten übermittelten Sinngehalte unausgesprochen bleiben (vgl. Bernstein 1964).
III

Bekanntlich muss bereits das An- und Abwesendsein als ein fundamentales Basisverhalten angesehen werden, das - jeder spezifischen Interaktion vorangehend - als Trägermedium für soziale Kommunikation Verwendung finden kann. Die Übermittlungskapazität dieses Kanals ist aber äusserst beschränkt, weil es in sachlicher Hinsicht nicht über eine blosse Digitalität (d.h. ein einziges 'bit' Information) hinaus differenzierbar ist: so dass es höchstens auf Grund seiner zeitlichen Spezifizierung (z.B.: Pünktlichkeit des Erscheinens, Häufigkeit der Teilnahme, Länge der Anwesenheit u.a.) möglich wird, exaktere Aufschlüsse zu gewinnen.

Demgegenüber enthält die Ebene der "persönlichen Erscheinung" einen sachlich komplexeren und in zeitlicher Hinsicht variableren Grad an Information, insofern

  • verschiedene Individuen ihre je eigenen Körpermerkmale und intendierten Weisen äusserlicher Selbstdarstellung zum Ausdruck bringen;
  • dieselben Individuen, je nach Lebensalter oder aktuellem Befinden, ein unterschiedliches Erscheinungsbild bieten und je nach den Eigenheiten des sozialen Anlasses absichtlich in unterschiedlicher Montur erscheinen.
Immer noch aber ist der Grad an zeitlicher Variabilität äusserst beschränkt, weil viele Erscheinungsmerkmale mit den langfristig stabilen anatomischen und physiologischen Eigenschaften des biologischen Körpers verhaftet sind, und weil die intentionalen Arrangements der persönlichen Aufmachung darauf angelegt sind, zumindest im Rahmen einer einzelnen sozialen Situation (z.B. während einer Abendeinladung, einer Beerdigungsfeier, eines beruflichen Vorstellungsgesprächs u.a.m.) möglichst invariant zu bleiben.

Entsprechend wird seitens des Emittenten keine Zeit beansprucht, um das im äusseren Erscheinungsbild enthaltene Bündel an Information mitzuteilen: so dass die für mich als Partygast benötigte Zeit, um mir einen äusseren Eindruck von allen übrigen Gästen zu verschaffen, nur von meinen eigenen Wahrnehmungsprozessen abhängig ist.
 
 

Nicht-verbale Vehaltensweisen haben demgegenüber die Eigenschaft, dass sie

  1. mit dem physischen Substrat persönlicher Anwesenheit und Körpererscheinung in einem äusserst lockeren, indeterminierten Zusammenhang stehen;
  2. sich deshalb im Vergleich zur "persönlichen Erscheinung" viel besser eignen, um mannigfachste interindividuelle Unterschiede wie auch intra-individuelle Variationen (z.B. zeitliche Wandlungen der Stimmungslagen, Interessen u.a.) zum Ausdruck zu bringen;
  3. in doppelter Hinsicht ihre Komplexität nur unter Beanspruchung von Zeit angemessen entfalten können:
    a) weil jeder einzelne Verhaltensablauf Zeit braucht, um vom Beginn bis an sein Ende zu kommen;
    b) weil nur sehr wenige Verhaltensabläufe simultan ablaufen können: so dass sie in zeitlicher Sequenz angeordnet werden müssen.
Da nun der Emittent Zeit braucht, um seine informativen Stimuli auszusenden, und der Rezipient Zeit benötigt, um sie zu registrieren, ist jetzt eine intersubjektive Akkordierung motorischer und sensorischer Prozesse notwendig, um den Erfolg des kommunikativen Aktes zu garantieren. Spezielle Mechanismen der Erwartungsbildung und der begleitenden Kontrolle müssen gewährleisten, dass ich genau dann (und solange) hinsehe, wenn mein Partner handelt: bzw. dass ich mich vor Ausführung meiner eigenen Gesten vergewissere, dass mein Partner sein enges Wahrnehmungs- und Aufmerksamkeitsfeld auf mich fokussiert.

Die Konstitution, Wahrnehmung und Interpretation des nicht-verbalen Verhaltens vollzieht sich also unter den äusserst erschwerten Bedingungen, dass Emittent und Rezipient symmetrische Probleme zeitlicher, sachlicher und sozialer Selektivität in wechselseitiger Abstimmung zueinander bewältigen müssen:
 
 
 
Emittent
Rezipient
sachlich:
was will ich tun?
was soll ich beobachten?
zeitlich:
wann will ich es tun?
wann soll ich wahrnehmen?
sozial
gegenüber wem will ich es tun?
wen will ich beobachten?

 

Diese Selektions- und Koordinationsprobleme sind so enorm und die zu ihrer Bewältigung entwickelten Mechanismen so beeindruckend und vielfältig, dass bei ihrer angemessenen Diskussion fast alle Aspekte der soziologischen Theoriebildung mitthematisiert werden müssten.

Andererseits halten sich diese Probleme im Bereich nicht-verbalen Verhaltens dennoch in viel engeren Grenzen als in der Sphäre sprachlicher Kommunikation, wo noch ungleich höhere Niveaus der Variabilität und Temporalisierung auftreten (und entsprechend drastischere Mechanismen der Selektivität wirksam werden müssen (vgl. 2.2.5):
 

  1. Während der Emittent im selben kleinen Zeitabschnitt nur einen einzigen Satz ausformulieren und nur über ein einziges Thema sprechen kann, so ist er in der Lage, simultan durchaus verschiedene nicht-verbale Stimuli auszusenden, die in unterschiedliche Sinnkontexte eingebettet sind und auf verschiedene Interaktionspartner ausgerichtet werden.
  2. Ein Grund dafür liegt darin, dass neben dem akustischen Emissionskanal (der auf strenge zeitliche Sequenzierung hin angelegt ist) noch andere Trägermedien des Ausdrucks zur Verfügung stehen. Insbesondere lässt sich der Körper als komplexes visuelles Ausdrucksfeld beanspruchen, weil seine verschiedenen hochdifferenzierten Muskelpartien (Augen, Gesicht, Hände, Wirbelsäule u.a.) unabhängig voneinander bewegt werden können.
    So kann es in Gesprächssituationen leicht geschehen, dass nonverbale Kundgaben dem zähen Strom der Rede leichtfüssig vorauseilen: beim Rezipienten den Erwartungs- und Deutungshorizont vorstrukturierend, innerhalb dem er dann die nachfolgenden Verbalisierungen interpretiert. Ein mit diesem Deutungsrahmen in Widerspruch stehender Inhalt der Rede vermag sich häufig nicht durchzusetzen, weil die nonverbalen Kundgaben primär zum Zuge kommen und auch meist für authentischer (weil: für weniger leicht manipulierbar) gehalten werden:
    "Und wenn ich fragte 'kennen Sie die Guermantes?' gab Legrandin, der Plauderer, zur Antwort: 'Nein, und ich habe auch niemals Wert darauf gelegt.' Leider aber antwortete er nur als zweiter, denn ein anderer Legrandin, den er sorgfältig in seinem Inneren verbarg und niemals vorzeigt, weil dieser Legrandin über den unseren und seinen Snobismus allerlei kompromittierende Geschichten wusste, ein anderer Legrandin, sagte ich, hatte zuvor bereits seine Antwort gegeben durch den verwundeten Blick, die verbissene Linie seines Mundes, den übertriebenen Ernst im Tone seiner Erklärung, durch die tausend Pfeile, von denen unser Legrandin sich einen Augenblick gespickt und versehrt gefühlt hatte, ein heiliger Sebastian des Snobismus: 'Ach! Wie tust Du mir weh! Nein, ich kenne die Guermantes nicht, rühre nicht an den grossen Schmerz meines Lebens.' Und wenn dieser zweite Legrandin, das enfant terrible, nicht über die nette Ausdrucksweise jenes zweiten verfügte, so war er doch viel schlagfertiger, bestand aus lauter 'Reflexen', wie man sagt, und wenn Legrandin der Plauderer ihm das Schweigen gebieten wollte, hatte der andere längst gesprochen, und es nützte unserem Freund nichts, wenn er nachträglich verzweifelt war über den schlechten Eindruck, den die Enthüllungen seines alter Ego machten; er konnte nur noch versuchen, ihn etwas zu verwischen." (Proust 1979:172/172).

    Werden dieselben kommunikativen Inhalte parallel auf verbaler und auf nonverbaler Ebene emittiert, gelingt es, dem Kommunikationsprozess eine höhere "Robustheit" zu verleihen: so dass ihre adäquate Rezeption und Dekodierung selbst unter widrigen Situationsbedingungen gesichert werden kann. Wenn jederzeit mit plötzlichem Lärm gerechnet werden muss oder wenn die Partner sich aus grösserer Entfernung oder fahrendem Auto miteinander zu verständigen suchen, ist es beispielsweise ratsam, Grussworte durch begleitende Handgesten oder umgekehrt: warnendes Winken durch zusätzliche Rufe zu unterstützen (vgl. Birdwhistell 1970:107f.).
    Generell haben solch mehrfach enkodierte Kommunikationsakte die Eigenschaft, sich prägnanter aus dem Umfeld der übrigen (simultanen) wahrnehmbaren Ereignisse auszudifferenzieren und dementsprechend auch in der Erinnerung stärker haften zu bleiben. So bleiben beispielsweise gesprochene Sätze besser im Gedächtnis haften, wenn sie von ausdrucksvollen Körpergesten begleitet werden (vgl. Berger/Popelka 1971).
    Blickkontakte haben beispielsweise häufig die Funktion, den Sinngehalt gleichzeitig emittierter Verbaläusserungen zu unterstreichen, dem gesamten Kommunikationsakt dadurch mehr Redundanz und "Robustheit" zu verleihen und das Risiko, dass die Rede falsch (z.B. ironisch statt ernsthaft) verstanden wird, stark zu reduzieren.
    So hat sich in einer Experimentaluntersuchung von Ellsworth/Carlsmith (1977) gezeigt, dass Kommunikatoren, die die Rezipienten während des Sprechens häufig und lange anblicken, von diesen

    • bei positivem Inhalt ihrer Rede günstiger beurteilt werden
    • bei negativem Inhalt ihrer Rede ungünstiger beurteilt werden

      als wenn - was beispielsweise bei Telephongesprächen zwangsläufig der Fall ist - Blickkontakte fehlen.
  3. Während der Rezipient sprachlicher Äusserungen sein integrales Aufmerksamkeitsfeld auf einen einzigen Sprecher ausrichten muss, um sich auf den hohen Überraschungsgehalt verbaler Kommunikation einzustellen, kann der Perzipient nicht-verbaler Verhaltensweisen einen breiteren, unselektiveren Zugang zu seiner sozialen Umwelt aufrechtzuerhalten: weil er eben mehrere Sinnesorgane zur Verfügung hat und ganz besonders mit seinem visuellen Organ in der Lage ist, simultan relativ komplexe, vieldimensional konstituierte Muster zu registrieren.
  4. Bei der Mimik beispielsweise können Stellungen und Bewegungen verschiedener Gesichtspartien derart zu kohärenten Ausdrucksgestalten verdichtet werden, dass es möglich wird, simultan mehrere Gefühlszustände zur Kundgabe zu bringen. Elemente von Ungeduld, Vorfreude, Ängstlichkeit u.a. können sich in derselben Synchronizität, die ihrem subjektiven Erleben eigen ist, auch im Medium intersubjektiv wahrnehmbarer Verhaltensweisen zum Ausdruck bringen, während ihre verbale Explikation ein ihrem Wesen zuwiderlaufendes zeitliches Nacheinander nötig machen würde (vgl. z.B. Plutchik 1962; Ekman/Friesen 1981).
    Nicht zuletzt dank diesem "Realzeitverhältnis" zwischen Erleben und Kommunikationsverhalten können nonverbale Ausdruckskundgaben einen auf verbalem Wege unerreichbaren Grad an Authentizität und "Wahrhaftigkeit" erreichen: so dass sie überall dort, wo solche Authentizität hoch geschätzt wird (z.B. in psychotherapeutischen "encounter groups") gegenüber der verbalen Ebene in Führung gehen.
  5. Während der sprachliche Kommunikationsfluss seine eigene zeitliche Variabilität und Unvorhersehbarkeit dadurch erzeugt, dass es normalerweise als inopportun, ja abstrus und psychopathologisch angesehen wird, wenn jemand auch nur zweimal genau dasselbe sagt, so sind die Variationszwänge beim nicht verbalen Verhalten viel weniger streng normiert. Niemand wird allein deshalb negativ sanktioniert, weil er sehnsüchtige Blicke, schelmisches Lächeln, unwilliges Kopfschütteln oder selbst neurotisch wirkendes Mundzucken mehrmals wiederholt: und von allen Individuen wird stillschweigend erwartet, dass sie fortgesetzt dieselben Verhaltensanstrengungen aufwenden, um einen bestimmten Habitus ihrer Körperhaltung, ihres Gesichtsausdrucks oder des Tonfalls ihrer Stimme zu stabilisieren.
Aus all diesen Gründen fehlt das für verbale Kommunikation typische Dilemma, dass sich aufgrund der Knappheit an Redezeit und Zuhörchancen entweder eine asymmetrische Polarisierung zwischen einem Sprecher und vielen Zuhörern oder aber eine Fragmentierung in zahlreiche unabhängige Konversationsgrüppchen (häufig bilateraler Art) ergibt.

Vielmehr überwiegt ein relativ lose koordiniertes, dezentralisiert gesteuertes Netzwerk multilateraler Emissions- und Rezeptionsaktivitäten: ein Grundpegel anarchischer, aber gerade deshalb äusserst beständiger "nicht-zentrierter Interaktion", bei dem jedes Individuum sich die Freiheit wahrt, als autonomes Emissions- und Rezeptionszentrum intersubjektiver Kommunikation zu fungieren:

"Alle Anwesenden stürzen sich in einen gemeinsamen Teich nicht-zentrierter Interaktion, jeder Einzelne vermittelt jedem in der Situation allein durch seine Anwesenheit, sein Benehmen, seine äussere Erscheinung irgendwelche Informationen von sich, und jeder Anwesende nimmt ähnliche Informationen über die anderen entgegen, zumindest insofern, als er willens ist, von seinen Möglichkeiten, etwas zu erfahren, Gebrauch zu machen."
"In diesem Bereich nicht-zentrierter Interaktion kann keinem Teilnehmer 'offiziell' das Wort erteilt werden: es gibt kein offizielles Zentrum für allgemeine Aufmerksamkeit." (Goffman, 1969:146;42).

So vermag das sich auf anspruchsloseste Weise ständig regenerierende Geflecht sinnlicher Verhaltenswahrnehmungen dem kollokalen Sozialsystem zu einer weitreichenden und zuverlässigen primären Integration und zu einem Rahmen gesicherter gemeinsamer Situationsdefinitionen, Interpretationen und Antizipationen zu verhelfen, innerhalb dem dann die sprachliche Kommunikation gefahrloser ihre differenzierenden - häufig von Asymmetrien, Desorganisation und Abspaltung begleiteten - Wirkungen entfaltet.
 
"Oberhalb und jenseits dieser allgemeinen Teilnahme aber beteiligen sich die voll integrierten Mitglieder einer besonderen Begegnung zusätzlich an einer Interaktion zentrierter Art; in ihr ist die Information eines Einzelnen als spezifischer Beitrag zu einem gerade diskutierten Thema gemeint und hat gewöhnlich auch einen bestimmten Adressaten, während die andern Mitglieder der Begegnung, und nur diese anderen, sie ebenfalls aufnehmen sollen. So liegt eine allen gemeinsame Basis nicht-zentrierter Interaktion einer nicht allen gemeinsamen Basis zentrierter Interaktion zugrunde (oder mehreren solchen Basen)" (Goffman, 1969: 147).
 

 

Dieses "Basisrauschen" nicht-verbaler Kommunikation konstituiert einerseits die Ausgangsbasis, auf der (z.B. indem sich jemand plötzlich zum Redner aufschwingt, oder alle aufhorchen, um dem Gespräch zweier Teilnehmer zuzuhören) sich ein viel schmalerer und im Zeitablauf ausgeprägt variierender Überbau "zentrierter Interaktion" aufbauen kann; und andererseits bildet es die jederzeit verfügbare "Rückzugsbasis", auf die das Interaktionssystem nach anstrengenden Phasen der Zentrierung jederzeit regredieren kann, ohne seinen Charakter als soziales Interaktionssystem zu verlieren. So bleibt ein Theaterpublikum nach beendeter Vorstellung zumindest noch eine Zeitlang als nicht-zentriertes Feld einander stossender, musternder, winkender und sich vor der Garderobe gefügig in die Schlange einreihender Individuen erhalten; und in durchaus ähnlichem Aggregationszustand pflegen sich ermüdete Schulklassen während der Pausen vom anstrengenden zentrierten Unterricht zu erholen.
 
 

IV

Bekanntlich stösst man beim Versuch, die Anwesenheit einer Person sowie ihre äussere Erscheinung als intentionale Handlungen (bzw. deren Ergebnisse) aufzufassen, auf recht enge Grenzen, denn

  • jeder Mensch ist dem unentrinnbaren Zwang ausgeliefert, jede Minute des Tages irgendwo zu sein und andern Individuen einen bestimmten Anblick zu bieten: völlig unabhängig davon, inwieweit er diese ökologischen und physischen Parameter seiner Befindlichkeit absichtsvoll kontrolliert;
  • auf Grund harter physischer Gegebenheiten lassen sich die meisten Absichten zur Manipulation solcher Zuständlichkeiten nur schwer oder überhaupt nicht verwirklichen: z.B. weil man sich nicht gleichzeitig oder kurz nacheinander an völlig verschiedenen Orten aufhalten kann, oder weil biologisch fixierte Körpermerkmale (bedingt durch Geschlecht, Alter u.a.) der Manipulation des äusseren Erscheinungsbildes Widerstand entgegensetzen.
Am entgegengesetzten Pol höchster Intentionalisierung wäre wohl das verbale Kommunikationsverhalten anzusiedeln, denn
  • weil man (zumindest im Sinne physischer Kausalität) niemals gezwungen ist, überhaupt etwas zu sagen, wird die Tatsache, dass ein Sprechakt erfolgt, fast unweigerlich als Indiz für eine absichtsvolle Handlung gewertet;
  • weil man im Medium der Sprache mit gleichbleibender Mühelosigkeit alles und jedes in beliebig variabler Diktion zum Ausdruck bringen kann, wird - ausser in psychopathologischen Fällen - auch das Was und Wie der Rede dem Sprecher als eigenselektiv-intentionale Handlung zugerechnet.
Nicht-verbale Verhaltensweisen belegen nun zwischen diesen beiden Polen eine intermediäre Position, oder besser: ein relativ breites Spektrum mittlerer Positionen, das sich vom Bereich praktisch unkontrollierbarer, physiologisch bedingter oder habitualisierter Verhaltensreflexe (Niesen, Rülpsen, Gewohnheiten des Gehens, Händereichens, Lächelns u.a.) bis zu völlig absichtsvoll gemeinten und verstandenen Handlungen erstrecken.

Wird die "persönliche Erscheinung" durch biologisch zugeschriebene Körpereigenschaften noch direkt determiniert, werden Verhaltensweisen durch sie nur noch konditioniert: indem sie einen Variationsspielraum potentiell ausführbarer senso-motorischer Abläufe begrenzen, ohne zu präjudizieren, ob, wann und wie oft eine spezifische Verhaltensweise erfolgt.

Entsprechend wird der Tatbestand individueller Autonomie erst auf dieser dritten Ebene zu einer derart regelmässigen, generalisierten Erfahrung, wie dies für die Konstituierung selbstreferentieller Persönlichkeitssysteme und intersubjektiver Sozialsysteme notwendig ist:

  1. Jedes Individuum erfährt sich selbst als ein Selektionszentrum, das andauernd aus einer Vielzahl gleich zugänglicher Alternativen auswählen kann und muss: so dass es für die Orientierung an Werten, Normen, Präzedenzen, "Bedürfnissen" und vielen andern Strukturierungshilfen sensibilisiert wird, die ihm diese "Reduktion von Komplexität" erleichtern.
  2. Interagierende Individuen erfahren einander als andauernd selbstbestimmende Akteuren und müssen damit leben, dass sie für ihre eigenen Handlungen zur Verantwortung gezogen werden und die Verhaltensweisen anderer als eigenselektive (also nicht durch deterministische Kausalwirkungen hinreichend konstituierte oder beeinflussbare) Ereignisse hinnehmen müssen.
Dieser Selektionszwang teilt mit dem physischen Körper die Eigenschaft, den Menschen unentrinnbar über seine ganze (zumindest: wache) Existenzdauer hinweg zu begleiten. Darf die Einsicht "Man nimmt mich wahr, also bin ich" als konstitutiv für eine primäre, bereits dem kleinsten Kind zugängliche selbstreferentielle Existenzerfahrung gelten, so ist das Urteil "Ich muss wählen, also bin ich " dank ihrer ähnlich zwingenden Evidenz geeignet, das Selbstbewusstsein des Individuums als autonom handlungsfähiges Subjekt zu begründen.

Andererseits aber ist nicht-verbales Verhalten immer noch so weitgehend in physische Bedingungs- und Einflussverhältnisse eingebunden, dass es selten einen so hohen und unbestrittenen Grad der Intentionalisierung erreicht, wie er für Sprechakte generell charakteristisch ist:

  1. Der Spielraum realisierbarer Intentionen wird immer noch durch relativ spezifische, nicht manipulierbare Randbedingungen (Körperbau, Wahrnehmungsfähigkeiten, motorische Kondition u.a.) erschwert oder verunmöglicht, die zwischen verschiedenen Personen wie auch im Verlaufe individueller Biographien auf unkontrollierbare Weise variieren.

  2. Deshalb kann es niemals eine ähnlich generalisierte "Verhaltenskompetenz" geben, wie es eine "generalisierte Sprachkompetenz" (vgl. 2.2.5) gibt. Denn in zahlreichen - eigenen und fremden - Verhaltensweisen werden Individuen physisch-kausal bedingte Zwangsläufigkeiten und Regularitäten entdecken, die den Handlungscharakter vieler Verhaltensabläufe verringern (und die Probleme des Selektionszwanges, der Kontingenz und verantwortlichen Zurechnung entsprechend reduzieren).
  3. Individuen können sich nicht ähnlich souverän zum "Verhalten" oder "Nichtverhalten" entschliessen, wie sie sich jederzeit für das "Reden" oder "Schweigen" entscheiden können. Zwar sind sie zumindest im Schlaf oder bei Bewusstlosigkeit von Verhaltenszurechnungen dispensiert: während sie auf dem fundamentaleren Niveau ihrer "persönlichen Erscheinung" selbst dann noch unentwegt sinnlich wahrnehmbare Stimuli emittieren.
Aber in ihrem normalen Wachzustand sind Individuen daraufhin angelegt, ununterbrochen ein relativ hohes Niveau motorischer und sensorischer Variabilität aufrechtzuerhalten: so dass "absolute Bewegungslosigkeit" nur annäherungsweise und unter grössten Anstrengungen erreichbar ist und als unnatürlichster - entweder auf höchste intentionale Anspannung oder auf katatonischen Wahnsinn hinweisender - Zustand gilt.

Dieser Basispegel ständiger motorischer Abläufe hat zur Folge, dass jedes Individuum andauernd viel mehr Verhaltensstimuli emittiert, als es zum Objekt aufmerksamer Beachtung und intentionaler Kontrolle machen kann. Hinzu kommt, dass von aussen her selten eindeutig beobachtbar ist, auf welche seiner Äusserungen ein Emittent momentan eine bewusste Aufmerksamkeit fokussiert: so dass der intentionale Gehalt vieler Verhaltensweisen zwielichtig bleibt und vom Akteur selbst anders als von seinen Interaktionspartnern beurteilt wird.

Weil man schliesslich seine Augen immer irgendwohin wenden muss, kann man immer bestreiten, mit dem Anblicken oder Anstarren einer Person eine bestimmte Absicht (z.B. Kontakt aufzunehmen, Missbilligung auszudrücken u.a.) zu verbinden; und mein vernehmbares Räuspern während einer Diskussion muss nicht als "Kommentar" zum soeben gehörten Votum aufgefasst werden, weil auch rein stimmphysiologische Erklärungsmöglichkeiten zur Verfügung stehen (vgl. z.B. Luhmann 1972, Kendon 1983: l4)

Gerade weil ihr Handlungscharakter so undeutlich ist und deshalb verschiedenartigen und leicht revidierbaren Deutungen offensteht, sind nicht-verbale Verhaltensweisen viel besser als verbale Äusserungen dazu geeignet, um bei relativ hoher Erwartungsunsicherheit mit wenig Aufwand und Risiko neue Interaktionsmöglichkeiten und Konsenschancen zu explorieren. So können kollokale Individuen (z.B. auf "Begegnungsparties") ihre Blicke ähnlich wie Pflanzen ihre Sporen um sich streuen: in Erwartung, dass zumindest einer von ihnen "haften" bleibt und einen kommunikativen Prozess auslöst, der zu einer Tanzaufforderung, Bekanntschaft, Freundschaft oder noch weiter führen kann.
 
 Das kontinuierliche "Grundrauschen" ständiger sensorischer Wahrnehmungsprozesse - die selber nur sehr begrenzt wahrnehmbar sind - hat zur Folge, dass Individuen nur geringe Kontrolle und nur begrenztes Wissen darüber haben, welche der von ihnen ausgesandten Verhaltensstimuli von wem wann wie wahrgenommen werden.
 
 Besonders ausgeprägt trifft diese Problematik auf die Gesichtsmimik zu: weil mimische Kundgaben

  1. ununterbrochen ausgesendet werden müssen, da das Gesicht im Gegensatz zu den übrigen Körperteilen den Mitanwesenden permanent in unverhüllter Nacktheit dargeboten wird und auch (im Gegensatz etwa zu den Händen) in seiner Lage und Darstellungsperspektive kaum manipuliert werden kann;
  2. von den Mitanwesenden mit besonders hoher Wahrscheinlichkeit registriert werden: weil allein schon die Höflichkeit es gebietet, seinen Partner mit einer gewissen (allerdings auch wieder begrenzten) Häufigkeit und Zeitdauer ins Antlitz zu blicken (Ekman/Friesen 1969) und es darüber hinaus als erwiesen gilt, dass im Gesichtsausdruck besonders informationsreiche und authentische Kundgaben sichtbar werden;
  3. vom Emittenten besonders schwer registrierbar und kontrollierbar sind, weil ausgerechnet sein Gesicht, das für alle Interaktionspartner im Zentrum visueller Aufmerksamkeit steht, sich so weitgehend wie kaum ein anderer Körperteil seiner eigenen Wahrnehmung entzieht.
Das hat zur Folge, dass die Selektivität der nonverbal übermittelten Kommunikationen in hohem Masse den Aufmerksamkeitsleistungen und Dekodierungsfähigkeiten des Rezipienten aufgebürdet wird: weil die Vielfalt der permanent erzeugten Kundgaben ihm viel Autonomie überlässt, das Wann, Was und Wie seiner Wahrnehmung selber zu bestimmen.

Dies wiederum bedeutet, dass im Verhältnis zwischen Selbst- und Fremdwahrnehmung (wie auch zwischen den Fremdwahrnehmungen verschiedener Beobachter) hohe Diskrepanzen entstehen können, die sich - wegen der engen Kapazitätsschranken sprachlicher Kommunikation - niemals alle auf der Ebene verbaler Verständigung abbauen lassen.

Entsprechend bleibt alles ausserhalb verbaler Explikation (bzw. Explizierbarkeit) stattfindende Handeln in dem Sinne "unvollständig sozialisiert", als sich sowohl die Enkodierungs- wie die Dekodierungsprozesse einer strengen Kontrolle durch intersubjektiv verbindliche Regeln entziehen und jedes Individuum in gewissem Grade seine höchst privaten (empirisch nie eindeutig verifizierten) Auffassungen darüber aufrechterhält, wie es aussieht, sich verhält und dadurch "auf andere wirkt".
 

V

Im Verhältnis zu den wenig differenzierbaren Ausdrucksebenen persönlicher Anwesenheit und Erscheinung fungiert die Sphäre nicht-verbalen Verhaltens als hierarchisch übergeordnete Ebene der Steuerung und semantischen Spezifikation.

Beispielsweise ist die blosse Anwesenheit in einer Kirche ein in sich selbst so wenig informationshaltiges Faktum, dass man nur aus dem Kontext des dort praktizierten Verhaltens Schlüsse ziehen kann, ob touristische Neugier, ästhetisches Erlebnisbedürfnisse oder gläubige Andacht die Motive dafür bilden.

Und das öffentliche Auftreten in festlicher, schwarzer Kleidung ist ein so unspezifisches Signal, dass man nur durch Kenntnis

  • der im jeweiligen kulturellen Kontext geltenden Kleidungskonventionen
  • der aktuell vorliegenden Situation und Handlungsabsichten (z.B.: einer Beerdigungszeremonie beizuwohnen, ein Orchester zu dirigieren u.a.)
zu zuverlässigen Interpretationen gelangt.

Auf der andern Seite bildet die Sphäre nicht-verbaler Verhaltensweisen ihrerseits das fundierende Substrat für alle verbale Kommunikation. Denn niemand kann im kollokalen Interaktionsverhältnis auch nur einen Satz äussern, ohne gleichzeitig (bzw. wiederum: ein bisschen vor dem Zeitpunkt, wo der Satz vollendet und dadurch zum Gegenstand intersubjektiven Verstehens geworden ist) in Tonfall, Mimik, Modulierung, Blickweisen und Handbewegungen die situativen Rahmenbedingungen mitzuliefern, die

  1. im physischen Sinne kausal notwendige Trägersubstrate der Sprachäusserung darstellen;
  2. im symbolischen Sinne den semantischen Kontext mitkonstituieren, innerhalb dem sich die präzise Sinndeutung des Gesprochenen vollzieht (vgl. z.B. Poyotas 1981).
Weil eine sehr begrenzte, durch keinerlei Massnahmen wesentlich vermehrbare Zahl verschiedener motorischer Verhaltensvollzüge für eine unabgrenzbare Vielfalt verschiedener Bedeutungen in Anspruch genommen werden muss, ist jede Verhaltensweise "semantisch defizient" und verlangt nach einer sinnhaften Präzisierung, die häufig nur auf der noch ungleich differenzierbareren Ausdrucksebene sprachlicher Kommunikation gewährleistet werden kann (vgl. Kendon, 1981: 15, Freedman 1981: 151ff.).

So erhält das Fahneschwenken des Linienrichters ausschliesslich von den kodifizierten Regeln des Fussballspiels seinen Sinn; und in den Armbewegungen des zelebrierenden Priesters kann man mühelos die Vorschriften der Messliturgie wiederfinden.

Aber auch (ja: gerade) sehr komplexe, zu einer übergreifenden Moralhandlung koordinierte Verhaltensabläufe bleiben semantisch unterdeterminiert, solange man den verbalen Kontext der Weisungen, Vorschriften, Sanktionsandrohungen u.a. nicht kennt, in den sie hineingehören. So kann man zwar dem Fällen eines Baumes durchaus einen immanenten, aus dem zweckhaften Ineinandergreifen verschiedener Verhaltensvorgänge erschliessbaren Sinn abgewinnen (vgl. Weber 1972: 4); aber ohne Angabe eines verbalisierten semantischen Referenzsystems kann man nicht wissen, ob es sich dabei um die Erfüllung einer dienstlichen Vorschrift, die Urbarmachung von Neuland oder um delinquenten Waldfrevel handelt.
 
 Die mangelhafte "immanente Verständlichkeit" der meisten Gesten rührt daher, dass im Vergleich zur grenzenlosen Mannigfaltigkeit formulierbarer Sätze und Texte nur ein begrenztes Repertoire äusserlich klar unterscheidbarer Körperbewegungen zur Verfügung steht: so dass dieselben Bewegungsmuster je nach kulturellem und situativem Kontext mit ganz unterschiedliche Ausdrucksfunktionen befrachtet werden müssen. Ganz besonders armselig ist das Arsenal der sogenannten ritualisierten Gesten, die den strengen Anforderungen genügen müssen, von jedermann ohne besondere motorische Voraussetzungen ausführbar sowie ohne besondere perzeptive Anforderungen wahrnehmbar zu sein.

Das "Lächeln", "Händchen halten", "Kopfnicken" oder "Verneigen" sind einige dieser Standardgesten, deren besondere Kompatibilität mit physiologisch-anatomischen Voraussetzungen des menschlichen Organismus dafür sorgt, dass sie in praktisch allen Kulturen vorkommen und überall für eine grosse Vielfalt verschiedener Ausdrucksfunktionen Verwendung finden (Morris/Marsh/Shaughnessy 1979; Kendon 1983: 35, Ekman/Friesen 1971).

Nur im Lichte des Gesamtkontexts einer sozialen Beziehung oder situativen Bedingungskonstellation wird beispielsweise zweifelsfrei deutlich, ob ein lang ausgehaltener wechselseitiger Blick als Ausdruck inniger Liebe, als Artikulation einer dringenden Bitte, als bedrohliche Ankündigung bevorstehender Aggressionsakte oder als erfolgreiche Vorverständigung über eine homosexuelle Kontaktnahme gewertet werden soll: und katastrophale Missverständnisse sind wahrscheinlich, wenn hinsichtlich dieses umfassenden Interpretationsrahmens diskrepante Auffassungen bestehen.

Natürlich ist es in der weiten Sphäre subinstitutioneller Interaktionen häufig der Fall, dass Verhaltensabläufe nicht nur hinsichtlich der Frage ob es Handlungen seien, sondern auch was für Handlungen es seien, zwielichtig bleiben. Auch diese Mehrdeutigkeit kann taktisch benutzt werden, um unverbindliche Initiativen zu eröffnen und jederzeit zugängliche Rückzugsmöglichkeiten zu wahren: z.B. bei einem "sphinxhaften Lächeln", das ebensogut als Zeichen für freundschaftliches Einverständnis wie für mitleidige Verachtung gewertet werden kann; oder bei einem innig-warmen Händedruck zum Abschied, der nicht nur tiefes Bedauern über die Trennung, sondern auch die Gewissheit (bzw. den Entschluss), dass es nicht so bald zu einer Wiederbegegnung kommen wird, zum Ausdruck bringen kann.

In dem Masse, wie in einem kollokalen Interaktionssystem nonverbale Kommunikationen vorherrschen, fehlt diesem die Möglichkeit, mit Hilfe autonomer, endogener Prozesse den genauen Sinn der ausgetauschten Kommunikationsakte zu spezifizieren: vor allem weil es im Gegensatz zur verbalen Ebene nicht möglich ist, zur Verständigung über diesen Sinn metakommunikative Prozesse stattfinden zu lassen.

Mit andern Worten: Kollokalsysteme bezahlen die genannten Leistungsvorteile gestischer Kommunikationen teuer damit, dass sie an Autonomie verlieren und auf den Import von Deutungsmustern angewiesen sind, die ausserhalb ihrer selbst (z.B. auf der alokalen Ebene gesellschaftlicher Institutionen) festgelegt worden sind. Je undifferenzierter und intrinsisch vieldeutiger die Körpergebärden, desto grösser ist der Bedarf an derartigen exogenen Selektionshilfen, um ihren präzisen Sinn im Interaktionssystem zu fixieren und intersubjektiv zu stabilisieren. Dies trifft in besonders hohem Masse für Körperberührungen zu, die für den Rezipienten mit physischem Schmerz und/oder einer Verletzung seiner Intimsphäre verbunden sind und deshalb Gefühle der Bedrohung und Furcht auslösen, wenn nicht genau feststeht, wie sie gemeint sind und welchen voraussehbaren Beschränkungen (in der Intensität, Zeitdauer, Häufigkeit u.a.) sie unterliegen.

So ist es verständlich, dass Ärzte, Tanzlehrer, Physiotherapeuten, Massschneider oder Polizisten ihre berufsnotwendigen Körperberührungen meist innerhalb eines relativ scharf segregierten Situationskontexts vollziehen, bei dem schon durch die Wahl der Örtlichkeit, die instrumentale Ausstattung der Behandlungsräume, durch die Berufskleidung und mannigfache andere Rahmenbedingungen der Interaktion jeder Zweifel daran ausgeschlossen ist, dass eine rein funktional-professionelle, auf die Lösung einer spezifischen Einzelproblematik ausgerichtete (und deshalb transitorische) Sozialbeziehung besteht (vgl. Heslin/Alper 1983).

Und äusserst ritualisierte Schemata von "Takt" und "Höflichkeit" müssen in Anspruch genommen werden, um sicherzustellen, dass begrüssende Umarmungen oder Abschiedsküsse keine sexuellen Konnotationen mehr enthalten oder auch nur als Ausdruck einer innigen persönlichen Freundschaft gewertet werden (Heslin/Alper 1983).

Am Beispiel taktiler Körperkontakte wird auch am besten deutlich, dass diese exogenen Situationsdefinitionen und Interpretationsmuster keineswegs nur als kognitive Orientierungsschemata (d.h. zur Präzisierung bestimmter Sinndeutungen) benötigt werden, sondern auch als normative Motivationsfaktoren, denen die Kraft zukommen muss, gewisse emotionale und verhaltensmässige "Spontanreaktionen", die teilweise wohl biologisch mitgeprägt sind, zu neutralisieren.

Die Existenz derartiger "vornormativer" Elementarreaktionen erscheint naheliegend auf Grund des empirischen Befundes, dass nur Männer, nicht aber Frauen die Berührung einer ihnen wenig bekannten Person des anderen Geschlechtes als lustvoll empfinden, und dass taktile Kontakte unter Männern - unabhängig vom wechselseitigen Bekanntschaftsgrad - als unangenehm empfunden werden (vgl. Heslin/Alper 1983).

Während verbale Äusserungen vom psychischen oder gar physiologischen Apparat ihres Erzeugers her derart wenig präformiert sind, dass ihr Sinn rein konventionell festgelegt werden kann (und sie ausserhalb solcher Konventionen keinerlei Sinn besitzen), so muss sich der konventionelle Sinngehalt nonverbaler Verhaltensweisen häufig gegen den Widerstand elementarerer Deutungs- und Reaktionsweisen durchsetzen, die sich - entweder auf Grund ihrer biologischen Prägung oder ihrer traditionalen Habitualisierung - einer zweckgerichteten, absichtsvollen Umformung entziehen.

Entsprechend muss ein höheres Mass an Sozialisation und Dauerdisziplin aufgewendet werden, um nonverbale Verhaltensweisen aus derartigen Primärbindungen zu befreien und für zusätzliche Sinndeutungen (deren Mannigfaltigkeit und Variabilität sich korrelativ zur gesellschaftlichen Gesamtdifferenzierung erhöht) verfügbar zu machen.

 

2.2.5 Verbale Kommunikation

I

Unter "kollokaler Verbalkommunikation" sollen in erster Linie Gespräche unter mitanwesenden Interaktionspartnern verstanden werden; in einem weiteren Sinne aber alle sprachlichen Ausdruckskundgaben, die Individuen in (wahrgenommener) Hör- und Sichtweite anderer vollziehen: z.B. indem sie laute Selbstgespräche führen, Vorträge oder Lesungen abhalten oder bei ihren Aesserungen in einem Telephongespräch auf zufällige Zuhörer im selben Raume Rücksicht nehmen.

Unabhängig von der genaueren Art der situativen Bedingungen oder subjektiven Intentionen sind mit dem mündlichen Sprachgebrauch spezifische sozio-strukturelle Formungen, funktionale Leistungskapazitäten und Folgeprobleme verknüpft, die in der ausgesprochen hohen Variationsfähigkeit, Intentionalität und Präzisierbarkeit sowie in den rigiden Sequentialisierungszwängen des verbalen Mediums ihre Ursachen haben.

Diese Gesetzmässigkeiten der kollokalen Rede werden am besten erkennbar, wenn man sie als eine vierte, nicht nur im metaphorischen Sinne "höchste" Ebene kommunikativer Verständigung begreift, die die Ausdruckspotentiale der drei bisher diskutierten Medien bei weitem transzendiert, andererseits aber vielfältige Bindungen an sie aufrechterhält, durch die sie sich z.B. vom telephonischen oder schriftlichen Sprachgebrauch unterscheidet.

Das Theorem der "einseitigen Fundierung" (vgl. 2.2.1) besagt, dass alle nicht-verbalen Medien der Kommunikation unabhängig von der sprachlichen Ebene funktionsfähig sind, während die Sprache andererseits sie alle voraussetzt und sich nur auf ihrer Basis und mittels ihrer konstituierenden Mitwirkung aktualisiert.

So lassen sich einerseits sehr häufig völlig "sprachlose" Kollokalverhältnisse finden, wo sich die Teilnehmer im Medium ihrer physischen Anwesenheit und äusseren Erscheinung begegnen und sich ausschliesslich mittels gestischer Kundgaben verständigen: z.B. im Strassenverkehr, wo verbale Kommunikationen aus technischen und zeitlichen Gründen meist unterbleiben, oder bei gut eingespielten Fussballmannschaften oder Operationsteams, die nur in völlig stummer Kooperation ihre maximale Reaktionsfähigkeit und Effizienz erreichen.

Während die nonverbalen interpersonellen Verhaltensabläufe und Wahrnehmungen fast voraussetzungsfrei - und deshalb äusserst kontinuierlich, kaum bemerkt und nur schwer kontrollierbar - immer weiter laufen und dem Kollokalsystem eine verlässliche, nur durch simples Weggehen zerstörbare Integrationsbasis verleihen, so bildet die Sphäre verbaler Kommunikation einen vergleichsweise schmalbrüstigen und zerbrechlichen "Ueberbau", der sich nur intermittierend auf Grund besonderer Aufmerksamkeits- und Koordinationsleistungen der Mitglieder aus dem Dauerstrom nicht-verbaler Kundgaben erhebt und auch dann oft nur einen Teil aller Anwesenden in sich schliesst (vgl. Goffman 1969:14).

Andererseits ist es eben nicht denkbar, unter Bedingungen der Kollokalität ein rein verbales Interaktionssystem  zu finden, dessen Mitglieder ausser Redeäusserungen keine anderen irgendwie als informativ aufgefassten Wahrnehmungen ihrer Person aussenden würden, denn

-   bevor sie sprechen, haben sie sich wechselseitig bereits als Personen aufgefasst, die in diesem Moment am selben Ort anwesend sind, auf bestimmte Weise körperlich gebaut und gekleidet sind, auf spezifische Art gehen, stehen oder sitzen und ihre Zuwendung zueinander durch Bewegungen des Kopfes, Handbewegungen, Blicke u.a. zum Ausdruck bringen

-   während  sie sprechen, können sie nicht anders, als ihre Rede im Medium spezifischer nicht-verbaler Verhaltensfärbungen zum Ausdruck zu bringen: Vom Tonfall der Stimme über die Allokation von Akzentuierungen und Sprechpausen bis zur dauernd lebendigen Mimik und Gliedergestik spannt sich der Bogen unvermeidlicher begleitender Ausdrucksweisen, die den sprachlichen Kommunikationsfluss  dauernd begleiten und ihren Sinngehalt teils zusätzlich betonen, präzisieren oder komplementär ergänzen, teils abschwächen und auf schillernd-verunsichernde Weise mit ihm kontrastieren.

In jedem Falle werden kollokale Sprecher einander eine insgesamt komplexere, wegen ihrer Mehrdimensionalität schwerer in ein konsistentes Gesamtbild zu integrierende Informationsfülle zukommen lassen als Telephonpartner, die einander höchstens einige akustisch wahrnehmbare Begleitkorrelate vermitteln, oder gar Briefeschreiber, deren Adressaten den gesamten Sinngehalt der Botschaft aus den expliziten verbalen Formulierungen zu entschlüsseln haben.

So muss beispielsweise jeder Vortragsredner mit der Tatsache umgehen, dass er seinem Publikum unvermeidlicherweise mehr von sich mitteilt, als den von ihm verfassten und verlesenen Text (Goffman 1981: 162ff); und er muss deshalb versuchen, auch diesen zusätzlichen, ihm selbst vielleicht am allerwenigsten bewussten Strom von Ausdruckskundgaben in intentionale Bahnen zu lenken. Und wer immer in heiklen und emotionalisierten Angelegenheiten die mündliche Unterredung dem Briefschreiben vorzieht, muss damit rechnen, gleichzeitig mit dem Sinn seiner Rede auch den sie motivierenden inneren Erregungszustand zum Ausdruck zu bringen.

  Vielleicht lässt sich dem zwiespältige Charakter der mündlichen Rede am besten dadurch Rechnung tragen, dass man sie als ein Interferenzphänomen zwischen einem digitalen Kommunikationsmedium (Sprache) und mehreren "analogen" Medien (persönliche Erscheinung, Gestik u.a.) konzeptualisiert:

1) Unter dem Aspekt, dass etwas gesagt wird, erscheint die gesprochene Rede als Anwendungsfall eines konventionellen sprachlichen  Codes. Der digitale Charakter dieses Mediums ist allerdings nur bei schriftlichen Aeusserungen unverfälscht sichtbar, deren Sinngehalt sich vollständig aus der Wahl oder Nichtwahl bestimmter Buchstabenreihungen, Wörter, Sätze u.a. ergibt, ohne dass die Art der Drucktype, die Fleckenhaftigkeit des Papiers etc. diesen Sinn im mindesten mitbeeinflussen würden.

    Auch die mündliche Rede erhält durch den Sprachcode einen "lokutionären Kerngehalt an Sinn", der allein auf etablierten Sprachregelungen und -bedeutungen beruht und durch alle spezifischen Weisen der Aussprache und Begleitgestik hindurch persistiert.

2) Unter dem Gesichtspunkt, wie etwas gesagt wird, kann man die mündliche Rede als jene spezifische Form sprachlicher Kommunikation identifizieren, die im Gegensatz zur Schrift auf analogen (d.h. kontinuierlich-variablen) Trägermedien beruht: z.B. auf der Art der Stimmführung oder der begleitenden Gesichtsmimik, mit deren subtilen Ausprägungen das Gemeinte und das Verstandene je nach der Differenziertheit des Ausdrucks- und des Wahrnehmungsvermögens kovariiert (Kendon 1981: 3f, Knapp 1983).

Für den einzelnen Sprecher entsteht aus diesem Nebeneinander zweier teils substitutiver, teils komplementärer Medien ein reiches Arsenal kombinierter Enkodierungsmöglichkeiten, denen allerdings auch entsprechend differenzierte Dekodierungsfähigkeiten seitens der Rezipienten gegenüberstehen müssen.

Die partielle Substitutivität  (d.h. funktionale Aequivalenz) beider Medien eröffnet die Chance, sie wechselseitig von allzu hoher Informationsfracht zu entlasten: z.B. indem das Vorzeigen der Armbanduhr die verbale Zeitangabe oder das modellhafte Vormachen einer Arbeitshandlung ausführliche Erläuterungen ersetzt, oder indem der genauen Wortwahl und Satzformulierung weniger als im Schriftverkehr Beachtung geschenkt werden muss, weil Intonation der Stimme und begleitende Gesten den gemeinten Sinn ohren- und augenfällig machen (vgl. Goffman, 1981: 190). Genauso mag ein verbales Liebesgeständnis ein Pärchen davon entlasten, die Intensität der Beziehung allein auf dem Wege inniger Gesten zum Ausdruck zu bringen: ähnlich wie der wortreich-monologisierende Schauspieler weniger leibliche Kundgaben als der Pantomime benötigt, und der Vortragsredner durch blosse Sprechpausen jene Zäsuren deutlich machen kann, die im schriftlichen Text durch explizite Titelgliederungen bezeichnet werden müssen.

Und die komplementären Funktionsmerkmale beider Kommunikationsebenen bieten sich für eine Differenzierung des Uebermittlungsprozesses in dem Sinne an, dass die konventionelleren und expliziter kodierbaren Aspekte einer Botschaft ins verbale Medium eingekleidet werden und die personengebundenen, nur diffus ausdrückbaren oder absichtlich in ungewisser Schwebe gehaltenen Komponenten in der nicht-verbalen Sphäre verbleiben.

Vor allem kommt den gestisch-mimischen und akustischen Begleitkundgaben sehr häufig die Aufgabe zu, simultan mit der lokutionären Botschaft metakommunikative Informationen über ihre illokutionäre Zielrichtung mitzuliefern: z.B. wenn die Ernsthaftigkeit einer Mahnung im gemessenen oder schneidenden Charakter der Stimmführung ihre Unterstützung findet, hinter der geäusserten Bitte ein verzweiflungsvoller Hilfeschrei durchschimmert oder wenn heiter-schmunzelnde Untertöne die Ironie in einer - an sich völlig sachneutral formulierten - Aeusserung deutlich machen.

Einer der - wenig thematisierten - unbestrittenen Vorzüge "persönlicher Begegnungen" gegenüber fernmündlichem oder schriftlichem Verkehr liegt ohne Zweifel darin, dass derartige illokutionäre Spezifikationen

-   simultan mit der verbalen Aeusserung geliefert werden, während sie z.B. bei Briefen dem Referenztext (als metakommunikative Verbalexplikationen) vor-, zwischen- oder nachgestellt werden müssen;

-   mit Hilfe eines überaus reichen Arsenals beliebig abstufbarer Ausdrucksweisen kommunizierbar sind, während im Sprachcode dafür nur wenige, relativ standardisierte Formeln zur Verfügung stehen;

-   im Interesse der Offenheit und Flexibilität des Gesprächsfortgangs relativ unverbindlich und in ihrer Bedeutung unbestimmt gehalten werden können: während Schriftlichkeit den Zwang in sich schliesst, sich explizit und irreversibel festzulegen und dem Emittenten die Rückzugsmöglichkeit entzieht, "es in Wirklichkeit nicht so gemeint zu haben." (vgl. Kendon 1981:13f; Luhmann 1972).

Zu den häufigsten und unentbehrlichsten illokutionären Begleitgesten des mü