BEIHEFTE ZUR ZEITSCHRIFT FR ROMANISCHE PHILOLOGIE BEGRNDET VON GUSTAV GRBER HERAUSGEGEBEN VON GNTER HOLTUS
Band 35...
29 downloads
1323 Views
3MB Size
Report
This content was uploaded by our users and we assume good faith they have the permission to share this book. If you own the copyright to this book and it is wrongfully on our website, we offer a simple DMCA procedure to remove your content from our site. Start by pressing the button below!
Report copyright / DMCA form
BEIHEFTE ZUR ZEITSCHRIFT FR ROMANISCHE PHILOLOGIE BEGRNDET VON GUSTAV GRBER HERAUSGEGEBEN VON GNTER HOLTUS
Band 354
NICOLAS MAZZIOTTA
Ponctuation et syntaxe dans la langue franÅaise mdivale tude dun corpus de chartes originales crites Lige entre 1236 et 1291
n MAX NIEMEYER VERLAG TBINGEN 2009
Les matériaux utilisés dans le cadre de la présente étude sont accessibles à l’adresse suivante: http://hdl.handle.net/2268/25773.
Bibliografische Information der Deutschen Nationalbibliothek Die Deutsche Nationalbibliothek verzeichnet diese Publikation in der Deutschen Nationalbibliografie; detaillierte bibliografische Daten sind im Internet ber http://dnb.ddb.de abrufbar. ISBN 978-3-11-023105-2
ISSN 0084-5396
Max Niemeyer Verlag, Tbingen 2009 Ein Imprint der Walter de Gruyter GmbH & Co. KG http://www.niemeyer.de Das Werk einschließlich aller seiner Teile ist urheberrechtlich geschtzt. Jede Verwertung außerhalb der engen Grenzen des Urheberrechtsgesetzes ist ohne Zustimmung des Verlages unzulssig und strafbar. Das gilt insbesondere fr Vervielfltigungen, bersetzungen, Mikroverfilmungen und die Einspeicherung und Verarbeitung in elektronischen Systemen. Printed in Germany. Gedruckt auf alterungsbestndigem Papier. Gesamtherstellung: Hubert & Co., Gçttingen
Préface
L’ouvrage de Nicolas Mazziotta est un travail profondément original et nouveau. L’auteur s’est en effet fixé pour tâche de répondre à la question suivante: «Comment, d’après ce qu’on peut observer dans les chartes écrites en français à Liège avant 1292, la ponctuation originale interagit-elle avec la syntaxe dans la langue française médiévale?» Il s’agit là en effet d’un champ d’analyse presque totalement neuf, de deux points de vue. D’une part, les études sur la ponctuation sont assez rares, et celles sur la ponctuation des textes français médiévaux le sont encore davantage. D’autre part, la plupart de ces analyses ont recherché les critères d’emploi des signes de ponctuation aux divers niveaux de représentation et de performance du texte; or N. M. a opéré un choix très différent, et très ambitieux: celui de placer son enquête au seul plan de la syntaxe. En cela, il reprend l’hypothèse de M.-G. Boutier selon laquelle la structuration syntaxique du texte suffit à rendre compte de l’essentiel de la ponctuation. Cette proposition, très forte, demandait à être validée sur un corpus important: grâce à cet ouvrage, c’est désormais réalisé. Certes, nous y reviendrons, valider cette hypothèse ne revient pas à poser qu’elle est la seule possible; une telle analyse, même réussie, n’invalide pas d’autres approches, d’autres hypothèses, en particulier des explications plus complexes croisant syntaxe et intonation, par exemple. Mais après ce travail on peut considérer comme acquis que syntaxe et ponctuation ont partie liée. Pour mener à bien son enquête, l’auteur a travaillé sur un corpus quantitativement important (148 chartes, plus de 60 000 mots), et il s’est attaché à fournir de chaque énoncé et de chaque élément de ce corpus, ponctué ou non, une analyse syntaxique intégrée permettant ensuite d’intervenir avec les outils de calcul statistique et de traitement informatique. Ce faisant, N. M. n’a pas choisi la facilité: il aurait pu, de façon plus traditionnelle, se contenter de sélectionner uniquement les cas d’usage de marques de ponctuation, et d’en décrire le contexte. Le candidat a préféré partir de la «population» globale des constituants linguistiques, pour voir lesquels, dans quelles fonctions et positions, «attiraient» une ponctuation, lesquels au contraire y étaient rétifs. L’organisation de l’ouvrage est claire et progressive. Après une brève mais dense Introduction qui souligne les difficultés et les nouveautés (dont l’hypothèse testée ici) de sa recherche, et une spécification des concepts requis, l’auteur donne un excellent chapitre →2, qui retient le meilleur des travaux fondateurs de Catach et d’Anis, et propose une organisation conceptualisée de la spatialité de l’écrit qui, par étapes, permet de définir les ponctogrammes comme des unités spécifiées par un trait, la nonparaphrasabilité. On a là l’un des aspects qui font l’originalité de ce travail: il ne s’agit plus de considérer les marques de ponctuation comme des unités chacune prise dans
V
son contexte; mais bien au contraire, c’est leur organisation d’ensemble qui fait sens, c’est la façon dont elles structurent le tissu – ici posé comme tissu syntaxique. Une telle approche nécessitait l’adoption d’une conception linguistique qui permette de structurer le texte en éléments. N. M. a choisi de se situer dans le cadre de la linguistique argumentale (Tesnière, Lazard, Lemaréchal), et il a construit un modèle proposant une structuration des constituants par relations et hiérarchisée. Une fois les fondements posés, l’analyse des données constitue la seconde partie de l’ouvrage. Les résultats sont clairement exposés, en particulier en tableaux et figures. La spécificité de chacun des ponctogrammes apparaît clairement: sans surprise, le punctum révèle son écrasante domination et sa polyvalence. On ne peut qu’être impressionné par tout à la fois l’ampleur de cette démarche et l’exigence de rigueur qu’elle révèle: on trouvera là à bien des égards un modèle, reproductible car non impressionniste et explicite, pour des études comparables. Grâce à une telle démarche, l’étude de la ponctuation gagne définitivement son domaine propre et révèle son importance. De notre point de vue, il s’agit là d’une étape importante, peut-être fondatrice; mais ce ne peut être qu’une étape. En effet, l’hypothèse «syntaxique» demandait à être vérifiée; et cette analyse vérifie que toute marque de ponctuation peut s’expliquer par l’existence d’une frontière syntaxique. Trois chapitres décrivent les corrélations entre chaque type d’unités syntaxiques et chacun des «ponctogrammes»; ce travail a le mérite de révéler des régularités: la fréquence du marquage ponctué n’est pas la même suivant la nature des structures argumentales; et une quinzaine de tableaux permettent d’ailleurs de voir si l’attraction (ou la répulsion) de telle unité avec tel signe se fait «vers la gauche» ou «vers la droite». Mais le fait que cette relation ne soit pas systématique, qu’il n’y ait pas ponctuation dès lors qu’il y a frontière syntaxique, montre qu’il subsiste un «reste» à analyser. Divers travaux antérieurs avaient mis l’accent sur la valeur pragmatique, intonative peut-être, du marquage ponctué. Peut-être une prochaine étape pourrait-elle consister à réexaminer ces hypothèses, au moins en ce qui concerne certains pongtogrammes, et à mettre au jour d’autres régularités, telles que par exemple celle qu’on a pu mettre en évidence pour l’emploi du comma dans un manuscrit de la Queste del saint graal: certes, son emploi coïncide avec certaines frontières syntaxiques, de deux types: après Ha ou Hé en début de prise de parole, et à la jonction’ de deux éléments de phrase corrélés («Car ausi com Cayns ocist Abel au vendredi · ausi ocist Judas son creator au vendredi.», ms. K de Lyon, f. 211c, corresp. p. 217 de l’éd. Pauphilet). C’est l’hétérogénéité de ces deux types d’emploi qui nous a conduite à rechercher le trait qu’ils ont en commun: la volonté du copiste d’indiquer une montée de la voix (Marchello-Nizia 2007). Or on constate que par exemple un emploi du comma analysé par l’auteur uniquement du point de vue syntaxique (→0.1.1.2, p. 4 et s.), et qui se trouve dans une charte dont la référence est: Document 1236–05, 6, ressortirait clairement à une autre analyse, intonative et corrélative: ce comma accompagne la reprise-répétition du que, c’est à dire qu’il marque, plus qu’une frontière syntaxique, une indication de continuité à prévoir, tant dans l’intonation (élévation de la voix?) que dans la corrélation qui est à établir entre les deux que de même fonction. Ce premier ouvrage du jeune chercheur qu’est encore Nicolas Mazziotta marque à notre avis un moment capital dans le renouveau des études sur l’évolution de la ponctuation: ce travail remarquable et novateur dans ses exigences et sa méthodolo-
VI
gie apporte des résultats incontournables, toute autre étape devra d’abord prendre en compte ces acquis. Christiane Marchello-Nizia
Remerciements Qu’il me soit permis de remercier les personnes suivantes pour l’aide qu’elles m’ont apportée, que ce soit sur le plan scientifique que sur le plan émotionnel. Je remercie tout d’abord mes professeurs et collègues de l’Université de Liège: Marie-Guy Boutier (qui a dirigé cette étude), Pierre Swiggers, Jean-Marie Klinkenberg, Étienne Évrard, Gérald Purnelle, Philippe Lambert, ainsi qu’Esther Baiwir, Pascale Renders et France Gabriel. Ma gratitude va également à mes collègues de l’École Normale Supérieure – Lettres et sciences humaines de Lyon: Céline Guillot, Serge Heiden et Alexei Lavrentiev. Je remercie également les membres du jury extérieurs à l’Université de Liège, qui ont évalué la thèse qui a engendré ce livre: Christiane MarchelloNizia et Günter Holtus. Mes amis et la famille ont également permis à ce travail d’aboutir; merci à Laurent Bozard, à Brigitte Antoine et à Jean-Christophe Vanhalle, à Lionel Lardinois, à Pierre Doyen et à « Rémy », mais aussi à Laetitia Godfroid et à Christophe Lejeune ainsi qu’à Véronique Voisin. Merci également à mes frères Julien, Pierre-François et Thomas (pour sa protection), à ma sœur Olivia et à mes parents Bernadette et François. Les membres de ma belle-famille méritent également ma gratitude: Annette de Martin, Anne Lochet et Kévin Jeanfils. Merci enfin à Catherine pour son indéfectible confiance et son amour sans limite, ainsi qu’à Jeanne pour la joie qu’elle nous procure chaque jour. Nicolas Mazziotta
VII
Table des matières
Table des figures . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
XVII
Liste des tableaux . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
XXVII
0
Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 0.1 Objectifs de l’étude . . . . . . . . . . . . . . . . . . . . . . . . . 0.1.1 Études précédentes . . . . . . . . . . . . . . . . . . . . . 0.1.1.1 Pluralité des valeurs de la ponctuation médiévale 0.1.1.2 Le «pari» de la syntaxe . . . . . . . . . . . . . 0.1.2 Position de la présente étude . . . . . . . . . . . . . . . . 0.2 Corpus . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 0.2.1 Genèse du projet Khartês et constitution du corpus . . . . 0.2.2 Problèmes liés au corpus . . . . . . . . . . . . . . . . . . 0.2.2.1 Hétérogénéité des types discursifs . . . . . . . 0.2.2.2 Quantité de données . . . . . . . . . . . . . . 0.3 Plan de l’étude . . . . . . . . . . . . . . . . . . . . . . . . . . . . 0.3.1 Première partie: modélisation . . . . . . . . . . . . . . . 0.3.2 Deuxième partie: analyse des données . . . . . . . . . . . 0.4 Ressources techniques . . . . . . . . . . . . . . . . . . . . . . . . 0.5 Travail en cours . . . . . . . . . . . . . . . . . . . . . . . . . . . 0.5.1 Erreurs et évolutivité . . . . . . . . . . . . . . . . . . . . 0.5.2 Programmation des requêtes . . . . . . . . . . . . . . . .
1
Préalables épistémologiques: concepts et terminologie 1.1 Mécanisme de conceptualisation . . . . . . . . 1.2 Impératifs terminologiques . . . . . . . . . . . 1.2.1 Établir une terminologie . . . . . . . . 1.2.2 Positionnement . . . . . . . . . . . . . 1.3 Conventions de schématisation des concepts . . 1.3.1 Présentation des conventions . . . . . . 1.3.2 Intérêts . . . . . . . . . . . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
13 14 15 15 16 17 17 18
2
Théorie de l’écriture et ponctuation . . . . . . . . . . . 2.1 Regard linguistique sur l’écriture . . . . . . . . . 2.1.1 L’écriture et les regards possibles . . . . 2.1.2 Constitution du concept de langue écrite
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
19 20 20 20
1 1 2 2 4 4 5 5 6 6 8 9 9 9 10 11 11 12
IX
. . . . . . . . . . . . . . . . . . . . . . . . . . des . . . . . . . . . . . . . . . . . . . . . . . . . . . .
21 21 24 24 25 25 25 27 29 29 30 30 30
Modèle d’analyse linguistique . . . . . . . . . . . . . . . . . . . . . . . 3.1 Préalables méthodologiques . . . . . . . . . . . . . . . . . . . . . 3.1.1 Concepts et terminologie linguistique . . . . . . . . . . . 3.1.2 Les unités de base . . . . . . . . . . . . . . . . . . . . . 3.1.2.1 Unité maximale: le texte . . . . . . . . . . . . 3.1.2.2 Unité minimale: le mot . . . . . . . . . . . . . 3.1.3 Décrire l’ancien français . . . . . . . . . . . . . . . . . . 3.1.3.1 Décrire la langue: triple organisation de l’énoncé 3.1.3.2 Comprendre un état de langue passé . . . . . . 3.1.3.3 Juger et prévoir la structure . . . . . . . . . . 3.1.3.4 Relativité des modèles . . . . . . . . . . . . . 3.2 Morphologie et syntaxe . . . . . . . . . . . . . . . . . . . . . . . 3.2.1 La syntaxe comme un système de relations . . . . . . . . 3.2.1.1 Un système de dépendances . . . . . . . . . . 3.2.1.2 Relation minimale . . . . . . . . . . . . . . . 3.2.2 La morphologie et le système de marques . . . . . . . . . 3.2.2.1 Expression et contenu . . . . . . . . . . . . . 3.2.2.2 Marques et spécification . . . . . . . . . . . .
47 47 48 49 49 50 53 53 56 57 59 60 60 60 62 64 64 65
2.2
2.3
2.4 3
X
2.1.2.1 Un moule d’envisagement de l’objet langue 2.1.2.2 Relation entre écriture et langue . . . . . . 2.1.2.3 Vers une définition de la langue écrite . . . Classement et nomination des unités de la langue écrite . . . . 2.2.0 Préalables . . . . . . . . . . . . . . . . . . . . . . . . 2.2.0.1 Orientation de la démarche de classement . 2.2.0.2 L’activité pratique de transcription . . . . . 2.2.1 Unité de base et première dichotomie . . . . . . . . . 2.2.2 Critère fonctionnel de double articulation . . . . . . . 2.2.2.1 Types de grammèmes . . . . . . . . . . . 2.2.2.2 Types de topèmes . . . . . . . . . . . . . . 2.2.3 Critère spatial . . . . . . . . . . . . . . . . . . . . . . 2.2.3.1 Autonomie des plérégrammes . . . . . . . 2.2.3.2 Axes de construction et de combinaison grammèmes . . . . . . . . . . . . . . . . . 2.2.4 Paraphrasabilité et plurisystème . . . . . . . . . . . . 2.2.4.1 Paraphrasabilité . . . . . . . . . . . . . . 2.2.4.2 Abréviations et plurisystème . . . . . . . . 2.2.5 Synthèse: hiérarchie des scriptèmes . . . . . . . . . . La ponctuation comme objet d’étude . . . . . . . . . . . . . . 2.3.1 Recherche d’une définition . . . . . . . . . . . . . . . 2.3.1.1 Définitions existantes . . . . . . . . . . . . 2.3.1.2 Définition adoptée . . . . . . . . . . . . . 2.3.2 Valeur des ponctogrammes . . . . . . . . . . . . . . . 2.3.2.1 Multiplicité des fonctions . . . . . . . . . 2.3.2.2 Largeur du champ . . . . . . . . . . . . . 2.3.3 Inventaire des formes . . . . . . . . . . . . . . . . . . Conclusions . . . . . . . . . . . . . . . . . . . . . . . . . . .
32 34 35 36 38 38 38 38 42 42 43 43 45 45
3.2.2.3
3.3
3.4
Des marques qui n’expriment pas que des relations . . . . . . . . . . . . . . . . . . . . . . 3.2.3 Niveaux d’analyse syntaxique . . . . . . . . . . . . . . . 3.2.3.1 Tripartition de la syntaxe selon Gilbert Lazard 3.2.3.2 Des marques à tous les niveaux . . . . . . . . Parties du discours . . . . . . . . . . . . . . . . . . . . . . . . . . 3.3.1 L’impasse de la voie traditionnelle . . . . . . . . . . . . . 3.3.2 L’impasse de la voie syntaxique . . . . . . . . . . . . . . 3.3.3 Catégories sémantiques grammaticalisées et syntaxe de mot 3.3.3.1 Verbes . . . . . . . . . . . . . . . . . . . . . 3.3.3.2 Noms . . . . . . . . . . . . . . . . . . . . . . 3.3.3.3 Adverbes . . . . . . . . . . . . . . . . . . . . 3.3.4 Synthèse . . . . . . . . . . . . . . . . . . . . . . . . . . Description analytique de l’ancien français des chartes . . . . . . . 3.4.1 Du texte à la phrase, en passant par l’énoncé . . . . . . . 3.4.1.1 Délimiter l’énoncé et la phrase . . . . . . . . . 3.4.1.2 Phrases-énoncés et énoncés non phrastiques . . 3.4.1.3 Enchaînement des énoncés phrastiques . . . . 3.4.1.4 Synthèse . . . . . . . . . . . . . . . . . . . . 3.4.2 Subdivision de la phrase et structure argumentale . . . . . 3.4.2.1 Relations argumentales: généralités . . . . . . 3.4.2.2 Actants et marques morphologiques . . . . . . 3.4.2.3 Circonstants . . . . . . . . . . . . . . . . . . 3.4.2.4 Cas «intermédiaires» . . . . . . . . . . . . . . 3.4.2.5 Synthèse . . . . . . . . . . . . . . . . . . . . 3.4.3 Construction du prédicat . . . . . . . . . . . . . . . . . . 3.4.3.1 Problème des temps «composés» . . . . . . . 3.4.3.2 Position adoptée . . . . . . . . . . . . . . . . 3.4.4 Construction des arguments . . . . . . . . . . . . . . . . 3.4.4.1 Noms: spécification synthétique additionnelle . 3.4.4.2 Noms: spécification analytique segmentale . . 3.4.4.3 Noms: spécification séquentielle . . . . . . . . 3.4.4.4 Adverbes . . . . . . . . . . . . . . . . . . . . 3.4.4.5 Propositions avec prédicat personnel . . . . . . 3.4.4.6 Propositions avec prédicat non personnel . . . 3.4.4.7 Synthèse . . . . . . . . . . . . . . . . . . . . 3.4.5 Construction des énoncés non phrastiques . . . . . . . . . 3.4.5.1 Structure exprimant un procès . . . . . . . . . 3.4.5.2 Structure n’exprimant pas un procès . . . . . . 3.4.6 Relations immédiates . . . . . . . . . . . . . . . . . . . . 3.4.6.1 Apposition et détermination . . . . . . . . . . 3.4.6.2 Spécification de la détermination . . . . . . . 3.4.6.3 Adverbes . . . . . . . . . . . . . . . . . . . . 3.4.6.4 Propositions avec prédicat personnel . . . . . . 3.4.6.5 Propositions avec prédicat non personnel . . . 3.4.6.6 Synthèse . . . . . . . . . . . . . . . . . . . . 3.4.7 Problèmes généraux . . . . . . . . . . . . . . . . . . . .
66 67 67 68 69 69 70 71 72 73 74 75 76 77 77 79 82 85 86 86 90 96 98 101 104 104 105 106 106 107 109 110 111 114 118 119 119 121 122 122 126 127 131 136 137 137
XI
3.4.7.1
3.5
3.4.7.2 3.4.7.3 3.4.7.4 3.4.7.5 3.4.7.6 Conclusions . .
Relations argumentales ou relations diates? . . . . . . . . . . . . . . . . . Coordination . . . . . . . . . . . . . . Hiérarchie des appositions . . . . . . . Portée des sélections . . . . . . . . . . Structures discontinues . . . . . . . . . Hors système . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
immé. . . . . . . . . . . . . . . . . . . . . . . . . . . .
138 141 144 145 147 148 149
4
Méthode d’analyse statistique . . . . . . . . . . . . . . . . . . . 4.1 Introduction aux principes de statistiques employés . . . . . 4.1.1 Individus et variables . . . . . . . . . . . . . . . . 4.1.2 Distribution et représentations graphiques . . . . . 4.1.2.1 Données . . . . . . . . . . . . . . . . 4.1.2.2 Histogramme . . . . . . . . . . . . . . 4.1.2.3 Courbe de densité . . . . . . . . . . . 4.1.2.4 Boîte à moustaches . . . . . . . . . . . 4.1.3 Test d’hypothèse . . . . . . . . . . . . . . . . . . 4.1.3.1 Concept d’hypothèse nulle . . . . . . . 4.1.3.2 Jugement de l’utilisateur . . . . . . . . 4.2 Statistiques et validité des analyses . . . . . . . . . . . . . 4.2.1 Nature des données . . . . . . . . . . . . . . . . . 4.2.2 Pertinence des questions . . . . . . . . . . . . . . 4.2.3 Formalisation des données . . . . . . . . . . . . . 4.2.4 Finesse de la description . . . . . . . . . . . . . . 4.2.4.1 Réintroduction des informations . . . . 4.2.4.2 Commentaire des données insuffisantes 4.2.5 Évolution du corpus et de la démarche d’analyse . 4.2.5.1 Reproductibilité . . . . . . . . . . . . 4.2.5.2 Recherche de l’inattendu . . . . . . . . 4.2.5.3 Perfectibilité des étapes . . . . . . . . 4.3 Mode opératoire . . . . . . . . . . . . . . . . . . . . . . . 4.3.1 Ordre de l’analyse . . . . . . . . . . . . . . . . . 4.3.2 Présentation des dépouillements et des résultats . .
. . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . . . .
151 151 152 153 153 154 154 155 156 156 157 158 158 159 159 160 161 162 162 162 162 163 164 164 165
5
Tendances générales . . . . . . . . . . . . . . . . . . . . . 5.0 Définition des données . . . . . . . . . . . . . . . . . 5.0.1 Choix des individus et taille de l’échantillon . 5.0.2 Définition des individus . . . . . . . . . . . 5.0.2.1 Variables morphosyntaxiques . . 5.0.2.2 Variables positionnelles . . . . . 5.0.2.3 Variables ponctuationnelles . . . 5.0.2.4 Définition complète de l’exemple 5.1 Tris à plat . . . . . . . . . . . . . . . . . . . . . . . . 5.1.1 Variables morphosyntaxiques . . . . . . . . 5.1.1.1 Variable MI . . . . . . . . . . . . 5.1.1.2 Variable MF . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
167 167 167 168 168 169 169 170 170 171 171 171
XII
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
5.2
5.3
5.1.1.3 Variable MN . . . . . . . . . . . . . . . . . . 5.1.1.4 Variable MR . . . . . . . . . . . . . . . . . . 5.1.1.5 Synthèse des variables morphosyntaxiques . . 5.1.2 Variables positionnelles . . . . . . . . . . . . . . . . . . 5.1.3 Ponctuation . . . . . . . . . . . . . . . . . . . . . . . . . 5.1.3.1 Données . . . . . . . . . . . . . . . . . . . . 5.1.3.2 Difficultés . . . . . . . . . . . . . . . . . . . Tris croisés par variable . . . . . . . . . . . . . . . . . . . . . . . 5.2.1 Guide de lecture . . . . . . . . . . . . . . . . . . . . . . 5.2.1.1 Tableau de contingence . . . . . . . . . . . . . 5.2.1.2 Test du χ2 («chi-carré») . . . . . . . . . . . . 5.2.1.3 Rapport de chances . . . . . . . . . . . . . . . 5.2.1.4 Structure de l’écart . . . . . . . . . . . . . . . 5.2.1.5 Test exact de Fisher . . . . . . . . . . . . . . 5.2.2 Examen des tris croisés . . . . . . . . . . . . . . . . . . . 5.2.2.1 Variable MI . . . . . . . . . . . . . . . . . . . 5.2.2.2 Variable MF . . . . . . . . . . . . . . . . . . 5.2.2.3 Variable MN . . . . . . . . . . . . . . . . . . 5.2.2.4 Variable MR . . . . . . . . . . . . . . . . . . 5.2.2.5 Variable LID . . . . . . . . . . . . . . . . . . 5.2.2.6 Variable LIF . . . . . . . . . . . . . . . . . . 5.2.3 Synthèse et critique de la démarche . . . . . . . . . . . . 5.2.3.1 Ponctuation et segmentation en constituants . . 5.2.3.2 Un panorama trop général . . . . . . . . . . . 5.2.3.3 Atomisation des individus . . . . . . . . . . . Tris croisés sur une variable de synthèse . . . . . . . . . . . . . . 5.3.1 Procédure . . . . . . . . . . . . . . . . . . . . . . . . . . 5.3.1.1 Fusion des variables . . . . . . . . . . . . . . 5.3.1.2 Séparation par modalité de MI . . . . . . . . . 5.3.1.3 Décomposition des écarts . . . . . . . . . . . 5.3.2 Examen des tris croisés . . . . . . . . . . . . . . . . . . . 5.3.2.1 Phrase . . . . . . . . . . . . . . . . . . . . . . 5.3.2.2 Propositions personnelles de fonction argumentale . . . . . . . . . . . . . . . . . . . . . . . 5.3.2.3 Propositions non personnelles de fonction argumentale . . . . . . . . . . . . . . . . . . . . . 5.3.2.4 Arguments non propositionnels . . . . . . . . 5.3.2.5 Propositions personnelles de fonction immédiate 5.3.2.6 Propositions non personnelles de fonction immédiate . . . . . . . . . . . . . . . . . . . . . 5.3.2.7 Constituants non propositionnels de fonction immédiate . . . . . . . . . . . . . . . . . . . 5.3.3 Synthèse . . . . . . . . . . . . . . . . . . . . . . . . . . 5.3.3.1 Régularités . . . . . . . . . . . . . . . . . . . 5.3.3.2 Tableaux synoptiques . . . . . . . . . . . . . . 5.3.3.3 Points forts et questions . . . . . . . . . . . .
172 172 173 173 174 174 174 176 177 177 177 180 180 181 181 182 183 184 185 185 186 187 187 188 190 191 191 191 192 193 194 194 201 205 208 211 215 216 218 219 219 224
XIII
6
Fréquences de marquage . . . . . . . . . . . . . . . . . . . . . . . . . . 6.0 Procédure d’analyse . . . . . . . . . . . . . . . . . . . . . . . . . 6.0.1 Définition des données . . . . . . . . . . . . . . . . . . . 6.0.1.1 Variables additionnelles . . . . . . . . . . . . 6.0.1.2 Sélection des individus . . . . . . . . . . . . . 6.0.2 Étapes de l’analyse . . . . . . . . . . . . . . . . . . . . . 6.1 Examen des structures argumentales et de la coordination . . . . . 6.1.1 Phrase et proposition personnelle . . . . . . . . . . . . . 6.1.1.1 Fréquence du marquage initial . . . . . . . . . 6.1.1.2 Fréquence du marquage final . . . . . . . . . . 6.1.1.3 Synthèse de l’analyse sur la ponctuation de la phrase . . . . . . . . . . . . . . . . . . . . . . 6.1.2 Prédicat . . . . . . . . . . . . . . . . . . . . . . . . . . . 6.1.2.1 P0 et PPD de manière générale . . . . . . . . . 6.1.2.2 P0 et PPF de manière générale . . . . . . . . . 6.1.2.3 1,0,P0,0,0 et PPD dans MI.¬pers . . . . . . . 6.1.2.4 Synthèse . . . . . . . . . . . . . . . . . . . . 6.1.3 Actants et A4 . . . . . . . . . . . . . . . . . . . . . . . . 6.1.3.1 0,0,S1,0,0 (phrase): PPD . . . . . . . . . . . . 6.1.3.2 0,0,S1,0,0 (phrase): PPF . . . . . . . . . . . . 6.1.3.3 0,1,S1,pers,1 (phrase): PPD . . . . . . . . . . 6.1.3.4 0,0,R2,0,0 (phrase, ¬pers): PPD . . . . . . . . 6.1.3.5 0,0,R2,0,0 (phrase, pers-arg, ¬pers-arg, pers): PPF . . . . . . . . . . . . . . . . . . . . . . . 6.1.3.6 0,0,R2,pers,1 (pers): PPD . . . . . . . . . . . 6.1.3.7 0,0,R2,pers,1 (phrase, pers): PPF . . . . . . . 6.1.3.8 0,1,R2,0,0 (phrase): PPD . . . . . . . . . . . . 6.1.3.9 0,1,R2,pers,1 (¬pers-arg): PPD . . . . . . . . 6.1.3.10 0,0,R2,¬pers,0 (phrase, pers): PPF . . . . . . . 6.1.3.11 0,0,R3,0,1 (phrase, pers-arg, ¬pers-arg, pers): PPF . . . . . . . . . . . . . . . . . . . . . . . 6.1.3.12 1,0,R3,0,1 (phrase): PPF . . . . . . . . . . . . 6.1.3.13 0,0,A4,0,1 (pers-arg, ¬pers-arg, pers): PPF . . 6.1.3.14 Synthèse . . . . . . . . . . . . . . . . . . . . 6.1.4 Circonstants . . . . . . . . . . . . . . . . . . . . . . . . 6.1.4.1 0,0,C5,pers,0 . . . . . . . . . . . . . . . . . . 6.1.4.2 0,0,C5,0,0 (phrase, ¬pers-arg, ¬pers): PPF . . 6.1.4.3 0,0,C5,0,1 (pers, ¬pers): PPD . . . . . . . . . 6.1.4.4 0,0,C5,0,1 (phrase, pers-arg, ¬pers-arg, pers, ¬pers): PPF . . . . . . . . . . . . . . . . . . . 6.1.4.5 0,0,C5,¬pers,1 (phrase): PPF . . . . . . . . . 6.1.4.6 0,0,C5,pers,1 (phrase, pers-arg, pers): PPF . . 6.1.4.7 1,0,C5,pers,1 (phrase): PPF . . . . . . . . . . 6.1.4.8 0,1,C5,0,0 (phrase, ¬pers-arg, pers, ¬pers): PPD 6.1.4.9 0,1,C5,0,1 (phrase, pers-arg, pers): PPD . . . 6.1.4.10 0,1,C5,¬pers,1 (phrase, pers): PPD . . . . . . 6.1.4.11 0,1,C5,pers,1 (phrase): PPD . . . . . . . . . .
XIV
229 229 229 230 230 231 232 232 232 241 247 250 250 256 258 259 261 261 263 265 267 269 272 272 273 274 275 276 277 278 279 282 282 287 288 290 292 292 293 294 295 296 297
6.1.4.12 Synthèse . . . . . . . . . . . . . . . . . . . . Coordination . . . . . . . . . . . . . . . . . . . . . . . . 6.1.5.1 Préparation des données . . . . . . . . . . . . 6.1.5.2 Analyse . . . . . . . . . . . . . . . . . . . . . 6.1.5.3 Synthèse . . . . . . . . . . . . . . . . . . . . Syntaxe immédiate . . . . . . . . . . . . . . . . . . . . . . . . . . 6.2.1 Révision des tableaux synoptiques pour la syntaxe immédiate . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6.2.2 Examen des ruptures . . . . . . . . . . . . . . . . . . . . 6.2.2.1 0,0,Ap,0,0 (synt): PPD . . . . . . . . . . . . . 6.2.2.2 0,1,Ap,pers,1 (synt-arg, synt): PPD . . . . . . 6.2.2.3 1,0,Dt,0,1 (synt): PPF . . . . . . . . . . . . . 6.2.2.4 0,0,Ap,pers,1 (synt-arg, synt): PPF . . . . . . 6.2.2.5 0,0,Ap,¬pers,0 (synt-arg): PPF . . . . . . . . . 6.2.3 Synthèse . . . . . . . . . . . . . . . . . . . . . . . . . . Relateurs et C6 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6.3.1 Attraction de PPD.1 par les C6 et les coordonnants . . . . 6.3.1.1 Ressemblances . . . . . . . . . . . . . . . . . 6.3.1.2 Données numériques . . . . . . . . . . . . . . 6.3.2 Répulsions de PPF.1 . . . . . . . . . . . . . . . . . . . . 6.3.2.1 C6 . . . . . . . . . . . . . . . . . . . . . . . . 6.3.2.2 Relateurs non coordonnants . . . . . . . . . . 6.3.2.3 Relateurs coordonnants . . . . . . . . . . . . . Conclusions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6.4.1 Cohérence dans le corpus . . . . . . . . . . . . . . . . . 6.4.2 Interférences non contrôlées . . . . . . . . . . . . . . . . 6.4.2.1 Interférences sémantiques . . . . . . . . . . . 6.4.2.2 Interférences énonciatives . . . . . . . . . . . 6.4.3 Remise en question du modèle . . . . . . . . . . . . . . . 6.4.3.1 Lexèmes employés . . . . . . . . . . . . . . . 6.4.3.2 Coordination et apposition . . . . . . . . . . . 6.4.3.3 Description de la syntaxe immédiate . . . . . . 6.4.3.4 Coordonnants et autres relateurs . . . . . . . . 6.4.4 «Règles» et proportions de marquage expliqué . . . . . . 6.4.4.1 Interdictions . . . . . . . . . . . . . . . . . . 6.4.4.2 Régularité des tendances . . . . . . . . . . . . 6.4.4.3 Puissance explicative . . . . . . . . . . . . . . 6.1.5
6.2
6.3
6.4
7
Forme du marquage . . . . . . . . . . . . . . . . . . 7.1 Données soumises à l’analyse . . . . . . . . . 7.1.1 Fréquence des ponctogrammes . . . . 7.1.2 Création du tableau de contingence . 7.2 Analyse factorielle des données . . . . . . . . 7.2.1 Décomposition du tableau . . . . . . 7.2.2 Représentation bidimensionnelle . . . 7.2.3 Interprétation . . . . . . . . . . . . . 7.2.4 Réduction du tableau de contingence
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
298 300 301 302 306 308 309 311 311 313 314 315 315 316 317 317 317 317 320 320 323 325 326 326 327 327 328 329 329 329 330 330 330 330 331 332 333 333 333 334 335 336 337 340 341
XV
. . . . . . . . . . . . . . . . .
342 347 350 352 352 353 354 355 356 356 356 356 357 357 357 358 358
Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8.1 Progression . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8.1.1 Première partie: modélisation . . . . . . . . . . . . . . . 8.1.2 Deuxième partie: analyse des données . . . . . . . . . . . 8.1.3 Tableau de synthèse . . . . . . . . . . . . . . . . . . . . 8.2 À l’épreuve d’autres matériaux . . . . . . . . . . . . . . . . . . . 8.2.1 Charte luxembourgeoise ou lorraine de 1245 . . . . . . . 8.2.1.1 Lecture suivie . . . . . . . . . . . . . . . . . . 8.2.1.2 Signes expliqués . . . . . . . . . . . . . . . . 8.2.1.3 Résultats . . . . . . . . . . . . . . . . . . . . 8.2.2 Charte champenoise de 1270 . . . . . . . . . . . . . . . . 8.2.2.1 Lecture suivie . . . . . . . . . . . . . . . . . . 8.2.2.2 Signes expliqués . . . . . . . . . . . . . . . . 8.2.2.3 Résultats . . . . . . . . . . . . . . . . . . . . 8.2.3 Apports des analyses . . . . . . . . . . . . . . . . . . . . 8.3 Perspectives . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8.3.1 Enrichissement du corpus . . . . . . . . . . . . . . . . . 8.3.1.1 Meilleure représentation des modalités . . . . 8.3.1.2 Meilleure description externe . . . . . . . . . 8.3.2 Faits linguistiques exploités . . . . . . . . . . . . . . . . 8.3.2.1 Approfondissement et amélioration du modèle 8.3.2.2 Autres points de vue . . . . . . . . . . . . . . 8.3.3 Interférences avec le système graphique . . . . . . . . . .
359 359 359 360 362 364 364 364 365 367 367 367 368 369 369 369 370 370 371 371 371 372 372
Bibliographie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . A Travaux . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . B Documents d’archives . . . . . . . . . . . . . . . . . . . . . . . .
373 373 378
Index . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
383
7.3 7.4
7.5
8
XVI
7.2.4.1 Modalités de faible effectif . . . . . . 7.2.4.2 Analyse du tableau réduit . . . . . . Tests statistiques sur les groupements obtenus . . . . . . Ponctogrammes rares . . . . . . . . . . . . . . . . . . . 7.4.1 Ponctogramme ‹:› . . . . . . . . . . . . . . . . 7.4.2 Ponctogramme ‹–› . . . . . . . . . . . . . . . . 7.4.3 Ponctogramme ‹;› . . . . . . . . . . . . . . . . 7.4.4 Ponctogramme ‹//› . . . . . . . . . . . . . . . . 7.4.5 Ponctogramme ‹·/› . . . . . . . . . . . . . . . . 7.4.6 Ponctogramme ‹·¶·› . . . . . . . . . . . . . . . . Synthèse . . . . . . . . . . . . . . . . . . . . . . . . . . 7.5.1 Implications sémiotiques de la variété des formes 7.5.1.1 Facultativité . . . . . . . . . . . . . 7.5.1.2 Force . . . . . . . . . . . . . . . . . 7.5.2 Problèmes liés à la substance . . . . . . . . . . . 7.5.2.1 Validité des transcriptions . . . . . . 7.5.2.2 Ponctogrammes et système graphique
. . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . .
Table des figures
1.1 1.2 1.3
Représentation d’un concept et de ses caractères . . . . . . . . . . . . Représentation d’un concept non nommé . . . . . . . . . . . . . . . . Représentation d’une hiérarchie de concepts . . . . . . . . . . . . . .
17 17 17
2.1 2.2 2.3 2.4 2.5 2.6 2.7 2.8 2.9 2.10 2.11 2.12 2.13 2.14 2.15 2.16 2.17 2.18 2.19 2.20
Concept de langue . . . . . . . . . . . . . . . . . . . . . . . . . . . Concept de langue écrite . . . . . . . . . . . . . . . . . . . . . . . Exemple de réalisation (Document 1272–07–08, 1) . . . . . . . . . Exemples de puncti (Document 1272–07–08, 2) . . . . . . . . . . . Exemple d’accent décalé (Document 1277–02–03, 27) . . . . . . . Concept de scriptème . . . . . . . . . . . . . . . . . . . . . . . . . Types de scriptèmes . . . . . . . . . . . . . . . . . . . . . . . . . . Types de grammèmes: critère fonctionnel . . . . . . . . . . . . . . Types de topèmes: critère fonctionnel . . . . . . . . . . . . . . . . Exemple de cénégramme «marqué» (Document 1282–02–01, 2) . . Types de plérégrammes: critère d’autonomie . . . . . . . . . . . . . Exemple de ‹t› (Document 1282–02–01, 2) . . . . . . . . . . . . . Types de plérégrammes: axe de construction . . . . . . . . . . . . . Types de cénégrammes: axe de construction (provisoire) . . . . . . Types de nébulogrammes . . . . . . . . . . . . . . . . . . . . . . . Exemple d’abréviation par contraction (Document 1271–12–03a, 11) Exemple d’abréviation par lettre suscrite (Document 1236–07, 6) . . Concept de logogramme . . . . . . . . . . . . . . . . . . . . . . . Types de scriptèmes (classement complet) . . . . . . . . . . . . . . Concept de ponctuation . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
22 24 26 27 27 28 28 29 30 31 31 32 34 34 36 36 37 37 39 42
3.1 3.2 3.3 3.4 3.5 3.6 3.7 3.8 3.9 3.10 3.11 3.12
Schématisation du type de texte charte selon Marie-Guy Boutier Concept de texte . . . . . . . . . . . . . . . . . . . . . . . . . . Concept d’occurrence . . . . . . . . . . . . . . . . . . . . . . . Concept de mot . . . . . . . . . . . . . . . . . . . . . . . . . . Concept de lexème . . . . . . . . . . . . . . . . . . . . . . . . Concept d’énoncé . . . . . . . . . . . . . . . . . . . . . . . . . Concept de syntaxe . . . . . . . . . . . . . . . . . . . . . . . . Représentation de la relation minimale . . . . . . . . . . . . . . Concept de constituant immédiat . . . . . . . . . . . . . . . . . Concept de relation . . . . . . . . . . . . . . . . . . . . . . . . Représentation de la spécification . . . . . . . . . . . . . . . . . Structure de ont doneit a Jakemin. . . . . . . . . . . . . . . . . .
. . . . . . . . . . . .
50 51 53 53 53 54 62 64 64 64 66 66
. . . . . . . . . . . .
. . . . . . . . . . . .
XVII
3.13 3.14 3.15 3.16 3.17 3.18 3.19 3.20 3.21 3.22 3.23 3.24 3.25 3.26 3.27 3.28 3.29 3.30 3.31 3.32 3.33 3.34 3.35 3.36 3.37 3.38 3.39 3.40 3.41 3.42 3.43 3.44 3.45 3.46 3.47 3.48 3.49 3.50 3.51 3.52 3.53 3.54 3.55 3.56 3.57 3.58 3.59
Types de fonctions syntaxiques suivant les termes reliés . . . . . . Types de syntaxe . . . . . . . . . . . . . . . . . . . . . . . . . . Types de parties du discours . . . . . . . . . . . . . . . . . . . . Types d’énoncés en fonction de leur structure morphosyntaxique . Relations sémantiques marquant des relations syntaxiques . . . . . Principaux constituants immédiats de la phrase . . . . . . . . . . Représentation de R2 . . . . . . . . . . . . . . . . . . . . . . . . Représentation de S1 . . . . . . . . . . . . . . . . . . . . . . . . Types d’actants en fonction de leur forme . . . . . . . . . . . . . Représentation de la relation attributive impliquant S1 et R2 . . . Types d’actants en fonction de leur potentiel commutatoire . . . . Types d’arguments en fonction de leur potentiel commutatoire . . Types de circonstants . . . . . . . . . . . . . . . . . . . . . . . . Types d’arguments . . . . . . . . . . . . . . . . . . . . . . . . . Relation attributive impliquant R2 et A4 . . . . . . . . . . . . . . Types de constituants immédiats de la phrase (classement complet) Représentation des relations syntaxiques impliquant des arguments Représentation des relations argumentales simples . . . . . . . . . Représentation de la dépendance . . . . . . . . . . . . . . . . . . Représentation de la combinaison avec dépendance . . . . . . . . Convention d’annotation des relations . . . . . . . . . . . . . . . Représentation de la relation attributive . . . . . . . . . . . . . . Structure de P0 complexe (l’auxilié est argumental) . . . . . . . . Structure de P0 complexe (l’auxilié n’est pas argumental) . . . . . Concept de relateur . . . . . . . . . . . . . . . . . . . . . . . . . Structure de a savoir est que. . . . . . . . . . . . . . . . . . . . . . Structure de a savoir faisons que. . . . . . . . . . . . . . . . . . . Structure de fera loer me femme . . . . . . . . . . . . . . . . . . Structure de a savoir vos faisons ke. . . . . . . . . . . . . . . . . . Structure de oï mon frere tesmonghier . . . . . . . . . . . . . . . Structure de me constraindre a tenir. . . . . . . . . . . . . . . . . Structure rejetée de Jakemes. . . conoistre veriteit . . . . . . . . . . Structure de Henri. . . salut en Nostre Signeur . . . . . . . . . . . Structure de Jakemes. . . conoistre veriteit . . . . . . . . . . . . . Structure de En nom du Pere. . . Amen . . . . . . . . . . . . . . . Structure de sires Gerars aroit. . . . . . . . . . . . . . . . . . . . . Types de combinaisons . . . . . . . . . . . . . . . . . . . . . . . Structure de filhe mon saingnor. . . . . . . . . . . . . . . . . . . . Types de sélections . . . . . . . . . . . . . . . . . . . . . . . . . Structure de le decés dame Magon . . . . . . . . . . . . . . . . . Structure de filhes a mon sainor. . . . . . . . . . . . . . . . . . . . Fonctions du relateur au niveau argumental . . . . . . . . . . . . Fonctions du relateur au niveau immédiat . . . . . . . . . . . . . Structure de ci devant . . . . . . . . . . . . . . . . . . . . . . . . Structure de trop damajousement . . . . . . . . . . . . . . . . . . Structure de par deseur avec détermination (hors contexte) . . . . Structure de par deseur avec détermination (relateur) . . . . . . .
XVIII
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
66 68 75 85 90 90 93 93 93 95 96 97 98 99 101 102 103 103 103 104 104 104 105 105 108 116 116 117 117 117 118 120 120 121 122 123 124 124 126 126 126 128 128 129 130 130 130
3.60 3.61 3.62 3.63 3.64 3.65 3.66 3.67 3.68 3.69 3.70 3.71 3.72 3.73 3.74 3.75 3.76 3.77 3.78 3.79 3.80 3.81 3.82
Structure de par deseur sans détermination (relateur) . . . . . . Structure de par desor les quatuose. . . . . . . . . . . . . . . . . Apposition d’une relative et d’un nom . . . . . . . . . . . . . . Apposition d’une relative et d’un nom: fonctions du relateur . . Apposition d’une complétive et d’un nom . . . . . . . . . . . . Structure de avons pendu. . . por que. . . . . . . . . . . . . . . . Structure rejetée de la relation entre nom et participe coorientés . Structure de la relation entre nom et participe coorientés . . . . . Types de relations . . . . . . . . . . . . . . . . . . . . . . . . . Relation médiate entre un nom et un infinitif relaté . . . . . . . Structure de la détermination d’un nom par un infinitif relaté . . Interprétation argumentale de des siez jornaz. . . doit le moitié. . . Interprétation immédiate de des siez jornaz. . . doit le moitié. . . . Structure de Jakes. . ., li maire. . . de Liege faisons savoir ke. . . . Structure de Ermensens. . . et Henri. . . (coordonnant spécifiant) . Décomposition d’une coordination (1) . . . . . . . . . . . . . . Décomposition d’une coordination (2) . . . . . . . . . . . . . . Structure de aura li glise le deus et li voweiz le tierce . . . . . . Interprétation des C5 de niveau ambigu . . . . . . . . . . . . . Structure de on bonier d’alu de terre. . . (hiérarchie 1) . . . . . . Structure de on bonier d’alu de terre. . . (hiérarchie 2) . . . . . . Structure de on bonier d’alu de terre. . . (structure plate) . . . . Structure de filhe Tyri de Jace . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . .
130 130 132 132 134 135 136 136 137 139 139 140 140 141 142 143 143 143 146 146 146 147 147
4.1 4.2 4.3 4.4
Histogramme des R2 par phrase, par charte . . . . Estimateur de densité des R2 par phrases, par charte Boîte à moustache des R2 par phrase, par charte . . Probabilité que R2 6 5% . . . . . . . . . . . . . .
. . . .
. . . .
. . . .
154 154 155 156
5.1 5.2
Synthèse après tris croisés généraux: segmentation et ponctogrammes Synthèse après tris croisés généraux: segmentation, relateurs et ponctogrammes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Synthèse après tris croisés généraux: interruption . . . . . . . . . . . Synthèse après tris croisés généraux: ponctogramme devant et derrière Synthèse après tris croisés généraux: ponctogramme devant seulement Synthèse après tris croisés généraux: ponctogramme derrière seulement Synthèse après tris croisés généraux: aucun ponctogramme . . . . . . Synthèse après tris croisés généraux: cas intermédiaires . . . . . . . . Attractions entre PPD et MM, au niveau phrase . . . . . . . . . . . . Répulsions entre PPD et MM, au niveau phrase . . . . . . . . . . . . Attractions significatives entre PPD et MM, au niveau phrase (sans les constituants initiaux) . . . . . . . . . . . . . . . . . . . . . . . . . . Répulsions significatives entre PPD et MM, au niveau phrase (sans les constituants initiaux) . . . . . . . . . . . . . . . . . . . . . . . . . . Attractions entre PPF et MM, au niveau phrase . . . . . . . . . . . . Répulsions entre PPF et MM, au niveau phrase . . . . . . . . . . . .
5.3 5.4 5.5 5.6 5.7 5.8 5.9 5.10 5.11 5.12 5.13 5.14
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
187 188 188 189 189 189 189 190 195 195 198 198 199 199
XIX
5.15 5.16 5.17 5.18 5.19 5.20 5.21 5.22 5.23 5.24 5.25 5.26 5.27 5.28 5.29 5.30 5.31 5.32 5.33 5.34 5.35 5.36 5.37 5.38 5.39 5.40 5.41 5.42 5.43 5.44 5.45
XX
Attractions significatives entre PPF et MM, au niveau phrase (sans les constituants finaux) . . . . . . . . . . . . . . . . . . . . . . . . . . . Répulsions significatives entre PPF et MM, au niveau phrase (sans les constituants finaux) . . . . . . . . . . . . . . . . . . . . . . . . . . . Attractions entre PPD et MM, au niveau pers-arg . . . . . . . . . . . Répulsions entre PPD et MM, au niveau pers-arg . . . . . . . . . . . Attractions significatives entre PPD et MM, au niveau pers-arg (sans les constituants initiaux) . . . . . . . . . . . . . . . . . . . . . . . . . . Répulsions significatives entre PPD et MM, au niveau pers-arg (sans les constituants initiaux) . . . . . . . . . . . . . . . . . . . . . . . . . . Attractions entre PPF et MM, au niveau pers-arg . . . . . . . . . . . . Répulsions entre PPF et MM, au niveau pers-arg . . . . . . . . . . . . Attractions significatives entre PPF et MM, au niveau pers-arg (sans les constituants finaux) . . . . . . . . . . . . . . . . . . . . . . . . . . . Répulsions significatives entre PPF et MM, au niveau pers-arg (sans les constituants finaux) . . . . . . . . . . . . . . . . . . . . . . . . . . . Attractions entre PPD et MM, au niveau ¬pers-arg . . . . . . . . . . . Répulsions entre PPD et MM, au niveau ¬pers-arg . . . . . . . . . . . Attractions significatives entre PPD et MM, au niveau ¬pers-arg (sans les constituants initiaux) . . . . . . . . . . . . . . . . . . . . . . . . Répulsions significatives entre PPD et MM, au niveau ¬pers-arg (sans les constituants initiaux) . . . . . . . . . . . . . . . . . . . . . . . . Attractions entre PPF et MM, au niveau ¬pers-arg . . . . . . . . . . . Répulsions entre PPF et MM, au niveau ¬pers-arg . . . . . . . . . . . Attractions significatives entre PPF et MM, au niveau ¬pers-arg (sans les constituants finaux) . . . . . . . . . . . . . . . . . . . . . . . . . Répulsions significatives entre PPF et MM, au niveau ¬pers-arg (sans les constituants finaux) . . . . . . . . . . . . . . . . . . . . . . . . . Attractions entre PPD et MM, au niveau synt-arg . . . . . . . . . . . Répulsions entre PPD et MM, au niveau synt-arg . . . . . . . . . . . Attractions significatives entre PPD et MM, au niveau synt-arg (sans les constituants initiaux) . . . . . . . . . . . . . . . . . . . . . . . . . . Répulsions significatives entre PPD et MM, au niveau synt-arg (sans les constituants initiaux) . . . . . . . . . . . . . . . . . . . . . . . . . . Attractions entre PPF et MM, au niveau synt-arg . . . . . . . . . . . . Répulsions entre PPF et MM, au niveau synt-arg . . . . . . . . . . . . Attractions significatives entre PPF et MM, au niveau synt-arg (sans les constituants finaux) . . . . . . . . . . . . . . . . . . . . . . . . . . . Répulsions significatives entre PPF et MM, au niveau synt-arg (sans les constituants finaux) . . . . . . . . . . . . . . . . . . . . . . . . . . . Attractions entre PPD et MM, au niveau pers . . . . . . . . . . . . . Répulsions entre PPD et MM, au niveau pers . . . . . . . . . . . . . Attractions significatives entre PPD et MM, au niveau pers (sans les constituants initiaux) . . . . . . . . . . . . . . . . . . . . . . . . . . Répulsions significatives entre PPD et MM, au niveau pers (sans les constituants initiaux) . . . . . . . . . . . . . . . . . . . . . . . . . . Attractions entre PPF et MM, au niveau pers . . . . . . . . . . . . . .
200 200 201 202 202 203 203 203 204 205 205 206 206 206 207 207 208 208 209 209 209 209 210 210 211 211 212 212 213 213 213
5.46 5.47 5.48 5.49 5.50 5.51 5.52 5.53 5.54 5.55 5.56 5.57 5.58 5.59 5.60 5.61 5.62 5.63
6.1 6.2 6.3 6.4 6.5 6.6 6.7 6.8 6.9 6.10 6.11 6.12 6.13 6.14 6.15 6.16 6.17 6.18 6.19
Répulsions entre PPF et MM, au niveau pers . . . . . . . . . . . . . . Attractions significatives entre PPF et MM, au niveau pers (sans les constituants finaux) . . . . . . . . . . . . . . . . . . . . . . . . . . . Répulsions significatives entre PPF et MM, au niveau pers (sans les constituants finaux) . . . . . . . . . . . . . . . . . . . . . . . . . . . Attractions entre PPD et MM, au niveau ¬pers . . . . . . . . . . . . . Répulsions entre PPD et MM, au niveau ¬pers . . . . . . . . . . . . . Attractions entre PPF et MM, au niveau ¬pers . . . . . . . . . . . . . Répulsions entre PPF et MM, au niveau ¬pers . . . . . . . . . . . . . Attractions significatives entre PPF et MM, au niveau ¬pers (sans les constituants finaux) . . . . . . . . . . . . . . . . . . . . . . . . . . . Répulsions significatives entre PPF et MM, au niveau ¬pers (sans les constituants finaux) . . . . . . . . . . . . . . . . . . . . . . . . . . . Attractions entre PPD et MM, au niveau synt . . . . . . . . . . . . . Répulsions entre PPD et MM, au niveau synt . . . . . . . . . . . . . Attractions entre PPF et MM, au niveau synt . . . . . . . . . . . . . . Répulsions entre PPF et MM, au niveau synt . . . . . . . . . . . . . . Proportions de marquage . . . . . . . . . . . . . . . . . . . . . . . . Tableau synoptique des tendances générales, PPD . . . . . . . . . . . Tableau synoptique des tendances générales, PPF . . . . . . . . . . . Tableau synoptique des tendances générales, PPD (sans les constituants initiaux) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Tableau synoptique des tendances générales, PPF (sans les constituants finaux) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Attractions entre PPD et la phrase par charte . . . . . . . . . . . . . . Répulsions entre PPD et la phrase par charte . . . . . . . . . . . . . . Attractions entre PPD et la proposition argumentale par charte . . . . Répulsions entre PPD et la proposition argumentale par charte . . . . Attractions entre PPD et la proposition immédiate par charte . . . . . Répulsions entre PPD et la proposition immédiate par charte . . . . . Graphiques des fréquences de marquage initial des propositions . . . Attractions entre PPF et la phrase par charte . . . . . . . . . . . . . . Répulsions entre PPF et la phrase par charte . . . . . . . . . . . . . . Graphiques des fréquence de marquage final des propositions . . . . . Graphiques des fréquences de marquage final de la phrase (haut) et de la p. imm. (bas) par rapport à p. arg. . . . . . . . . . . . . . . . . . . Attractions entre PPD et le prédicat par document . . . . . . . . . . . Répulsions entre PPD et le prédicat par document . . . . . . . . . . . Attractions entre PPD et le prédicat par construction précédente . . . . Répulsions entre PPD et le prédicat par construction précédente . . . . Marquage final du prédicat par document (attractions) . . . . . . . . . Attractions entre le prédicat et PPF par construction suivante . . . . . Répulsions entre le prédicat et PPF par construction suivante . . . . . Attractions significatives entre RB et PPD, pour les constituants de type 0,0,S1,0,0 (niveau: phrase) . . . . . . . . . . . . . . . . . . . . . . .
214 214 214 215 215 216 216 216 216 217 217 218 218 220 222 223 224 225 234 234 235 235 236 237 239 241 242 244 246 251 252 253 253 257 257 258 262
XXI
6.20 6.21 6.22 6.23 6.24 6.25 6.26 6.27 6.28 6.29 6.30 6.31 6.32 6.33 6.34 6.35 6.36 6.37 6.38 6.39 6.40 6.41 6.42 6.43
Répulsions significatives entre RB et PPD, pour les constituants de type 0,0,S1,0,0 (niveau: phrase) . . . . . . . . . . . . . . . . . . . . . . . Attractions significatives entre MMP et PPD, pour les constituants de type 0,0,S1,0,0 (niveau: phrase) . . . . . . . . . . . . . . . . . . . . . Répulsions significatives entre MMP et PPD, pour les constituants de type 0,0,S1,0,0 (niveau: phrase) . . . . . . . . . . . . . . . . . . . . . Attractions significatives entre RB et PPF, pour les constituants de type 0,0,S1,0,0 (niveau: phrase) . . . . . . . . . . . . . . . . . . . . . . . Répulsions significatives entre RB et PPF, pour les constituants de type 0,0,S1,0,0 (niveau: phrase) . . . . . . . . . . . . . . . . . . . . . . . Attractions significatives entre MMS et PPF, pour les constituants de type 0,0,S1,0,0 (niveau: phrase) . . . . . . . . . . . . . . . . . . . . . Répulsions significatives entre MMS et PPF, pour les constituants de type 0,0,S1,0,0 (niveau: phrase) . . . . . . . . . . . . . . . . . . . . . Attractions significatives entre RB et PPD, pour les constituants de type 0,0,R2,0,0 (niveaux: phrase, ¬pers) . . . . . . . . . . . . . . . . . . . Répulsions significatives entre RB et PPD, pour les constituants de type 0,0,R2,0,0 (niveaux: phrase, ¬pers) . . . . . . . . . . . . . . . . . . . Attractions significatives entre MMP et PPD, pour les constituants de type 0,0,R2,0,0 (niveaux: phrase, ¬pers) . . . . . . . . . . . . . . . . Répulsions significatives entre MMP et PPD, pour les constituants de type 0,0,R2,0,0 (niveaux: phrase, ¬pers) . . . . . . . . . . . . . . . . Attractions significatives entre RB et PPF, pour les constituants de type 0,0,R2,0,0 (niveaux: phrase, pers-arg, ¬pers-arg, pers) . . . . . . . . . Répulsions significatives entre RB et PPF, pour les constituants de type 0,0,R2,0,0 (niveaux: phrase, pers-arg, ¬pers-arg, pers) . . . . . . . . . Attractions significatives entre MMS et PPF, pour les constituants de type 0,0,R2,0,0 (niveaux: phrase, pers-arg, ¬pers-arg, pers) . . . . . . Répulsions significatives entre MMS et PPF, pour les constituants de type 0,0,R2,0,0 (niveaux: phrase, pers-arg, ¬pers-arg, pers) . . . . . . Attractions significatives entre RB et PPD, pour les constituants de type 0,1,R2,0,0 (niveau: phrase) . . . . . . . . . . . . . . . . . . . . . . . Attractions significatives entre MMP et PPD, pour les constituants de type 0,1,R2,0,0 (niveau: phrase) . . . . . . . . . . . . . . . . . . . . Répulsions significatives entre MMP et PPD, pour les constituants de type 0,1,R2,0,0 (niveau: phrase) . . . . . . . . . . . . . . . . . . . . Structure de savoir faisons que. . . . . . . . . . . . . . . . . . . . . . Structure de a savoir faisons que. . . (rappel) . . . . . . . . . . . . . . Attractions significatives entre MMS et PPF, pour les constituants de type 0,0,R2,¬pers,0 (niveaux: phrase, pers) . . . . . . . . . . . . . . . Répulsions significatives entre MMS et PPF, pour les constituants de type 0,0,R2,¬pers,0 (niveaux: phrase, pers) . . . . . . . . . . . . . . . Attractions significatives entre RB et PPF, pour les constituants de type 0,0,R3,0,1 (niveaux: phrase, pers-arg, ¬pers-arg, pers) . . . . . . . . . Attractions significatives entre MMS et PPF pour les constituants de type 0,0,R3,0,1 (niveau: phrase), réduit . . . . . . . . . . . . . . . . .
XXII
262 263 263 264 264 265 265 267 267 268 268 270 270 271 271 273 273 273 274 274 275 275 276 276
6.44 6.45 6.46 6.47 6.48 6.49 6.50 6.51 6.52 6.53 6.54 6.55 6.56 6.57 6.58 6.59 6.60 6.61 6.62 6.63 6.64 6.65 6.66
Répulsions significatives entre MMS et PPF pour les constituants de type 0,0,R3,0,1 (niveau: phrase), réduit . . . . . . . . . . . . . . . . . Attractions significatives entre MMS et PPF, pour les constituants de type 0,0,A4,0,1 (niveaux: pers-arg, ¬pers-arg, pers) . . . . . . . . . . Répulsions significatives entre MMS et PPF, pour les constituants de type 0,0,A4,0,1 (niveaux: pers-arg, ¬pers-arg, pers) . . . . . . . . . . Attractions significatives entre RB et PPF, pour les constituants de type 0,0,C5,0,0 (niveaux: phrase, ¬pers-arg, ¬pers) . . . . . . . . . . . . . Répulsions significatives entre RB et PPF, pour les constituants de type 0,0,C5,0,0 (niveaux: phrase, ¬pers-arg, ¬pers) . . . . . . . . . . . . . Attractions significatives entre MMS et PPF, pour les constituants de type 0,0,C5,0,0 (niveaux: phrase, ¬pers-arg, ¬pers) . . . . . . . . . . Répulsions significatives entre MMS et PPF, pour les constituants de type 0,0,C5,0,0 (niveaux: phrase, ¬pers-arg, ¬pers) . . . . . . . . . . Attractions significatives entre RB et PPD, pour les constituants de type 0,0,C5,0,1 (niveaux: pers, ¬pers) . . . . . . . . . . . . . . . . . . . . Répulsions significatives entre RB et PPD, pour les constituants de type 0,0,C5,0,1 (niveaux: pers, ¬pers) . . . . . . . . . . . . . . . . . . . . Attractions significatives entre MMP et PPD, pour les constituants de type 0,0,C5,0,1 (niveaux: pers, ¬pers) . . . . . . . . . . . . . . . . . Répulsions significatives entre MMP et PPD, pour les constituants de type 0,0,C5,0,1 (niveaux: pers, ¬pers) . . . . . . . . . . . . . . . . . Attractions significatives entre RB et PPF, pour les constituants de type 0,0,C5,0,1 (niveaux: phrase, pers-arg, ¬pers-arg, pers, ¬pers) . . . . . Répulsions significatives entre RB et PPF, pour les constituants de type 0,0,C5,0,1 (niveaux: phrase, pers-arg, ¬pers-arg, pers, ¬pers) . . . . . Attractions significatives entre MMS et PPF, pour les constituants de type 0,0,C5,0,1 (niveaux: phrase, pers-arg, ¬pers-arg, pers, ¬pers) . . Répulsions significatives entre MMS et PPF, pour les constituants de type 0,0,C5,0,1 (niveaux: phrase, pers-arg, ¬pers-arg, pers, ¬pers) . . Attractions significatives entre RB et PPF, pour les constituants de type 0,0,C5,pers,1 (niveaux: phrase, pers-arg, pers) . . . . . . . . . . . . . Répulsions significatives entre RB et PPF, pour les constituants de type 0,0,C5,pers,1 (niveaux: phrase, pers-arg, pers) . . . . . . . . . . . . . Attractions significatives entre MMS et PPF, pour les constituants de type 0,0,C5,pers,1 (niveaux: phrase, pers-arg, pers) . . . . . . . . . . Répulsions significatives entre MMS et PPF, pour les constituants de type 0,0,C5,pers,1 (niveaux: phrase, pers-arg, pers) . . . . . . . . . . Attractions significatives entre RB et PPD, pour les constituants de type 0,1,C5,0,0 (niveaux: phrase, ¬pers-arg, pers, ¬pers) . . . . . . . . . . Répulsions significatives entre RB et PPD, pour les constituants de type 0,1,C5,0,0 (niveaux: phrase, ¬pers-arg, pers, ¬pers) . . . . . . . . . . Attractions significatives entre MMP et PPD, pour les constituants de type 0,1,C5,0,0 (niveaux: phrase, ¬pers-arg, pers, ¬pers) . . . . . . . Répulsions significatives entre MMP et PPD, pour les constituants de type 0,1,C5,0,0 (niveaux: phrase, ¬pers-arg, pers, ¬pers) . . . . . . .
277 279 279 287 287 288 288 289 289 289 289 290 291 291 292 293 293 293 293 294 294 294 295
XXIII
6.67 6.68 6.69 6.70 6.71 6.72 6.73 6.74 6.75 6.76 6.77 6.78 6.79 6.80 6.81 6.82 6.83 6.84 6.85 6.86 6.87
6.88
6.89 6.90 6.91
6.92
Attractions significatives entre RB et PPD, pour les constituants de type 0,1,C5,0,1 (niveaux: phrase, pers-arg, pers) . . . . . . . . . . . . . . Répulsions significatives entre RB et PPD, pour les constituants de type 0,1,C5,0,1 (niveaux: phrase, pers-arg, pers) . . . . . . . . . . . . . . Attractions significatives entre MMP et PPD, pour les constituants de type 0,1,C5,0,1 (niveaux: phrase, pers-arg, pers) . . . . . . . . . . . . Répulsions significatives entre MMP et PPD, pour les constituants de type 0,1,C5,0,1 (niveaux: phrase, pers-arg, pers) . . . . . . . . . . . . Structure d’une phrase comprenant deux circonstants (modèle choisi) . Structure d’une phrase comprenant deux circonstants (modèle alternatif) Marquage initial de MC.fin par constituant précédent . . . . . . . . . Marquage initial de MC.fin par constituant précédent . . . . . . . . . Représentation de la spécification (rappel) . . . . . . . . . . . . . . . Structure de Ermensens. . . et Henri. . . (rappel) . . . . . . . . . . . . Représentation de la spécification de la coordination (revue) . . . . . Tableau synoptique des tendances en syntaxe immédiate, PPD (revu) . Tableau synoptique des tendances en syntaxe immédiate, PPF (revu) . Attractions significatives entre RB et PPD, pour les constituants de type 0,0,Ap,0,0 (niveau: synt) . . . . . . . . . . . . . . . . . . . . . . . . Attractions significatives entre MMP et PPD, pour les constituants de type 0,0,Ap,0,0 (niveau: synt) . . . . . . . . . . . . . . . . . . . . . . Répulsions significatives entre MMP et PPD, pour les constituants de type 0,0,Ap,0,0 (niveau: synt) . . . . . . . . . . . . . . . . . . . . . . Attractions significatives entre MMP et PPD, pour les constituants de type 0,1,Ap,pers,1 (niveaux: synt, synt-arg) . . . . . . . . . . . . . . Répulsions significatives entre MMP et PPD, pour les constituants de type 0,1,Ap,pers,1 (niveaux: synt, synt-arg) . . . . . . . . . . . . . . Attractions significatives entre RB et PPD, pour les constituants de type 1,0,C6,0,0 (niveau: phrase) . . . . . . . . . . . . . . . . . . . . . . . Répulsions significatives entre RB et PPD, pour les constituants de type 1,0,C6,0,0 (niveau: phrase) . . . . . . . . . . . . . . . . . . . . . . . Attractions significatives entre RB et PPD, pour les constituants de type 0,0,Co,0,0 (niveaux: phrase, pers, pers-arg, synt, synt-arg, ¬pers, ¬persarg) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Répulsions significatives entre RB et PPD, pour les constituants de type 0,0,Co,0,0 (niveaux: phrase, pers, pers-arg, synt, synt-arg, ¬pers, ¬persarg) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Proportions de marquage des C6 et des Co . . . . . . . . . . . . . . . Réalisation de ponctogramme après un C6: grattage (Document 1270–09–29, 18) . . . . . . . . . . . . . . . . . . . . . . . . . . . . Attractions significatives entre MMS et PPF, pour les constituants de type 1,0,Rl,0,0 (niveaux: phrase, pers, pers-arg, synt, synt-arg, ¬pers, ¬pers-arg) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Répulsions significatives entre MMS et PPF, pour les constituants de type 1,0,Rl,0,0 (niveaux: phrase, pers, pers-arg, synt, synt-arg, ¬pers, ¬pers-arg) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
XXIV
296 296 296 296 299 299 304 304 305 305 306 310 310 312 312 312 314 314 318 319
320
321 322 323
324
324
6.93
6.94
6.95
7.1 7.2 7.3 7.4 7.5 7.6 7.7 7.8 7.9 7.10 7.11 7.12 7.13 7.14
7.15 7.16 7.17 7.18 7.19 7.20 7.21
Attractions significatives entre MMS et PPF, pour les constituants de type 0,0,Co,0,0 (niveaux: phrase, pers, pers-arg, synt, synt-arg, ¬pers, ¬pers-arg) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Répulsions significatives entre MMS et PPF, pour les constituants de type 0,0,Co,0,0 (niveaux: phrase, pers, pers-arg, synt, synt-arg, ¬pers, ¬pers-arg) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Graphique des proportions de marquage expliqué par les environnements . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Décomposition en valeurs propres . . . . . . . . . . . . . . . . . . Analyse factorielle des correspondances: points-colonnes . . . . . . Analyse factorielle des correspondances: points-lignes . . . . . . . Analyse factorielle des correspondances: forme des ponctogrammes environnement . . . . . . . . . . . . . . . ’. . . . . . . . . . . . . . Attractions entre CiF et RB pour punctus ‹·›’ . . . . . . . . . . . . . Répulsions entre CiF et RB pour punctus ‹·› . . . . . . . . . . . . . Attractions entre CiF et RB pour punctus ‹/› . . . . . . . . . . . . . Répulsions entre CiF et RB pour punctus ‹/› . . . . . . . . . . . . . Attractions entre CiF et RB pour punctus ‹·/› . . . . . . . . . . . . . Répulsions entre CiF et RB pour punctus ‹·/› . . . . . . . . . . . . . Analyse factorielle des correspondances: forme des ponctogrammes environnement . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Analyse factorielle des correspondances: forme des ponctogrammes environnement . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Analyse factorielle des correspondances: forme des ponctogrammes environnement (points-lignes et points-colonnes séparés) . . . . . . Analyse factorielle des correspondances: forme des ponctogrammes environnement (points-lignes et points-colonnes séparés), facteurs 2 3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Réalisation de ‹:› (Document 1247–06, 17) . . . . . . . . . . . . . . Réalisation de ‹:› (Document 1271–07–25, 9) . . . . . . . . . . . . Réalisation de ‹–› (Document 1277–07–01, 14) . . . . . . . . . . . Réalisation de ‹–› (Document 1286–05–15, 2) . . . . . . . . . . . . Réalisation de ‹//› (Document 1283–12–26, 10) . . . . . . . . . . . Réalisation de ‹·/› (Document 1274–05–31a, 27) . . . . . . . . . . . Réalisation de ‹·¶·› (Document 1289–01–12, 2) . . . . . . . . . . .
. . . et . . . . . . . et . et . et . et et . . . . . . . .
325
326 332 336 338 339 339 342 342 343 343 343 343 345 346 347
349 353 353 353 354 355 356 356
XXV
Liste des tableaux
2.1
Inventaire des ponctogrammes relevés . . . . . . . . . . . . . . . . .
5.1 5.2 5.3 5.4 5.5 5.6 5.7 5.8 5.9 5.10 5.11 5.12 5.13 5.14 5.15 5.16 5.17 5.18 5.19 5.20 5.21 5.22 5.23 5.24 5.25 5.26 5.27 5.28
Exemple de définition d’individu . . . . . . . . . . . . . . . . . Exemples de définition d’individu . . . . . . . . . . . . . . . . Exemple de tri à plat . . . . . . . . . . . . . . . . . . . . . . . Tri à plat de MI . . . . . . . . . . . . . . . . . . . . . . . . . . Tri à plat de MF . . . . . . . . . . . . . . . . . . . . . . . . . . Tri à plat de MN . . . . . . . . . . . . . . . . . . . . . . . . . . Tri à plat de MR . . . . . . . . . . . . . . . . . . . . . . . . . . Tri à plat de LID . . . . . . . . . . . . . . . . . . . . . . . . . . Tri à plat de LIF . . . . . . . . . . . . . . . . . . . . . . . . . . Tri à plat de PPD . . . . . . . . . . . . . . . . . . . . . . . . . Tri à plat de PPF . . . . . . . . . . . . . . . . . . . . . . . . . . Exemple de tableau de contingence . . . . . . . . . . . . . . . . Exemple de tri croisé . . . . . . . . . . . . . . . . . . . . . . . Exemple de tri croisé: valeurs attendues . . . . . . . . . . . . . Tri croisé MI × PPD . . . . . . . . . . . . . . . . . . . . . . . Tri croisé MI × PPF . . . . . . . . . . . . . . . . . . . . . . . . Tri croisé MF × PPD . . . . . . . . . . . . . . . . . . . . . . . Tri croisé MF × PPF . . . . . . . . . . . . . . . . . . . . . . . Tri croisé MN × PPD . . . . . . . . . . . . . . . . . . . . . . . Tri croisé MN × PPF . . . . . . . . . . . . . . . . . . . . . . . Tri croisé MR × PPD . . . . . . . . . . . . . . . . . . . . . . . Tri croisé MR × PPF . . . . . . . . . . . . . . . . . . . . . . . Tri croisé LID × PPD . . . . . . . . . . . . . . . . . . . . . . . Tri croisé LID × PPF . . . . . . . . . . . . . . . . . . . . . . . Tri croisé LIF × PPD . . . . . . . . . . . . . . . . . . . . . . . Tri croisé LIF × PPF . . . . . . . . . . . . . . . . . . . . . . . Exemple de définition d’individus, MM en dernière colonne . . Exemple de décomposition de la table de contingence MM × 0,0,C6,0,0 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Tri à plat de PPD pour les constituants MI.phrase . . . . . . . . Tri à plat de PPF pour les constituants MI.phrase . . . . . . . . Tri à plat de PPD pour les constituants MI.pers-arg . . . . . . . Tri à plat de PPF pour les constituants MI.pers-arg . . . . . . . . Tri à plat de PPD pour les constituants MI.¬pers-arg . . . . . . . Tri à plat de PPF pour les constituants MI.¬pers-arg . . . . . . .
5.29 5.30 5.31 5.32 5.33 5.34
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . PPD: . . . . . . . . . . . . . . . . . . . . .
45 170 170 170 171 172 172 173 173 173 174 174 177 178 178 182 182 183 184 184 184 185 185 185 186 186 186 192 193 194 198 201 202 205 207
XXVII
5.35 5.36 5.37 5.38 5.39 5.40 5.41 5.42
Tri à plat de PPD pour les constituants MI.synt-arg Tri à plat de PPF pour les constituants MI.synt-arg . Tri à plat de PPD pour les constituants MI.pers . . Tri à plat de PPF pour les constituants MI.pers . . . Tri à plat de PPD pour les constituants MI.¬pers . . Tri à plat de PPF pour les constituants MI.¬pers . . Tri à plat de PPD pour les constituants MI.synt . . Tri à plat de PPF pour les constituants MI.synt . . .
6.1 6.2
Tri croisé début de phrase × PPD . . . . . . . . . . . . . . . . . . . . Tri croisé début de phrase × PPD, (sans les documents1265-05b, 127203, 1283-02-13a, 1289-01-12) . . . . . . . . . . . . . . . . . . . . . Tri croisé début de prop. argumentale × PPD . . . . . . . . . . . . . . Tri croisé début de prop. immédiate × PPD . . . . . . . . . . . . . . . Tri croisé types de propositions × PPD . . . . . . . . . . . . . . . . . Tri croisé phrases et autres prop. × PPD . . . . . . . . . . . . . . . . Tri croisé prop. argumentales ou non × PPD . . . . . . . . . . . . . . Probabilités de différence de marquage initial des propositions . . . . Tri croisé fin de phrase × PPF . . . . . . . . . . . . . . . . . . . . . . Tri croisé fin de phrase × PPF, (sans le document 1272-03) . . . . . . Tri croisé fin de prop. argumentale × PPF . . . . . . . . . . . . . . . Tri croisé fin de prop. immédiate × PPF . . . . . . . . . . . . . . . . Tri croisé types de propositions × PPF . . . . . . . . . . . . . . . . . Tri croisé phrases et autre proposition × PPF . . . . . . . . . . . . . . Tri croisé propositions argumentales ou non × PPF . . . . . . . . . . Probabilités de différence de marquage final des propositions . . . . . Probabilités de différence de fréquence de marquage final de la phrase par rapport à p. arg. . . . . . . . . . . . . . . . . . . . . . . . . . . . Fréquence de marquage final de la p. imm. par rapport à p. arg.: statistiques . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Proportions de marquage expliqué par la ponctuation de la phrase . . . Tri à plat de la position (limite de phrase ou non) pour les positions non ponctuées . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Tri à plat de la position (limite de phrase ou non) pour les positions ponctuées . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Tri à plat de PPD pour les prédicats non initiaux . . . . . . . . . . . . Tri à plat de PPF pour les prédicats non finaux . . . . . . . . . . . . . Tri à plat de PPD pour les 1,0,P0,0,0 dans ¬pers . . . . . . . . . . . . Tri à plat de PPD, pour les constituants de type 0,0,S1,0,0 (niveau: phrase) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Tri à plat de PPF, pour les constituants de type 0,0,S1,0,0 (niveau: phrase) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Tri à plat de PPD, pour les constituants de type 0,1,S1,pers,1 (niveau: phrase) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Tri croisé entre MMP et PPD, pour les constituants de type 0,1,S1,pers,1 (niveau: phrase) . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
6.3 6.4 6.5 6.6 6.7 6.8 6.9 6.10 6.11 6.12 6.13 6.14 6.15 6.16 6.17 6.18 6.19 6.20 6.21 6.22 6.23 6.24 6.25 6.26 6.27 6.28
XXVIII
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
208 210 211 212 215 215 217 218 233 233 235 235 236 238 238 240 241 242 242 242 243 243 243 245 247 247 249 249 249 250 256 259 261 264 266 266
6.29 6.30 6.31 6.32 6.33 6.34 6.35 6.36 6.37 6.38 6.39 6.40 6.41 6.42 6.43 6.44 6.45 6.46 6.47 6.48 6.49 6.50 6.51 6.52 6.53 6.54 6.55 6.56
Tri à plat de PPD, pour les constituants de type 0,0,R2,0,0 (niveaux: phrase, ¬pers) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Tri à plat de PPF, pour les constituants de type 0,0,R2,0,0 (niveaux: phrase, pers-arg, ¬pers-arg, pers) . . . . . . . . . . . . . . . . . . . . Tri à plat de PPD, pour les constituants de type 0,0,R2,pers,1 (niveau: pers) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Tri à plat de PPF, pour les constituants de type 0,0,R2,pers,1 (niveaux: phrase, pers) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Tri croisé entre MMS et PPF, pour les constituants de type 0,0,R2,pers,1 (niveaux: phrase, pers) . . . . . . . . . . . . . . . . . . . . . . . . . Tri à plat de PPD, pour les constituants de type 0,1,R2,0,0 (niveau: phrase) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Tri à plat de PPD, pour les constituants de type 0,1,R2,pers,1 (niveau: ¬pers-arg) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Tri à plat de PPF, pour les constituants de type 0,0,R2,¬pers,0 (niveaux: phrase, pers) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Tri à plat de PPF, pour les constituants de type 0,0,R3,0,1 (niveaux: phrase, pers-arg, ¬pers-arg, pers) . . . . . . . . . . . . . . . . . . . . Tri à plat de PPF, pour les constituants de type 1,0,R3,0,1 (niveau: phrase) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Tri croisé MMS × PPF, pour les constituants de type 1,0,R3,0,1 (niveau: phrase, Document 1272-03 retiré) . . . . . . . . . . . . . . . . . . . Tri à plat de PPF, pour les constituants de type 0,0,A4,0,1 (niveaux: pers-arg, ¬pers-arg, pers) . . . . . . . . . . . . . . . . . . . . . . . . Proportions de marquage expliqué par la ponctuation des actants . . . Tri à plat de la position (limite d’actant ou non) pour les positions non ponctuées . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Tri à plat de la position (limite d’actant ou non) pour les positions ponctuées . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Tri croisé phrases et incidentes × PPD . . . . . . . . . . . . . . . . . Tri croisé phrases et incidentes (groupées) × PPD . . . . . . . . . . . Tri croisé incidentes × PPD . . . . . . . . . . . . . . . . . . . . . . . Tri croisé phrases, incidentes et autres circonstants propositionnels × PPD . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Tri croisé incidentes et autres circonstants propositionnels × PPD . . . Tri croisé phrases et incidentes × PPF . . . . . . . . . . . . . . . . . Tri croisé phrases et incidentes × PPF . . . . . . . . . . . . . . . . . Tri croisé phrases et incidentes (phrase) × PPF . . . . . . . . . . . . . Tri croisé phrases, incidentes et circonstants propositionnels × PPF . . Tri croisé incidentes et circonstants propositionnels × PPF . . . . . . Tri à plat de PPF, pour les constituants de type 0,0,C5,0,0 (niveaux: phrase, ¬pers-arg, ¬pers) . . . . . . . . . . . . . . . . . . . . . . . . Tri à plat de PPD, pour les constituants de type 0,0,C5,0,1 (niveaux: pers, ¬pers) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Tri à plat de PPF, pour les constituants de type 0,0,C5,0,1 (niveaux: phrase, pers-arg, ¬pers-arg, pers, ¬pers) . . . . . . . . . . . . . . . .
267 269 272 272 272 273 274 275 276 277 277 278 281 281 281 283 284 284 284 285 285 286 286 286 286 287 288 290
XXIX
6.57 6.58 6.59 6.60 6.61 6.62 6.63 6.64 6.65 6.66 6.67 6.68 6.69 6.70 6.71 6.72 6.73 6.74 6.75 6.76 6.77 6.78 6.79 6.80 6.81 6.82 6.83 6.84
Tri à plat de PPF, pour les constituants de type 0,0,C5,¬pers,1 (niveau: phrase) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Tri à plat de PPF, pour les constituants de type 0,0,C5,pers,1 (niveaux: phrase, pers-arg, pers) . . . . . . . . . . . . . . . . . . . . . . . . . . Tri à plat de PPF, pour les constituants de type 1,0,C5,pers,1 (niveau: phrase) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Tri à plat de PPD, pour les constituants de type 0,1,C5,0,0 (niveaux: phrase, ¬pers-arg, pers, ¬pers) . . . . . . . . . . . . . . . . . . . . . Tri croisé position finale ou non × PPD . . . . . . . . . . . . . . . . . Tri à plat de PPD, pour les constituants de type 0,1,C5,0,1 (niveaux: phrase, pers-arg, pers) . . . . . . . . . . . . . . . . . . . . . . . . . . Tri à plat de PPD, pour les constituants de type 0,1,C5,¬pers,1 (niveaux: phrase, pers) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Tri à plat de PPD, pour les constituants de type 0,1,C5,pers,1 (niveau: phrase) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Proportions de marquage expliqué par la ponctuation des compléments Tri à plat de la position (limite de complément ou non) pour les positions ponctuées . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Tri à plat de la position (limite de complément ou non) pour les positions non ponctuées . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Tri croisé des positions de coordination et PPD . . . . . . . . . . . . Tri croisé des positions de coordination MC.¬coord et MC.début et PPD Tri croisé des positions de coordination MC.¬coord et MC.centre et PPD . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Tri croisé des positions de coordination MC.¬coord et MC.centre et PPD (coordonnants retirés) . . . . . . . . . . . . . . . . . . . . . . . Tri croisé des positions de coordination MC.¬coord et MC.fin et PPD Tri croisé des positions de coordination (sans MF.Co) et PPF . . . . . Proportions de marquage expliqué par la ponctuation de la coordination Tri à plat de la position (limite de coordination ou non) pour les positions ponctuées . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Tri à plat de la position (limite de coordination ou non) pour les positions non ponctuées . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Proportions de marquage expliqué par une tendance générale . . . . . Tri à plat de la position (limite de constituant attirant le marquage ou non) pour les positions ponctuées . . . . . . . . . . . . . . . . . . . . Tri à plat de la position (limite de constituant attirant le marquage ou non) pour les positions non ponctuées . . . . . . . . . . . . . . . . . Tri à plat de PPD, pour les constituants de type 0,0,Ap,0,0 (niveau: synt) Tri à plat de PPD, pour les constituants de type 0,1,Ap,pers,1 (niveaux: synt, synt-arg) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Tri à plat de PPF, pour les constituants de type 1,0,Dt,0,1 (niveau: synt) Tri à plat de PPF, pour les constituants de type 0,0,Ap,pers,1 (niveaux: synt, synt-arg) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Tri croisé entre MMS et PPF, pour les constituants de type 0,0,Ap,pers,1 (niveaux:synt, synt-arg) . . . . . . . . . . . . . . . . . . . . . . . . .
XXX
292 292 293 294 295 295 297 297 300 300 301 302 303 303 303 304 306 307 307 307 308 308 308 311 313 314 315 315
6.85 6.86 6.87 6.88 6.89 6.90 6.91 6.92 6.93 6.94 6.95 6.96 7.1 7.2 7.3 7.4 7.5 7.6 7.7 7.8 7.9 7.10 7.11
Tri à plat de PPF, pour les constituants de type 0,0,Ap,¬pers,0 (niveau: synt-arg) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Tri à plat de PPD, pour les constituants de type 1,0,C6,0,0 (niveau: phrase) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Tri à plat de PPD, pour les constituants de type 0,0,Co,0,0 (niveaux: phrase, pers, pers-arg, synt, synt-arg, ¬pers, ¬pers-arg) . . . . . . . . Tri croisé C6 ou Co × PPD . . . . . . . . . . . . . . . . . . . . . . . Tri à plat de PPF, pour les constituants de type 1,0,C6,0,0 (niveau: phrase) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Tri à plat de PPF, pour les constituants de type 1,0,Rl,0,0 (niveaux: phrase, pers, pers-arg, synt, synt-arg, ¬pers, ¬pers-arg) . . . . . . . . Tri croisé MI × PPF pour les constituants 1,0,Rl,0,0 . . . . . . . . . . Tri à plat de PPF, pour les constituants de type 0,0,Co,0,0 (niveaux: phrase, pers, pers-arg, synt, synt-arg, ¬pers, ¬pers-arg) . . . . . . . . Proportions de marquage expliqué par une tendance générale (repris) . Tri à plat de la position (limite de constituant attirant le marquage ou non) pour les positions ponctuées (repris) . . . . . . . . . . . . . . . Tri à plat de la position (limite de constituant attirant le marquage ou non) pour les positions non ponctuées (repris) . . . . . . . . . . . . . Tri croisé des proportions de marquage × environnements . . . . . . .
7.12 7.13 7.14 7.15 7.16
Tri à plat des formes de ponctogrammes . . . . . . . . . . . . . Tri croisé environnement × forme du ponctogramme . . . . . . Points-colonnes, données numériques (1er facteur) . . . . . . . . Points-colonnes, données numériques . . . . . . . . . . . . . . Points-lignes, données numériques . . . . . . . . .’ . . . . . . . Tri croisé RB × actant ponctuable à la finale pour ‹·› . . . . . . . Tri croisé environnement × forme du ponctogramme (revu) . . . Tri croisé environnement × forme du ponctogramme (revu) . . . Points-lignes, données numériques . . . . . . . . . . . . . . . . Points-colonnes, données numériques . . . . . . . . . . . . . . Tri croisé forme des ponctogrammes (réduit) × environnement Énoncé, Coord.) . . . . . . . . . . . . . . . . . . . . . . . . . . Tri croisé attraction de ‹·› . . . . . . . . . . . . . . . . . . . . . Tri croisé ‹·› × contexte l’attirant . . . . . . . . . . . . . . . . . Tri croisé attraction de ’‹/› . . . . . . . . . . . . . . . . . . . . . Tri croisé opposition ‹·› vs ‹·/› . . . . . . . . . . . . . . . . . . . Tri croisé ‹··› × contexte l’attirant . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . (C5F, . . . . . . . . . . . . . . . . . .
8.1
Tableau synthétique des tendances dégagées . . . . . . . . . . . . . .
315 318 318 319 323 324 325 325 331 331 331 332 334 335 336 338 340 342 344 344 348 348 350 350 351 351 351 352 363
XXXI
0
Introduction
Comment, d’après ce qu’on peut observer dans les chartes écrites en français à Liège avant 1292, la ponctuation originale interagit-elle avec la syntaxe dans la langue française médiévale? Voilà une interrogation qui en amène immanquablement une foule d’autres, parmi lesquelles on peut compter: qu’entend-on par ponctuation? qu’entendon par syntaxe? qu’est-ce qu’une charte? qu’est-ce que la langue écrite, exactement? quels documents ont été observés?1 Notre introduction ne répondra pas à toutes ces questions préalables. Elle se limitera à poser le cadre de notre travail, c’est-à-dire tout ce qui a constitué les données desquelles nous sommes parti. Pour le reste, elle n’indiquera que le chemin que nous avons emprunté pour rechercher, sinon une réponse, une perspective nouvelle pour aborder la ponctuation médiévale. On ne trouvera donc pas de définition des termes ponctuation ou syntaxe dans ces quelques pages introductives, pas plus qu’une explication de ce que nous entendons par langue écrite. La clarification de ces termes nécessitera, on le verra, de longs développements qui n’auraient pas leur place ici. Que l’on veuille bien nous pardonner, mais il faudra se résigner à comprendre ces mots de manière intuitive dans un premier temps. Par contre, le lieu nous paraît opportun pour que nous y posions les objectifs de l’étude (→0.1) et pour que nous délimitions précisément notre corpus et que nous décrivions en quelques mots les problèmes qu’il pose (→0.2). Cela fait, nous exposerons le plan de notre démarche (→0.3). Enfin, nous clorons cette introduction sur une brève présentation des ressources techniques qui ont été nécessaires pour traiter notre objet (→0.4) et sur un avertissement quant au caractère perfectible des méthodes dont nous avons fait usage (→0.5).
0.1
Objectifs de l’étude
Dans cette section, nous présentons les différentes options suivies jusqu’à présent pour étudier la ponctuation de l’ancien français (→0.1.1) avant de définir la position que nous tiendrons tout au long de notre étude (→0.1.2).
1
Ce travail, réalisé sous la direction de Marie-Guy Boutier, est issu de la thèse de doctorat que nous avons défendue le 21 décembre 2007 à l’Université de Liège. Le jury en était le suivant: Jean-Marie Klinkenberg (président), Christiane Marchello-Nizia, Marie-Guy Boutier (promotrice), Günter Holtus, Gérald Purnelle (secrétaire) et Pierre Swiggers.
1
0.1.1
Études précédentes
Deux attitudes se sont développées dans le champ de la recherche sur la ponctuation médiévale: celle qui souligne la pluralité des valeurs de signes et juge l’analyse syntaxique incapable de rendre compte à elle seule des habitudes des scribes (→0.1.1.1); et celle qui, ne rejetant pas le bien-fondé de cette pluralité, consiste néanmoins à choisir de se servir de la syntaxe comme moyen privilégié pour accéder aux emplois de la ponctuation (→0.1.1.2). 0.1.1.1
Pluralité des valeurs de la ponctuation médiévale
a. Les pionniers. La première étude linguistique de la ponctuation dans les manuscrits médiévaux du domaine gallo-roman est due à Mario Roques (1952). Dans son article Le manuscrit fr. 794 de la Bibliothèque Nationale et le scribe Guiot, qui concerne plus les habitudes de Guiot que la ponctuation elle-même, il met en évidence des «habitudes graphiques qui donnent de la netteté à la présentation et à la lecture» (193). Ayant somme toute peu de matériaux à sa disposition, Mario Roques se borne à «signaler» ces habitudes graphiques sans véritablement les systématiser. Il conclut en formulant le souhait que la ponctuation médiévale soit étudiée de manière diachronique, insistant sur le besoin de tenir compte, dans cette entreprise, «des habitudes et des nécessités de pensée, de lecture, de diction, auxquelles [les signes de ponctuation] correspondent, et qui ont varié suivant les époques, les auteurs, les orateurs et les lecteurs» (196). En philologue chevronné, il souligne ainsi l’importance de la relation entre le texte et son environnement, mais ne pose aucune balise quant à l’étude proprement linguistique des pratiques de ponctuation médiévale. Un nouveau palier est franchi avec la publication de l’article Ponctuation et «unité de lecture» dans les manuscrits médiévaux ou: je ponctue, tu lis, il théorise, proposé à la communauté par Christiane Marchello-Nizia (1978). Cette dernière compare la ponctuation de six «éditions» (terme regroupant en l’occurrence les copies et éditions imprimées) du Jouvencel de Jean de Bueil (composé entre 1461 et 1466), en prenant comme point de départ les conceptions que les traités anciens livrent: la ponctuation serait l’expression d’une pause dans la voix (34). D’emblée, Christiane MarchelloNizia choisit de compter les «majuscules» parmi les signes de ponctuation, une option que suivent également toutes les études ultérieures. Selon cette étude, la ponctuation se rencontre à des endroits qui correspondent aux limites de structures syntaxiques et au début d’adverbes et de conjonctions capitales pour l’organisation du message, mais les différentes éditions ne se servent pas des signes de la même manière pour segmenter le texte: chacune se distingue des autres par la ponctuation (42). L’analyse révèle également que les théories syntaxiques ne suffisent pas à épuiser les informations que nous livre la ponctuation. La conclusion est nette: pour avoir une chance de la comprendre un jour, il ne faut pas isoler la ponctuation dans ses rapports avec la syntaxe telle que nous la concevons, mais tenter d’appréhender les «unités de lecture» que nous livrent les scribes eux-mêmes. b. Définition progressive des types de valeurs. La même idée d’«insuffisance de nos ‹outils théoriques›» (Marchello-Nizia 1978, 44) se retrouve dans la conclusion de l’étude d’Hélène Naïs (1979) sur le manuscrit B de la Conqueste de Constantinople de Villehardouin:
2
«Lorsque l’on sait que la philologie moderne a relevé et édicté des règles très strictes d’ordre des mots en ancien français, [. . .] conditionné par les éléments initiaux de la phrase, il est particulièrement déroutant de constater que les manuscrits médiévaux ne permettent pas vraiment de repérer ces éléments initiaux. À quelle réalité correspond exactement la notion de phrase en ancien français?» (55).
Aux yeux d’Hélène Naïs, qui généralise ses découvertes, la ponctuation n’a pas de valeur grammaticale. Il en résulte que les études suivantes s’efforcent de mettre en relation la ponctuation avec d’autres structures que les structures syntaxiques. Ainsi, l’étude de Céline Barbance (1995) compare cinq manuscrits des Cas des nobles hommes et femmes de Laurent de Premierfait (15e siècle) et divise son analyse en plusieurs parties: «Ponctuation et structure syntaxique» (511), «Ponctuation et sémantique» (516), «Ponctuation métalinguistique2 » (521). Ce classement, bien qu’il permette d’expliquer un grand nombre de signes, met à nouveau en évidence, sans pouvoir l’expliquer, une grande liberté de la part des copistes. Se détachant encore davantage d’un cadre prédéfini par une analyse linguistique, Alexei Lavrentiev (2000) introduit son étude sur la ponctuation dans les manuscrits et incunables de l’Image du monde de Gossuin de Metz (13e siècle) en affirmant: «Une caractéristique importante qui semble marquer la ponctuation de la plupart des textes français médiévaux est un gros écart entre les doctrines de ponctuation, qui ne manquent pas, et la pratique qu’on peut constater dans les manuscrits.» (26).
Par la simple observation des formes des marques et de leur fréquence, l’auteur repère un certain nombre d’«unités de lectures», qui montrent que la ponctuation interagit avec les «majuscules» et se retrouve essentiellement devant les connecteurs, entre les phrases et entre les syntagmes coordonnés. D’autres tentatives, comme celle de Susan Baddeley (2001), adoptent une démarche sémasiologique, partant des signes à la recherche de leur valeur, pour aboutir à nouveau à la conclusion que la ponctuation médiévale n’est pas syntaxique. Nous avons nous-même montré (Mazziotta 2007b) que l’organisation du texte des chartes en «parties du discours» (au sens diplomatique) structurant l’information qu’elles contiennent était, dans le cas de documents émanés d’une cour particulière, clairement soutenue par l’emploi de la ponctuation. La pluralité des valeurs de la ponctuation médiévale la rapproche de son homologue moderne. En effet, dès les premières études linguistiques consacrées à la ponctuation du français moderne, Ludmilla Védénina (1980 et 1989), héritière du fonctionnalisme praguois, distingue un plan sémantique, un plan communicatif et un plan grammatical, correspondant terme à terme aux plans sémanticoréférentiel, énonciatifhiérarchique et morphosyntaxique de la théorie des trois points de vue (→3.1.3.1). Depuis, les études sur la ponctuation moderne rendent généralement compte de cette pluralité. Quelle que soit la période étudiée, il semble que seul un examen simultané des informations livrées par chacun des trois points de vue approcherait l’exhaustivité.
2
Nous écririons énonciative.
3
c. Vers un programme. Le développement des recherches pousse ainsi progressivement à abandonner l’idée que l’analyse syntaxique fournit la clef absolue de l’étude. Cela mène Alexei Lavrentiev à rappeler: «Comme l’ont démontré les études précédentes, l’emploi de la ponctuation peut être conditionné par de multiples facteurs: syntaxiques, sémantiques, pragmatiques, rythmiques et même ‹esthétiques› (décoratifs).» (Lavrentiev à paraître).
Il propose ensuite une liste d’«unités ponctuables» reprenant ces catégories et devant permettre de traiter efficacement la ponctuation d’un grand nombre de textes: «Parmi les grandes catégories, nous avons distingué (A) les frontières entre les unités de la macrostructure textuelle; (B) les frontières liées au changement de plan énonciatif, et, en général, tout ce qui est lié au discours direct [. . .]; (C) les frontières entre les propositions indépendantes (y compris juxtaposées et coordonnées); (D) les frontières entre les propositions subordonnées et leur principale; (E) les frontières entre les syntagmes coordonnés et juxtaposés; les débuts et fins d’énumération; (F) les syntagmes ‹ponctuables› à l’intérieur de propositions (compléments circonstanciels, appositions, reformulations, etc.) [. . .]» (Lavrentiev à paraître, §1.2).
0.1.1.2
Le «pari» de la syntaxe
Parallèlement à cette évolution, tentant l’expérience alors nouvelle de l’étude exhaustive des signes de ponctuation dans une seule charte luxembourgeoise, Marie-Guy Boutier (2001) fait le pari que la majorité des signes de ponctuation peuvent être expliqués à l’aide des structures syntaxiques. La perspective est résolument synchronique et cadrée sur l’étude du système d’un seul document. Presque tous les signes trouvent une «justification» syntaxique, ce qui mène à une conclusion forte: «[Il est permis] de supposer, sous-jacent à cet usage particulier, un véritable système de la ponctuation [. . . ].» (443) Enthousiasmé par ces résultats, nous prenons la décision de la suivre en faisant à notre tour l’étude complète de la ponctuation d’une autre charte, liégeoise cette fois (Mazziotta à paraître), ce qui nous permet de constater que la syntaxe, si elle ne peut tout expliquer, suffit à décrire la grande majorité des signes rencontrés. Continuant sur cette lancée, nous essayons, dans la contribution Inconstance ou consensus? Marquage de la protase en tête de phrase dans les chartes liégeoises du 13e siècle (Mazziotta 2007a), de comparer la ponctuation d’une structure syntaxique particulière au travers d’un petit corpus de chartes liégeoises dans une perspective toujours synchronique. La conclusion de ce travail est que malgré la variation, la majorité des chartes suivent une tendance commune. Manifestement, en dépit de l’indéniable influence de la sémantique ou de la structure discursive sur la ponctuation, il semblerait que, dans le cas des chartes médiévales, la syntaxe puisse constituer un point de référence suffisamment rentable pour être étudié pour lui-même. 0.1.2
Position de la présente étude
En conséquence de la section précédente, nous avons choisi de poursuivre notre recherche en privilégiant la description des relations entre les signes de ponctuation et 4
les structures syntaxiques. Nous traiterons ainsi une partie du problème général de la ponctuation médiévale et nous sommes conscient des limites que nous posons aux résultats de notre travail. Cette étude n’épuisera donc pas le sujet. À ce jour, une étude générale sur la partie exacte de la ponctuation que la syntaxe permet d’expliquer fait encore défaut. Nous proposons d’explorer notre corpus (→0.2) dans cette direction. Dans la mesure où la ponctuation met en évidence des unités de lecture tributaires des représentations linguistiques intériorisées par les scribes, l’étude de la ponctuation dans ses rapports avec la syntaxe constitue un moyen privilégié d’accéder à ces représentations. Cela nous permettra de vérifier si les structures que nos outils d’analyse identifient correspondent bien à des «unités de lecture» pour les gens qui les employaient. La description des rapports entre la ponctuation et le système syntaxique des chartes originales écrites en français à Liège avant 1292 impose à nos yeux une démarche qui consiste à: 1. délimiter le corpus employé; 2. définir exactement ce que nous entendons par ponctuation et syntaxe; 3. décrire le système graphique le plus indépendamment possible du système syntaxique (et inversement); 4. évaluer les corrélations entre les deux systèmes décrits. Nous délimiterons le corpus dans la présente introduction (→0.2). Les autres étapes seront abordées ensuite et serviront de guide à la progression dont nous ferons le plan ci-dessous (→0.3).
0.2
Corpus
Depuis 1998, le service de linguistique française et dialectologie wallonne de l’Université de Liège, dirigé par Marie-Guy Boutier, s’est engagé dans Khartês, un projet d’édition et d’étude linguistique de chartes originales rédigées en français en Wallonie dans le courant du 13e siècle. La genèse du projet Khartês, par laquelle s’explique la constitution de notre corpus, fera l’objet du point →0.2.1. Nous évaluerons ensuite les problèmes posés par les caractéristiques intrinsèques à ce choix de textes (→0.2.2). 0.2.1
Genèse du projet Khartês et constitution du corpus
Khartês trouve sa place dans la plus vaste démarche d’édition des Documents linguistiques de la France, inaugurée en 1974 par Jean-Gabriel Gigot et son édition des documents originaux conservés dans le département de Haute-Marne, préparée sous la direction de J. Monfrin (Gigot 1974). Cette première pièce ouvre la marche du projet, destiné à réunir les textes non littéraires originaux rédigés en langue vulgaire dans le domaine français. Trois séries devaient se partager la collection, couvrant les domaines d’oïl (série française) et d’oc, mais aussi le domaine du franco-provençal. Il y était notamment prévu d’éditer des chartes originales conservées dans les différents fonds d’archives de la France (la série franco-provençale est un recueil d’éditions de 5
textes dialectaux non littéraires). À la mort de Jacques Monfrin, la direction du projet fut reprise par l’actuelle directrice de l’École des Chartes, Françoise Vielliard, avec la collaboration de Martin-Dietrich Gleßgen. Le premier volume des Documents linguistiques de la Belgique romane, série parallèle à la série française paraît en 1984. Il comprend les chartes du Hainaut (Ruelle 1984) et se voit accompagné, trois ans plus tard, des chartes flamandes (Mantou 1987). Le troisième volume que devrait comprendre la série, encore manquant, sera dédié aux chartes de Wallonie. Répondant à l’invitation que lui fit personnellement Jacques Monfrin pour combler cet hiatus, Marie-Guy Boutier entreprend le projet Khartês, destiné dans un premier temps à fournir les matériaux nécessaires à l’élaboration du tome trois des Documents linguistiques de la Belgique romane et donc à couvrir la Wallonie (provinces de Liège, de Namur et de Luxembourg). Le corpus étudié dans le cadre du projet Khartês sera constitué pour commencer des chartes originales conservées dans les provinces de Liège et de Namur. Le travail a débuté par l’édition de celles qui sont entreposées aux Archives de l’État à Liège. Toutes les chartes originales antérieures à l’avènement de l’évêque Hugues de Chalon (1292) seront étudiées, la plus ancienne datant du mois de mai 1236 (il s’agit du document référencé Document 1236–05), soit un corpus évalué actuellement à 285 chartes. Il a rapidement été décidé que les éditions fournies par le projet seraient électroniques et accompagnées d’une reproduction digitale des documents. Actuellement, deux personnes participent activement au projet Khartês – bien que son avancée ait été quelque peu ralentie depuis 2004 –: Marie-Guy Boutier et nousmême. Dans la mesure du possible les étudiants intéressés sont invités à collaborer au projet. C’est ainsi que Stéphanie Audrit, Nicolas Brugali et nous-même avons pu, encore étudiants, proposer une nouvelle édition pour certains des documents ciblés par le projet – voir respectivement Audrit 2003, Brugali 2003 et Mazziotta 2001. Le travail évolue lentement, mais il est déjà suffisamment avancé pour que nous ayons à notre disposition une transcription diplomatique fiable de 148 documents liégeois – voir la liste des références en fin de volume. Le critère de sélection est ici lié à la fiabilité des éditions disponibles: seuls les documents dont la transcription diplomatique est suffisamment aboutie font partie du corpus retenu pour la présente étude. 0.2.2
Problèmes liés au corpus
Du fait de sa nature et de la manière dont il a été constitué, le corpus pose plusieurs problèmes liés à son hétérogénéité (→0.2.2.1) et à la quantité de données qu’il rend accessibles (→0.2.2.2). 0.2.2.1
Hétérogénéité des types discursifs
Le grand nombre de types d’actions juridiques enregistrées dans les chartes influence certainement la variété des structures textuelles. a. Classement diplomatique des documents. En dépit d’une structure générale commune, qui fonde la définition du terme charte et la pertinence du regroupement des documents dans un seul échantillon, les chartes que nous étudions forment un ensemble incontestablement hétérogène. Quiconque a pratiqué quelque peu ce genre de
6
texte est conscient de cette hétérogénéité. Si bien que les manuels de diplomatique les plus récents n’hésitent pas à affirmer que «[l]a charte n’est pas à proprement parler un terme technique, mais plutôt un terme générique, recouvrant une variété confuse de documents. N’étant pas technique, le mot est assez flou. [. . .] Une charte contient soit une concession de biens, de droits,. . . soit une décision judiciaire.» (Guyotjeannin et al. 1993, 25, italiques en grasses dans le texte). La majorité des diplomatistes ont choisi d’accepter la définition floue du mot charte. Le classement des actes sur base de l’action juridique qu’ils enregistrent est délaissé,3 au profit d’une typologie basée sur la qualité de l’auteur (la personne juridique s’identifiant comme l’émetteur de l’acte écrit) ou du bénéficiaire (celui à qui profite l’acte juridique). On distingue alors les actes publics (souverain, princier ou seigneurial, pontifical ou encore épiscopal) des actes privés.4 Suivant ce critère, tous les documents du corpus entrent dans la dernière de ces catégories. b. Inadéquation du classement. Du point de vue du linguiste, la solution ne convient pas tout à fait. Les structures morphosyntaxiques mobilisées dans un texte dépendent grandement du message qu’il véhicule. Nous aurons l’occasion de revenir sur la définition du texte dans les préalables du chapitre consacré à l’analyse morphosyntaxique (→3.1.2.1). Pour l’heure, donnons un exemple concret du problème que laisse subsister la typologie communément acceptée. On sait dès les premiers mots de ces trois chartes qu’elles ne traitent pas des mêmes actions et que leur structure en sera certainement différente: «Nos, Guis, cuens de Flandres, faizons savoir a_tos ke nos Geramont et les appendances et Bornehem et les appendances ki astoient nostre franc aluel avons receut en_fiés [2] ligement a_tenir de mon saingnor Henri, par le grasse de Deu eveske de Liege, et de ses successeurs eveskes de Liege perpetuement [. . .]» (Document 1263–05–27a, 1). «A tos cheaus ki ches letres verunt et orunt, maistre Jehans de Sain_Tron, chanoines de Hui, et Watiers de le Wege, [2] chevaliers, arbitre esliut del besten ki a esté entre le glise Saint Lambert de Liege, d’une part, et mon segnor Gilon, [3] chevalier d’Otoncort et ses oirs, d’autre part, [. . .], salus et conisanche de verité.» (Document 1270–05–10, 1). «Je, Lambers de le Fosse, citains et eskevien de Liege, en me plain sens et en me bone memore, a me testament a queil ciste lettre [2] est afichie et saelee de ces meimes saias fai je tele addition [. . .]» (Document 1283–02–13a, 1).
Par exemple, nous savons d’avance que le troisième de ces documents contiendra une liste de dispositions et de legs, alors que le deuxième contiendra un verdict. Ces différences quant au contenu des textes influencent leur structure discursive. Par ailleurs, il est probable que cette dernière, même si elle ne se trouve pas au cœur de notre étude, influence la ponctuation: on ne ponctue pas de la même manière une liste et une sen3
4
«[L]a diplomatique a pu sortir du débat où elle risquait de s’enliser, en prenant en compte un critère plus juridique (la nature de l’action juridique et le statut des protagonistes) que diplomatique (la forme de l’acte et la nature de son authentification).» (Guyotjeannin et al. 1993, 115). C’est-à-dire «tout acte émanant d’une personne privée, ou d’une personne publique agissant pour le compte d’une personne privée», définition proposée par Robert-Henri Bautier et la Commission internationale de diplomatique, cf. Guyotjeannin et al. 1993, 104.
7
tence d’arbitrage.5 Malheureusement, un classement par type discursif (et indirectement par type juridique), outre le fait qu’il demanderait des compétences d’historien et de juriste, nécessiterait une étude détaillée de la question. Pareil travail n’aurait pas sa place ici. 0.2.2.2
Quantité de données
Suivant que l’on considère les textes dans leur ensemble ou les unités sémiotiques et linguistiques qu’ils véhiculent, on devra conclure à l’indigence ou à l’extrême richesse du corpus. a. La faible quantité de documents pousse à ignorer les données extralinguistiques. L’hétérogénéité des types d’actes n’est pas le seul facteur à influencer la validité d’une étude centrée sur des documents originaux. Faute d’avoir été restreinte a priori, l’extrême variété des auteurs, des scelleurs, des impétrants et des scribes mène irrémédiablement à une disproportion: certains auteurs, comme par exemple la cour allodiale de Liège,6 sont à l’origine de quelque 55 documents du corpus, alors qu’un seul acte est émané du duc Henri de Limbourg (Document 1237–09–16). On pourrait certes classer les documents en fonction de ces observations «objectives», mais que donnerait un tel classement sur un corpus aussi réduit? Pas grand-chose, assurément, compte tenu du fait que l’on ne pourrait garantir la représentativité des différents groupes formés. Nous avons donc dû nous résoudre à travailler dans des conditions qui sont loin d’être optimales, en attendant que le corpus s’enrichisse ou qu’il soit possible de le comparer à d’autres textes issus d’autres fonds d’archives. Cela rendra peut-être possible la description adéquate de plusieurs partitions consistantes. Nous ne ferons donc qu’épisodiquement référence à la description extralinguistique des chartes. b. La quantité démesurée d’unités linguistiques et sémiotiques pousse à réduire la richesse des documents. Si nous pouvons regretter le peu de données disponibles pour classer les documents les uns par rapport aux autres, il n’en est pas de même lorsque nous abordons les «lettres», mots, «signes de ponctuation» et structures syntaxiques qu’ils comportent. Chacune de ces sortes d’unités permet d’isoler des milliers d’occurrences, voire des dizaines de milliers. Ainsi, sans aborder ici la question du discernement des unités et à titre d’exemple, le corpus étudié contient pas moins de 64252 occurrences de mots. Quelle que soit l’optique adoptée pour les traiter,il faut bien admettre que cette quantité est trop importante pour être manipulée efficacement par un être humain. Face à pareil foisonnement, il sera nécessaire de réduire les données.
5 6
Une idée que nous avons déjà avancée dans Mazziotta à paraître, §1.1. Cette cour, qui porte le nom particulier de Casa Dei (formes romanes: Chise Dieu, Cise Dieu, etc., soit le type _Chaise Dieu_) est compétente en matière d’alleux, c’est-à-dire de biens possédés en pleine propriété. Elle est composée de propriétaires de tels biens (qui sont dits hommes de la Chaise Dieu), lesquels échappent ainsi à la juridiction scabinale. Voir Bertrand 2004, 165s.
8
0.3
Plan de l’étude
Nous organiserons notre exposé en deux parties: la première sera consacrée à la construction des concepts nécessaires à l’analyse, tandis que la seconde contiendra l’analyse proprement dite. 0.3.1
Première partie: modélisation
Les chapitres →1 à →3 constitueront la première partie du travail. Dans le premier, qui sera relativement abstrait, nous poserons les bases qu’on pourrait qualifier de métaconceptuelles: il sera question d’exposer la manière dont les concepts intégrés aux modèles de description de la langue écrite et de la syntaxe seront construits. Le chapitre →2 relèvera à la fois de la sémiotique et de la linguistique. Nous y proposerons une systématisation nouvelle des unités de la langue écrite, menant ainsi à un classement complet d’où émergera une définition précise du terme ponctuation. Le chapitre →3, quant à lui, traitera exclusivement de linguistique. Nous y introduirons un modèle d’analyse syntaxique personnel, ce qui nous mènera à définir concrètement ce que le mot syntaxe signifie à nos yeux. On pourra voir comment les concepts et analyses décrits dans cette première partie ont été appliqués systématiquement au corpus en se reportant aux annexes.7 0.3.2
Deuxième partie: analyse des données
Dans la deuxième partie, nous mettrons en relation les unités (relevant des deux domaines modélisés) que nous avons pu identifier à l’intérieur de notre corpus. Pour ce faire, nous devrons mobiliser un petit nombre de techniques statistiques simples, dont les concepts fondamentaux seront exposés au chapitre →4, d’une manière que nous espérons accessible. Le chapitre →5 sera consacré à la recherche de tendances générales concernant la fréquence des signes de ponctuation aux limites des structures syntaxiques. Nous tenterons de répondre à la question: «Quelles structures paraissent plus ponctuées que les autres?», ou au contraire: «Quelles structures sont clairement les moins ponctuées?» De cette manière, nous identifierons les structures que nous devons étudier de manière plus approfondie. S’enchaînant avec le précédent, le chapitre →6 sera focalisé sur les structures les plus remarquables pour en faire l’examen détaillé, en prenant à nouveau en considération la fréquence d’occurrence de la ponctuation. Contrastant avec les deux chapitres qu’il suit, l’examen qui formera le corps du chapitre →7 tiendra compte de la forme des signes de ponctuation et non plus uniquement de leur fréquence. Enfin, dans la conclusion (chapitre →8), nous ferons le point sur notre démarche et les résultats que nous avons pu dégager.8
7 8
Voir l’adresse permanente http://hdl.handle.net/2268/25773, qui fournit les annexes de la présente étude. La structure de →8.1 répond au plan que nous venons d’exposer.
9
0.4
Ressources techniques
Avant de les enfouir dans les annexes, disons quelques mots des logiciels et techniques informatiques employés pour encoder les données. Aucun logiciel répondant exactement à nos besoins n’étant disponible, nous avons été contraint de développer nous-même l’ensemble des programmes employés. De manière très concrète, voici ce qui a dû être fait. Les chartes ont été transcrites et encodées à l’aide d’une norme largement répandue pour stocker les données complexes de nature textuelle: l’eXtensible Markup Language (XML), qui permet à l’ordinateur de retrouver les mots et les signes de ponctuation originaux au moyen de programmes adéquats. Ces derniers sont fournis en annexe.9 Les outils de traitement des données prennent la forme de scripts10 écrits dans un langage nommé Perl.11 On pourra également consulter les transcriptions diplomatiques abouties en se reportant aux annexes.12 Les analyses morphosyntaxiques, conformes à l’exposé du modèle du chapitre 3, ont été encodées dans le même fichier informatique que celui qui contenait l’édition de chaque charte. Les analyses exhaustives, représentées par des boîtes imbriquées suivant un ordre déductif allant des textes aux mots, sont fournies en annexe.13 Enfin, les chapitres →4 à →7 nécessitaient que les données soient extraites et soumises à un nombre important de calculs. La sélection des données (rassemblées également à l’aide d’un programme Perl) et leur traitement numérique prend la forme de scripts écrits dans un langage nommé R,14 particulièrement adapté aux traitements statistiques. Quels que soient les programmes et les langages utilisés, il importe de souligner deux choses: la liberté des codes sources et l’absence de garantie. Les programmes d’extraction des données ne sont pas forcément infaillibles et contiennent probablement des erreurs. Dans une perspective scientifique, il est impératif que le code source des applications soit ouvert et documenté. Si les codes sont reportés en annexe, il reste un important effort de documentation à faire. Qu’on nous laisse poser ici un jugement sévère et catégorique sur les logiciels dont les sources, pour des raisons commerciales ou autres, ne sont pas accessibles aux utilisateurs: pareilles pratiques nuisent à la science. C’est ainsi que les programmes et standards que nous avons choisi d’employer sont libres et ouverts.15
9
Voir la section Ressources des annexes.
10 C’est-à-dire de programmes non compilés, «lisibles» dans n’importe quel éditeur de texte.
11 12 13 14 15
La compilation des programmes écrits dans un langage de scripts est généralement effectuée à l’exécution. Version 5.8.7, voir la «bible» du langage, par son créateur: Wall et al. 2000. Voir la section Transcriptions des annexes. Voir la section Analyses syntaxiques. Version 2.4.0, voir R Development Core Team 2005. Les licences d’utilisation de Perl et R sont fournies dans les paquets binaires d’installation de ces logiciels; voir la section Ressources des annexes.
10
0.5
Travail en cours
Il est d’autre part important de pouvoir prendre en considération le fait que le travail est effectué sur un corpus inédit, encore en construction à l’heure où nous écrivons ces lignes.16 Malgré notre soin, les efforts d’édition des matériaux17 et d’annotation18 comportent certainement encore beaucoup d’imperfections. Par ailleurs, une fois le corpus édité et annoté sous forme électronique, en supposant qu’il soit exempt d’erreurs et d’imprécisions et soit présenté dans un état définitif, il reste toujours à gérer le délicat problème de l’extraction de son contenu. Cet état transitoire du corpus et des outils, intimement lié à l’abondance des données et au travail important que leur traitement implique, mène à des obstacles techniques et contingents. 0.5.1
Erreurs et évolutivité
Commençons par distinguer les erreurs en fonction de leurs causes. Une erreur doit toujours être située par rapport aux matériaux traités, mais également par rapport au modèle choisi pour travailler. Elle peut ainsi être due à une inconsistance de l’analyse ou à une conceptualisation inadéquate des phénomènes observés. Pratiquement, les erreurs les plus problématiques sont celles de la première sorte: si durant l’encodage, nous avons mal identifié un constituant, l’identifiant comme un «verbe principal» alors qu’il a la fonction de «sujet», nous avons commis une erreur accidentelle. Quant aux erreurs de conceptualisation, elles sont à situer sur le plan épistémologique: on a mal perçu la nature des données (erreur a priori). Ce type de biais est inhérent à la recherche empirique dans ses activités de réduction autant qu’à la recherche théorique dans ses activités de modélisation. Nous aurons maintes fois l’occasion de faire remarquer que l’enregistrement des données et la conceptualisation ne constituent que des approximations de la réalité observée.19 Cela signifie que les erreurs sont inévitables et font corps avec la recherche. Il est cependant nécessaire de les décrire et de les annoncer: lorsque nous écrivons, dans la section décrivant les relations entre les «compléments» à l’infinitif et le «verbe principal»:20 «Devant ce phénomène complexe, nous avons choisi la solution qui paraissait la plus raisonnable et la plus conforme au modèle.» (p. 114).
puis que nous détaillons notre choix dans les lignes qui suivent, nous informons le lecteur sur la portée et l’importance de l’approximation que nous avons cru licite de supporter. On s’attend donc à retrouver les mêmes approximations dans les analyses et dans leurs conclusions, ce qui est tout à fait normal. Ces erreurs systématiques ne pourraient être corrigées qu’en revoyant les fondements du travail.
16 Et sur lequel nous avons jusqu’à présent été très peu nombreux à travailler. 17 Revus en partie par Marie-Guy Boutier. 18 Sur lesquels nous avons travaillé seul, et qui n’ont bénéficié d’aucune relecture extérieure. 19 Concernant le mécanisme de conceptualisation, →1.1 pour une présentation générale. 20 Nous reviendrons sur ces termes dans le chapitre →3, où les notions qu’ils désignent seront
systématisées.
11
0.5.2
Programmation des requêtes
Une fois définis les individus et les variables qui servent à les décrire, l’analyse n’est possible que si, d’une manière ou d’une autre, ces individus et leurs modalités spécifiques sont extraits du corpus. Leur quantité est telle qu’il n’est pas imaginable de procéder manuellement, si bien que chaque question oblige à écrire des programmes informatiques chargés d’effectuer cette tâche.21 Cette étape du travail, très technique, prend également beaucoup de temps.22 Or, comme on le verra,23 les conclusions statistiques et l’expérience des textes mènent parfois à poser de nouvelles questions aux documents. Parfois, ces questions ultérieures nécessitent de nouveaux dépouillements, qui nécessitent à leur tour de nouveaux programmes, c’est-à-dire beaucoup de temps de développement. Nous serons donc forcé de limiter nos recherches à ce que nos capacités techniques et notre matériel ont permis de traiter jusqu’à présent.
21 Voir la section Ressources des annexes. 22 L’élaboration de requêtes – devant donner des résultats fiables (pas d’erreur) dans des dé-
lais raisonnables (temps de traitement) avec le matériel informatique dont nous disposons (ressources matérielles) – est un processus exigeant. 23 Voir par exemple la conclusion du chapitre →5, p. 218.
12
1
Préalables épistémologiques: concepts et terminologie
Le statut «proto-scientifique»,1 de la linguistique, couplé à un héritage chargé d’une lourde tradition, oblige à un recadrage terminologique constant, traduisant idéalement le système des unités conceptualisées.2 Il est préférable pour un linguiste de se situer préalablement à toute étude, par rapport à une terminologie construite; la remarque est d’autant plus appropriée dans le jeune champ de la ponctuation. La théorisation linguistique ne peut faire l’économie d’une réflexion structurée sur la terminologie qu’elle mobilise. Il est, écrit Gilbert Lazard (1999b, 113), «difficile, dans l’état actuel de notre discipline, de parler de terminologie sans aborder en même temps des questions théoriques et méthodologiques». La réciproque est également tout à fait justifiée: toute réflexion théorique mettant en relation de nouveaux concepts ou en réorganisant d’anciens soulève le problème de la nomination de ces concepts. C’est précisément ce point de vue que nous allons adopter: partant d’un travail d’abord d’organisation et de définition des concepts, nous devrons nommer ces derniers pour qu’ils puissent servir à un examen approfondi des faits. Ce chapitre est ainsi destiné à poser les bases théoriques nécessaires à la définition des différents concepts et termes que nous créerons ou mobiliserons pour classer et analyser les unités de la langue écrite et les structures morphosyntaxiques. Il vise essentiellement cet objectif pratique. Nous nous devons donc de présenter la manière dont nous allons élaborer les concepts et les nommer préalablement à tout développement. Les principes resteront abstraits dans les limites du présent chapitre, mais seront appliqués de manière concrète dans les chapitres →2 et →3. Désireux avant tout de créer un canevas de travail simple tout en restant rigoureux, nous nous sommes gardé de nous aventurer dans l’exposé des techniques les plus récentes développées principalement dans un cadre de recherche informatique, à savoir, d’une part, le Unified Modelling Language (UML) et, d’autre part, les ontologies et le web sémantique. La
1
2
Ce qualificatif revient à Gilles-Gaston Granger, pour qui la linguistique se trouverait actuellement dans l’«état de la physique avant Galilée» (cf. Lazard 1999a, 68) c’est-à-dire une discipline qui n’est pas encore une véritable science. Pour Gilbert Lazard, il manque simplement à la linguistique «de définir de manière explicite et rigoureuse l’objet ou les objets auxquels doit s’appliquer le travail du linguiste désireux d’atteindre des connaissances objectives et définitives, comme sont les connaissances scientifiques» (Lazard 1999a, 69). Cette démarche est incontournable, et en ce sens, nous adhérons à la réflexion de Gilbert Lazard. Néanmoins, la connaissance «définitive» paraît quant à elle peu accessible: toute science inductive (ce qui exclut les mathématiques et une partie de la logique) se fonde sur le fait qu’aucune connaissance ne peut être tenue pour définitive. Voir un exemple de recadrage dans Lazard 1999b.
13
complexité des métamodèles introduits dans l’un ou l’autre de ces cadres aurait compliqué l’exposé sans pour autant le rendre plus rigoureux.3 Nous aborderons tout d’abord brièvement les rapports entre l’objet de description et sa conceptualisation (→1.1), avant de se centrer sur les impératifs méthodologiques nécessaires à la création d’une terminologie rigoureuse (principes repris de Pierre Swiggers, →1.2). Nous expliquerons ensuite comment ce modèle peut être schématisé de manière à en simplifier l’exposé (→1.3).
1.1
Mécanisme de conceptualisation
La construction de la terminologie implique tout d’abord de conceptualiser la réalité à laquelle elle s’applique. La terminologie linguistique n’étant avant tout qu’une sorte de terminologie,4 il est utile de considérer les démarches pratiques des terminologues pour construire notre système. Pour ce faire, nous avons besoin des notions5 d’objet, concept, propriété et caractère (Depecker 2002). La réalité est constituée d’objets, perceptibles ou concevables, pourvus de certaines propriétés; p. ex.: un vase posé sur une table peut être fait de verre bleu, mesurer 28,3 cm de haut,. . . Conceptualiser un objet (créer un concept dont il serait une occurrence) revient à sélectionner une partie de ses propriétés comme des traits essentiels qu’ont en commun tous les éléments de l’ensemble des objets particuliers qu’on cherche à définir; à ces propriétés sélectionnées, on donne le nom de caractères (voir la présentation qu’en fait Loïc Depecker 2002, 133, Depecker 2003, 54). Ceux-ci permettent une définition du concept (Rey 1979, 42): un concept se définit ainsi par une série de caractères abstraits des propriétés des objets. Par rapport à l’objet, le concept constitue un modèle susceptible de révision et de remaniements, mais surtout dépendant du regard qui est porté sur l’objet. De ce fait, le regard sur l’histoire de la langue, par exemple, sera différent selon qu’on considère son histoire externe ou son histoire interne. Dans le cadre de la construction d’une terminologie, cette élaboration est idéalement beaucoup plus simple que celle de la définition d’une unité naturelle. En effet, parlant de la terminologie employée dans les manuels techniques, Loïc Depecker indique la contrainte que «de la première page d’un manuel à la dernière, une même unité terminologique désigne systématiquement le même objet, sauf indication explicite» (Depecker 2002, 133). Cette contrainte, nécessaire dans le cadre d’applica3
4 5
Voir, au sujet d’UML Si Alhir (2003). Ce langage a été créé dans le but pratique de développer des programmes informatiques, mais son haut degré de généralité permet la conception et la schématisation de n’importe quelle notion ou processus. En ce qui concerne les ontologies (dans le cadre de l’informatique), la page de l’Ontology Web Language du World Wide Web Consortium (http://www.w3.org/2004/OWL/ ) est un bon point de départ. Les ontologies permettent de définir formellement les concepts à l’aide d’une notation logique nommée description logic (voir Baader/Nutt 2002 pour un exposé détaillé). Affirmation à relativiser, voir Rey-Debove 2001. Le problème que pose la métaterminologie est évidemment d’un poids épistémologique considérable. Nous ne prenons pas la peine de nous attarder sur ce fait, qui mérite à lui seul quantité de réflexions. Le seul terme de concept pose notamment le problème de la relation entre terminologie et linguistique (Depecker 2002, 127, présenté dans Depecker 2003, 29) et ne se laisse pas définir (Rey 1992, 30s.). Voir cependant ci-dessous, note 7.
14
tions techniques (comme la fabrication de composants électroniques, les manipulations pharmacologiques, etc.), permet d’éliminer les phénomènes de brouillage du lien entre forme d’expression et contenu (synonymie, homonymie, etc.) à l’intérieur d’un système terminologique donné. Cela n’implique pas pour autant que ces problèmes sont inexistants en terminologie (Depecker 2002, 142), mais qu’il serait malheureux d’en élaborer une nouvelle sans les éviter.6 Cette démarche de nomination entraîne immanquablement un besoin de néologie, qui pourrait sembler prétentieux, mais qui, en réalité, est simplement nécessaire; cela ne signifie pas que nous ne «récupérerons» aucun terme, mais que nous ne nous priverons pas d’en créer quand il y aura lieu de le faire. La vision désormais classique, mais «trop belle pour être facilement applicable» proposée par Bernard Pottier (1974, 29–30) peut être concrétisée: il est aisé de construire des définitions par sélection de propriétés, de manière à construire des sémèmes hiérarchisés dans des relations d’hypo-hyperonymie; les hyponymes héritant des caractères de leurs hyperonymes (sèmes génériques) et se distinguant de leurs cohyponymes par un ou plusieurs caractères (sèmes spécifiques).7 Par exemple, si on compare les concepts de lézard et de chien, le caractère pourvu de quatre pattes, commun à tous les quadrupèdes, définit ces désignations comme cohyponymes de quadrupède (sème générique), alors que les caractères mammifère et saurien (sèmes spécifiques) permettent de distinguer les deux hyponymes.
1.2
Impératifs terminologiques
Pour élaborer nos terminologies, nous suivrons les jalons posés par Pierre Swiggers dans sa Systématique de la terminologie linguistique (1999). Dans cet article, l’auteur étudie la terminologie linguistique sous ses aspects historique (comme «objet donné»), méthodologique (comme objet à constituer) et épistémologique (comme un retour vers l’objet langage). Nous nous focaliserons essentiellement sur l’aspect méthodologique (→1.2.1), puisqu’il s’agit pour nous de construire une terminologie en relation avec la systématisation du domaine. Nous expliquerons ensuite comment nous nous positionnons «historiquement» (→1.2.2). 1.2.1
Établir une terminologie
Les considérations méthodologiques que Pierre Swiggers expose prescrivent quatre contraintes formelles – cinq en comptant la systématicité – pour élaborer une terminologie linguistique:8 – Transparence: les termes choisis doivent être maximalement transparents,9 en ce 6 7 8 9
Bien entendu, il est question d’éviter exclusivement les brouillages et non les propriétés liées à la hiérarchie des concepts, telles que l’hypero-hyponymie. La question de la relation entre le concept et le signifié (Depecker 2002, 127) n’est pas résolue. Nous assimilons l’un à l’autre. Cité verbatim de Swiggers 1999, 31, avec quelques aménagements typographiques. En guise d’exemple, Pierre Swiggers renvoie au système de termes parataxe, diataxe, apotaxe, anataxe, catataxe, métataxe, épitaxe et hypertaxe; les sept premiers désignent diffé-
15
que leur signification devra être univoquement associée à la structuration formelle du métalangage. – Adéquation: les termes choisis doivent être dans un rapport de référence directe et univoque avec un domaine applicatif, défini par l’ensemble des termes relatifs à ce domaine (cette circularité est incontournable); on pourra parler d’adéquation par sommation en parlant d’ensembles de termes décrivant les secteurs d’un domaine complexe. – Cohérence: la nomenclature terminologique dans son ensemble doit être cohérente, c’est-à-dire exempte de relations de contradiction interne et unifiée par des rapports de solidarité, d’inclusion, d’opposition définie, de superordination, etc. – Économie: la nomenclature terminologique doit être parcimonieuse, c’est-à-dire utiliser le nombre minimal de termes requis par la description du domaine (ou du problème) et ne doit pas employer des termes de structure complexe là où des termes de structure simple sont disponibles. 1.2.2
Positionnement
D’autre part, comme l’exprime Pierre Swiggers, d’un point de vue strictement historique, «Une théorie doit se définir par rapport à d’autres théories et modèles. Cette ‹entrée sur le marché› est une affaire d’auto-publicité, de rhétorique positive et négative, de stratégies d’exclusion et de promotion, d’exploitation (ou de non-exploitation) des traditions culturelles et scientifiques.» (Swiggers 1999, 23).
Il nous faudra nécessairement – c’est le prix de la démarche scientifique – nous situer par rapport à nos devanciers. Cela peut théoriquement se faire de plusieurs façons: soit par la critique systématique de leurs théorie et terminologie dans le but d’élaborer notre propre théorie dans un mouvement de synthèse dialectique entre ces terminologies et les critiques que nous avons à leur formuler; soit en situant a posteriori les théories antérieures par rapport à la nôtre, exposée en faisant table rase de ces travaux. Le choix de la méthode de positionnement dépend en grande partie de l’état de l’art du domaine dans lequel s’insère la conceptualisation – nous verrons ci-dessous que nos choix ne seront pas identiques en ce qui concerne la conceptualisation de la langue écrite et celle de la syntaxe.10 Bien entendu, il n’est pas souhaitable de poser la terminologie théoriquement, sans égard à la réalité des faits, et la construction des axiomes se fera en fonction de cette réalité, c’est-à-dire, en fonction d’une intuition – qui, pour méthodique qu’elle soit, ne cessera de devoir être considérée comme telle – que nous nous devrons d’expliciter.
rentes dimensions syntaxiques relevant de l’ordre du segmental, le dernier, d’ordre suprasegmental, se superposant, se combinant ou s’ajoutant à la syntaxe segmentale (Eynde et al. 1998). Les règles de construction morphologique de ces termes sont exprimées ainsi: «Pour désigner les dimensions syntaxiques, nous nous servons de termes qui, tout comme le terme ‹syntaxe› lui-même, se composent de deux parties tirées du grec: la racine ‹taxe› et un préfixe approprié.» (Eynde et al. 1998, 33). 10 Voir l’introduction du chapitre →2 pour notre position par rapport à la langue écrite et →3.1.1 concernant la syntaxe.
16
Concept @caractère 1 @caractère 2 F IG . 1.1 – Représentation d’un concept et de ses caractères
@caractère 1 @caractère 2 F IG . 1.2 – Représentation d’un concept non nommé Concept parent @caractère 1 @caractère 2 Concept enfant 1 @caractère 1.1 @caractère 1.2
Concept enfant 2 @caractère 2.1 @caractère 2.2
F IG . 1.3 – Représentation d’une hiérarchie de concepts
1.3
Conventions de schématisation des concepts
Ces principes exposés, convenons à présent d’un système de notations qui soit pratique et nous permette de formaliser la représentation des concepts. Ces conventions, qui mettent en évidence les caractères retenus, permettront également de nous exposer explicitement à d’éventuelles critiques quant à la pertinence des choix opérés et des formulations. 1.3.1
Présentation des conventions
Schématiquement, on peut représenter le concept sous la forme d’une boîte, à laquelle on donnerait une étiquette correspondant à son nom. La boîte est remplie de la liste des caractères spécifiques (propriétés sélectionnées) au concept en question et chaque caractère est précédé du signe ‹@› (figure 1.1). Bien entendu, rien n’empêcherait de construire un concept qui n’aurait pas de dénomination (figure 1.2).11 La hiérarchisation des concepts est présentée sous forme d’arbre, chacun des nœuds héritant de tous les caractères de ses ancêtres. Les concepts enfants sont étiquetés comme les concepts parents, mais leur définition complète comporte en outre les caractères des concepts ancêtres: parent, parent du parent, et ainsi de suite, récursivement (figure 1.3). D’après ce schéma, les caractères 1 et 2 sont communs au concept parent et aux concepts enfants 1 et 2, qui se définissent respectivement par les groupes de caractères 1.1, 1.2 et 2.1, 2.2. Cette hiérarchisation peut être représentée par un emboîtement quand il n’est question que d’un seul concept et que l’on désire préciser son ascendance: «Concept enfant 11 Dans une perspective purement opératoire, il n’est pas non plus impossible de créer un
concept dont les caractères ne seraient pas (encore) définis.
17
est un Concept parent» qui a les caractères numérotés 1.1 et 1.2. Par économie, nous omettons parfois les caractères du concept parent, ce qui met clairement en évidence que le fait d’être un concept parent est un caractère du concept enfant. 1.3.2
Intérêts
À nos yeux, les conventions de présentation que nous allons appliquer dans les chapitres →2 et →3 donnent au lecteur un accès facile et résumé à l’ensemble de l’exposé qui soutient la démarche de conceptualisation. Enfin, et cela est commun à toute tentative de représentation formalisée, les schémas isolent les différents éléments de l’argumentation, de sorte qu’il devient possible de les critiquer individuellement avant de les remettre en perspective. Il est donc envisageable de corriger par petites touches les concepts proposés, sans pour autant remettre en question l’ensemble du système.
18
2
Théorie de l’écriture et ponctuation
Même entendue intuitivement, la ponctuation est conçue comme faisant partie intégrante du système de l’écriture. Nous ne pouvons donc nous passer de la délimiter dans ce champ. C’est en fait la définition progressive du concept de langue écrite et des unités qu’on y trouve qui va nous permettre de rencontrer notre premier objectif. Nous proposons non seulement de définir ici le concept de ponctuation, tel qu’il sera entendu durant toute notre étude, mais surtout de placer cette définition en bout de course d’une construction dont chaque point sera exposé de manière à pouvoir être remis en question s’il est confronté à de nouvelles données de l’expérience. Armé de méthodes théoriques pour définir nos concepts et notre terminologie (→1), nous définirons le concept de langue écrite (→2.1) avant d’appliquer ces méthodes aux réalités rencontrées dans les documents: la démarche sera déductive du point de vue de l’élaboration conceptuelle (il s’agira d’appliquer la méthode définie absolument), mais elle restera empirique, parce que toujours cadrée par les matériaux que nous explorons (→2.2). Cette confrontation dégagera une terminologie à vocation plus générale (démarche inductive), permettant une définition du concept de ponctuation (→2.3). En ce qui concerne la situation de notre travail dans l’évolution de la réflexion sur la langue écrite, nous devrons d’abord exposer nos vues, pour nous situer a posteriori par rapport à nos devanciers. Cette solution, qui n’est pas sans fausser légèrement l’Histoire et qui ne rend peut-être pas assez justice aux prédécesseurs en question, est la seule qui nous paraisse envisageable dans une démarche que nous avons d’emblée qualifiée d’empirique: il s’agit de partir des données observées pour construire une théorie. Mais comment pourrait-on faire autrement, alors que la totalité des visions systématisantes que nous connaissions de l’écriture vise à décrire des systèmes modernes, c’est-à-dire contemporains des descripteurs? Transposer ces vues au système médiéval serait pur anachronisme. Vu le sens de notre démarche, nous ne pourrons donc d’emblée «marchander» nos choix terminologiques à partir de ceux de nos devanciers. Il nous sera possible de leur rendre leur dû en signalant la paternité des termes que nous choisirons, mais nous ne pourrons nous positionner face à leur système théorique qu’a posteriori, lorsque nous aborderons le concept de ponctuation (→2.3).
19
2.1
Regard linguistique sur l’écriture
Dans un premier temps, il s’agit de définir le concept de langue écrite. Comme indiqué ci-dessus, la définition d’un concept est tributaire d’un certain regard sur l’objet. En l’occurrence, la définition du concept en question se fait en portant un regard de linguiste sur l’écriture.1 Nous aborderons ainsi les regards possibles sur l’objet qu’est l’écriture (→2.1.1), puis les regards de linguistes sur cet objet (→2.1.2). Cela nous mènera à choisir un point de vue et à définir en conséquence le concept de langue écrite. 2.1.1
L’écriture et les regards possibles
L’écriture est un artéfact humain et peut être considérée des différents points de vue humains portant sur les artéfacts. Elle peut être envisagée en tant qu’objet réel et historique, ou être appréhendée à travers ses répercussions, ou encore être vue comme un tout systématique. En tant qu’objet, l’écriture peut recevoir une définition très large, les propriétés pourront être aussi nombreuses qu’on voudra. Les approches sont aussi multiples que sont les sciences de l’homme: historique, paléographique, psychologique, esthétique, sémiotique, sociologique, linguistique, etc. L’objet écriture est vaste par la complexité et l’abondance de ses propriétés. Intuitivement, on distingue des propriétés matérielles (elle se développe dans l’espace, elle est presque toujours visible, elle peut être plus ou moins durable, etc.); des fonctions, qu’elles soient utilitaires/volontaires ou non (elle sert à communiquer à distance, dans le temps, elle sert à transcoder l’oral, elle transmet des informations sur le subconscient du scribe,. . .); etc. L’écriture est donc un objet qui peut être conceptualisé par un regard particulier. Chacun des regards qu’on peut lui porter réduit cet objet à une série de caractères qui permettent de définir un concept propre à une représentation scientifique, technique ou artistique. Ainsi, le paléographe négligera la propriété «transmet des informations sur le subconscient. . . » pour élaborer le concept de script, alors que le graphologue en fera un caractère essentiel. 2.1.2
Constitution du concept de langue écrite
Quant au linguiste, les propriétés qu’il sélectionne dans l’objet lui donnent la possibilité de créer le concept de langue écrite ou celui de code écrit,2 et ainsi d’intégrer l’écriture à son domaine d’étude. Il est bien connu que les différentes écoles linguistiques conceptualisent la langue de façons différentes, ce qui en soi pourrait impliquer une grande variété des terminologies en linguistique (Mounin 1974, VII - XXII). Le regard du linguiste peut être différent en fonction de la manière dont il considère la langue, c’est-à-dire le «moule d’envisagement»3 de l’objet langue qui lui permet de conceptualiser ce dernier dans son sens le plus général (‘langage’). Il faut donc ré1 2 3
Nous verrons ci-dessous le rapport entre les concepts de langue et code écrits Nous justifierons le choix du premier par notre objectif pratique (→2.1.2.2 c). Voir les différentes perspectives linguistiques de l’analyse de l’écriture infra, →2.1.2.2. La formule est de Pierre Swiggers (1999, 19–20), qui énumère, dans une liste qu’il qualifie de non exhaustive, pas moins de douze de ces «envisagements».
20
pondre à deux questions: quelle sera notre vision de l’objet langue (→2.1.2.1)? et comment se caractérisera le rapport entre cette conception de la langue et celle qu’on aura de l’écriture (→2.1.2.2)? La réponse à ces questions nous donnera les moyens de définir, nous l’espérons adéquatement, le concept de langue écrite (→2.1.2.3). 2.1.2.1
Un moule d’envisagement de l’objet langue
Le simple fait de choisir un moule d’envisagement revient à définir ce qu’on entend par langue. Il est vrai que vouloir tenter une définition est ambitieux: la diversité des moules est le témoin de la difficulté d’approcher cette définition. Pour cette raison, il nous faut choisir a priori notre point de vue, en fonction de nos convictions, plutôt que d’adopter une démarche éclectique molle. Ce qui rend légitime que le linguiste prenne l’écriture comme sujet d’étude et construise le concept de langue écrite, c’est qu’une partie des caractères de cette dernière sont directement hérités du concept de langue, ce qui implique une dépendance par rapport au moule d’envisagement choisi. Ce n’est qu’en restreignant le concept à l’aide de ce caractère qu’il peut devenir pertinent pour le linguiste.4 La langue écrite étant une langue, elle hérite de tous les caractères de cette dernière. Bien que chaque point mérite discussion et soit sujet à polémiques, nous prenons comme point de départ une vue traditionnelle de ce qui définit la langue: – comportant des unités pourvues d’une forme d’expression et d’un contenu (signes bifaces, cf. Saussure 1967, 97s. Hjelmslev 1968, 65s.); – doublement articulée (cf. Martinet 1996, 17s.; idée exprimée chez Hjelmslev (1968, 58s.) dans l’opposition signes vs figures); – dont les unités sont arbitraires (cf. Saussure 1967, 100s.); – dont le potentiel expressif est illimité.5 Cette définition se situe ainsi dans la lignée du structuralisme fonctionnaliste développé à partir de Ferdinand de Saussure, Louis Hjelmslev, André Martinet, etc. (figure 2.1). 2.1.2.2
Relation entre écriture et langue
Par rapport à la langue, l’écriture (Swiggers/Van Hoecke 1991, 504), peut être envisagée de trois façons différentes, que Jacques Anis et ses collaborateurs présentent en ces termes:
4
5
«Une définition plus restreinte, qui fasse explicitement référence à la dimension linguistique, nous parait donc souhaitable. C’est le cas de celle que donne Hagège (1985[=1986]: 72) – L’écriture est une ‹technique de re-présentation de la parole par une trace laissée sur un support conservable› – ou mieux encore celle de Coulmas (1996: 555) – L’écriture est un ‹système d’enregistrement du langage à l’aide de marques visibles et tactiles en relation systématique avec les unités de la parole›.» (Jaffré 2001, 530). Cf. Hjelmslev 1968, 138: «En pratique, une langue est une sémiotique dans laquelle toutes les autres sémiotiques peuvent être traduites, aussi bien les autres langues que toutes les autres sémiotiques concevables.»
21
langue @système sémiotique @à double articulation @arbitraire @au potentiel expressif illimité F IG . 2.1 – Concept de langue «Parmi les diverses approches linguistiques de la langue écrite [. . .] on pourrait, en simplifiant, dégager trois tendances: – le phonocentrisme, qui traite la langue écrite comme une représentation déformée de la langue parlée; – le phonographisme, qui traite la langue écrite comme une représentation structurale de la langue parlée, intégrant également des caractéristiques spécifiques; – l’autonomisme, qui traite la langue écrite comme un système spécifique en interaction relative avec la langue parlée.» (1988, 77).
Le phonocentrisme est à considérer comme «hors du débat» (ibid.), puisqu’il ne vise pas à une description de l’écrit comme système. a. Perspective phonographique. Face au terme phonographique, Nina Catach (1988a) a proposé le terme glossographique. Selon ce point de vue, dans sa forme aboutie,6 elle postule théoriquement quatre «solutions» pour articuler les codes oraux et écrits avec la langue, ou plutôt quatre façons d’écrire une langue parlée (Catach 2001, 737a):7 1/ traduction de la substance phonique en substance graphique (terme à terme); 2/ construction d’un code d’expression parallèle, mais différent (spécificité partielle du code écrit); 3/ construction d’un code d’expression partiellement parallèle, introduisant des oppositions inexistantes à l’oral, et permettant une analyse morphématique différente; 4/ construction d’une langue différente. Dans la pratique, l’unité de base, le graphème, est définie par Nina Catach comme la désignation générique de différentes unités, dont les types se distinguent en fonction de ce qu’elles servent à noter (voir p. ex. Catach 2001; Gruaz 1985), ce qui revient toujours à définir les unités du code écrit par rapport au code oral, puisque, considérant l’interférence entre les deux codes, c’est toujours le même sens de la relation qui est pris en compte (les «solutions» sont ordonnées en fonction de la distance qu’elles accusent par rapport à l’oralité). Concrètement, dans son approche du système graphique du français, qu’elle qualifie de plurisystème (voir p. ex. Catach 1988a, 248, Catach 2001, 738as.), Nina Catach distingue les graphèmes représentant des phonèmes (phonogrammes), de ceux qui représentent des morphèmes (morphogrammes) ou des unités «idéographiques», qu’on reconnaît et identifie instantanément comme des unités de sens (logogrammes), etc. Ainsi, a est un graphème qui représente un phonème dans villa, mais pas dans manger, où c’est le groupe an qui constitue un phonogramme; dans il viendra, ce même a représente en outre un morphème; par ailleurs, le signe c’est est un logogramme. Cette pluralité fonctionnelle de l’unité de base du système graphique est à la base de ce que Nina Catach nomme «mixité» du système. Néanmoins, pour le français, 83% des gra6 7
Il est hérité de Vladimír Hoˇrejší (1971) et de Vladimir Gak (1976), cf. Anis et al. 1988, 79. «L’écriture double la langue phonémique.» (Catach 1988a, 253).
22
phèmes noteraient des phonèmes (Catach 1998, 63), ce qui contribuerait d’après elle à justifier une approche prenant l’oral comme point de référence. b. Perspective autonomiste. Jacques Anis (1988, 213) adopte la position selon laquelle la langue «existe sous deux formes [orale et écrite], entre lesquelles la linguistique ne postule ni hiérarchie, ni dépendance»; il qualifie lui-même cette position d’autonomiste. La théorie, mise au point par Jacques Anis dans les années 80 (Anis 1983; Anis 1988; Anis et al. 1988), se réclame de Josef Vachek (1973). Il faut y voir une option méthodologique qui se positionne par rapport aux conceptions généralement acceptées jusqu’alors et dont Nina Catach est le représentant le plus engagé. Selon les autonomistes, les théories modernes de la lecture (Anis 1983, 32) ayant mis en évidence qu’il était possible de comprendre un texte écrit sans accès à la forme phonique correspondante, il est envisageable de décrire la structure du code écrit indépendamment du code oral. Les tentatives de descriptions autonomistes, peu nombreuses au demeurant, nomment également graphèmes les unités de la langue écrite. Jacques Anis répartit les graphèmes en trois classes qu’il définit comme suit: les alphagrammes ou ‘graphèmes alphabétiques, unités purement distinctives’; les topogrammes, ‘graphèmes ponctuotypographiques, qui contribuent à la production du sens, en tant qu’organisateurs de la séquentialité et indicateurs syntagmatiques et énonciatifs’; et les logogrammes ou ‘graphèmes correspondant à une unité significative’ (Anis 1998, 15). La classe des topogrammes correspond ainsi à une fonction, définie exclusivement par la relation entretenue entre les unités graphiques.8 c. Positionnement. Les deux perspectives, qui par ailleurs ne sont pas incompatibles (Swiggers/Van Hoecke 1991), se défendent, et ce n’est pas le lieu de juger du bienfondé de l’une ou de l’autre. Néanmoins, au vu de nos objectifs pratiques, il semble raisonnable d’opter pour un regard autonomiste. Il est vrai que d’un point de vue historique les pratiquants eux-mêmes considèrent les codes comme indépendants (Parkes 1992, 34), mais le plus important des arguments plaidant en faveur de cette approche est d’ordre épistémologique. Bien qu’encore au stade de «proto-science», la linguistique doit néanmoins avoir pour objectif de devenir un jour une science à proprement parler, et donc d’employer des méthodes appropriées. La falsifiabilité d’une théorie par les données de l’expérience doit être un impératif. La «méthodologie falsificationniste», due à Karl Popper (cf. Barreau 2002, 47), est conçue comme une alternative à une inexistante logique inductive. La condition nécessaire à la validité de toute science empirique est que le modèle doit pouvoir être partiellement ou totalement remis en cause lorsqu’il est confronté à des données qui ne s’y conforment pas. Or, nous ne savons rien – et nous ne saurons probablement jamais grand-chose – sur l’intonation médiévale. C’est pourquoi l’attitude glossographique ne pourrait dépasser dans ce cadre l’étape de la spéculation: pas de donnée, pas de théorie. Dans l’éventualité où la ponctuation renseignerait sur cette intonation, cette dernière serait le point d’arrivée de la démarche, pas son point de départ. La relation entre la ponctuation du treizième siècle et l’intonation de la même époque ne doit pas être envisagée, non que cette relation soit invraisemblable, mais il est impossible d’évaluer la validité d’une éventuelle reconstruction.
8
Voir cependant la critique que Roy Harris formule à ce sujet (→2.2.3).
23
langue écrite @langue @à médium spatial F IG . 2.2 – Concept de langue écrite
2.1.2.3
Vers une définition de la langue écrite
Joignant ces deux prises de position, nous sommes amené à dire que toute langue écrite est à considérer comme une langue à part entière (autonomisme). Pour que la définition soit néanmoins opératoire, il faut trouver ce qui fait la spécificité de la langue écrite par rapport à la langue: quel caractère spécifique pourrait servir à les distinguer? Choisir ce(s) caractère(s) revient donc à définir la langue écrite par rapport à la langue; au linguiste de le(s) choisir dans l’ensemble des propriétés de l’objet écriture. On conçoit que ce choix n’est pas simple et qu’il mobilise à nouveau des représentations sur la langue. Décider que le caractère à retenir est @durable revient à exclure tout ce qui serait écrit à la surface de l’eau (Harris 1995, 45s.) et à inclure dans le concept les supports enregistrés comme le disque ou les fichiers informatiques audios (Catach 1988a, 244). Décider que ce caractère est @visuel revient à exclure le braille (lorsqu’il est lu par un aveugle), etc. (Catach 1988a, 244, Harris 1995, 38s.). Il y a lieu de choisir la propriété la plus générale qui définisse l’écriture par rapport à ce qui lui ressemble le plus: tous les moyens de communication linguistique. On ne s’étonnera nullement de la nature sémiotique de ce caractère si l’on veut bien considérer le rapport d’inclusion qui fait de la linguistique un sous-domaine de la sémiotique. Une solution qui nous paraît satisfaisante est ainsi proposée en sémiotique par Roy Harris (1995, 45): «[. . .] the underlying substratum9 of writing is not visual, but spatial.»
Soulignons que c’est une propriété matérielle de l’écriture qui est prise en compte. Le choix est légitime, parce que la spatialité est impliquée dans la formation – mise en forme au sens de la linguistique structurale – du signifiant (Saussure 1967, 155s., 163s., etc. Hjelmslev 1968, 68, 70–71, 74, etc.). La substance étant la partie de la matière qui est mobilisée par la forme linguistique, le phonéticien peut tout négliger de la matière phonique, sauf la substance. Pareillement, il est du ressort du linguiste de prendre en considération la substance spatiale lorsqu’il s’occupe de la langue écrite. Au bout du compte, nous aboutissons au modèle conceptuel schématisé par la figure 2.2, qui correspond au concept généré par un (notre) regard linguistique structuraliste et autonomiste sur l’écriture.
2.2
Classement et nomination des unités de la langue écrite
Cette section sera consacrée à la taxinomie des unités de la langue écrite. Une fois abordés quelques préalables méthodologiques (→2.2.0), nous proposerons une dési9
L’acception du terme substratum nous paraît ici métaphorique; plus rigoureusement, on emploiera les termes matière et substance.
24
gnation générale des unités de la langue écrite et nous poserons une première dichotomie (→2.2.1). Nous distinguerons les unités qui organisent l’espace graphique de celles qui sont précisément l’objet de cette organisation. Sur la base du critère fonctionnel de la double articulation, nous scinderons ces deux types d’unités en classes subordonnées (→2.2.2). Le critère spatial (→2.2.3) ainsi que le problème de la paraphrasabilité des unités – certaines unités peuvent en remplacer d’autres – (→2.2.4) mènera à poser de nouvelles distinctions. Nous synthétiserons ensuite notre réflexion (→2.2.5). 2.2.0
Préalables
Avant de commencer à classer les unités de la langue écrite, nous définirons la démarche de classement adoptée (→2.2.0.1). D’autre part, le recours aux transcriptions en guise d’exemples sera parfois inévitable, d’où la nécessité de soulever le problème que pose la relation entre la démarche pratique de transcription et la démarche théorique de classification (→2.2.0.2). 2.2.0.1
Orientation de la démarche de classement
Le modèle conceptuel de la langue écrite étant posé, nous avons à notre disposition le cadre nécessaire à la définition des unités de la langue écrite. Voyons à présent ce qu’impose l’empirisme de notre approche. Il y a, nous semble-t-il, deux manières de procéder: 1/ soit on essaye, d’un point de vue théorique, de prendre en compte toutes les unités de toutes les langues écrites (c’est-à-dire tous les objets qui peuvent être considérés comme des instances du concept langue écrite tel que nous venons de le définir), de manière à ébaucher une théorie générale du langage écrit, pour ensuite dégager les principes qui nous serviront pour notre question; 2/ soit on part des données qu’offre une de ces instances et on essaye de raisonner à partir de celles-là pour construire une terminologie jugée suffisante à son seul égard, quitte à avouer explicitement son caractère provisoire face à une théorie plus générale de la langue écrite. Notre approche implique la seconde solution. Une raison supplémentaire qui nous incite à conserver ce choix est notre incompétence face au domaine vaste et compliqué des écritures dans leur multiplicité, qui nous mènerait bien loin de notre objectif de description de la ponctuation des chartes. Néanmoins, nous pensons que se focaliser sur cette seule langue écrite peut déjà mener à un classement fin des unités du langage écrit. 2.2.0.2
L’activité pratique de transcription
Dans la démarche de taxinomie, il s’agira de classer tout d’abord des formes d’expressions, c’est-à-dire des signifiants. Ne sachant pas exactement ce que signifient les signes que nous classons, puisqu’il s’agit du but ultime de notre démarche, nous ne pouvons approfondir le classement des unités en fonction de leur valeur10 au delà de l’opposition significatif/distinctif (double articulation, →2.2.2). Procéder en cherchant 10 Terme qu’on préférera à contenu, qui a l’inconvénient d’évoquer une valeur d’ordre séman-
tique.
25
F IG . 2.3 – Exemple de réalisation (Document 1272–07–08, 1)
à retrouver des conceptions actuelles dans les pratiques anciennes fausserait l’analyse (Boutier 2001, 431). Cette description de la forme doit précéder celle de la substance pour deux raisons: 1/ la substance n’est intéressante que parce qu’elle sert à la construction de la forme; 2/ la forme nous est intuitivement accessible parce que, dans notre corpus, nous comprenons en grande partie le message véhiculé, sa pertinence. Voilà une démarche qui implique inévitablement le danger de catégoriser a priori – et parfois de se tromper devant une écriture inconnue. Il importe donc de ne jamais oublier que l’on raisonne sur des représentations, qui, en tant que telles, peuvent être revues en fonction de remises en question théoriques. Prenons par exemple la réalisation visible dans la figure 2.3. Pour être utilisable, cette réalité a dû être transcrite, c’est-à-dire réduite à une représentation de sa forme. Cette réduction se fonde sur un principe de ressemblance: il y a dans les documents des réalisations graphiques qui se ressemblent et que nous pouvons considérer comme étant identiques, parce que leur tracé est similaire (ressemblance sur le plan de l’expression), et parfois parce qu’elles ont clairement la même valeur. Dans le premier cas, le plus fréquent face à un matériau inconnu, la transcription est impressionniste. Ainsi, on transcrira l’image donnée ci-dessus11 : «a tous cheaus quí ces preſens letres veront · nos li homme de ciſe deu [. . .]»
Si l’on peut rapidement – par simple commutation avec teus, par exemple – prouver que ‹o›12 est bel et bien une forme d’expression exprimant une valeur, en l’occurrence distinctive (→2.2.2.1), l’écriture médiévale comporte par contre des ‹í› qu’on identifie comme tels avec un œil moderne, mais dont on ne peut évaluer la pertinence: l’alternance entre la présence ou non de l’accent pourrait tout à fait être libre dans l’ensemble de la langue écrite que nous analysons, ou simplement dans un idiolecte particulier. Par ailleurs, nous avons transcrit ‹·› au milieu de la ligne; de même, on aurait transcrit les puncti qu’on retrouve dans la photographie 2.3 ci-dessus et dans la figure 2.4 au milieu de la ligne, sans aucune distinction. Avant d’avoir étudié le phénomène en détail, il n’est pas possible d’affirmer avec certitude que l’on a bien affaire à plusieurs occurrences d’une même unité. On voit donc qu’à côté de transcriptions ne faisant pas 11 Les exemples cités dans ce chapitre sont des transcriptions diplomatiques qui conservent les
faits suivants: accents; oppositions entre ‹s› et ‹ſ›, ‹ı› et ‹j› ainsi que ‹u› et ‹v›; ponctuation; opposition entre l’espace et la petite espace ‹˘› Les «lettres» plus grasses ou plus grandes que les autres sont transcrites en gras. Les chevrons entourent les portions de texte ayant dû être restituées parce qu’elles étaient endommagées, les crochets marquent les portions volontairement grattées et les demi crochets signalent que le texte a été ajouté au-dessus de la ligne. Pour être rédigées de manière rigoureuse, ces conventions nécessiteraient normalement que soient définies les principales unités à transcrire. On voudra bien nous pardonner cette inévitable circularité. Voir la section Transcriptions des annexes pour une tentative allant dans ce sens. 12 Nous transcrivons les unités graphiques entre chevrons. ˘
26
F IG . 2.4 – Exemples de puncti (Document 1272–07–08, 2)
F IG . 2.5 – Exemple d’accent décalé (Document 1277–02–03, 27)
l’ombre d’un doute, certaines sont de l’ordre du pari: il se peut qu’on conserve dans notre transcription des variantes libres, in-signifiantes d’un point de vue linguistique, ou, ce qui est certainement plus grave, qu’on passe sous silence des oppositions pertinentes. Il peut également arriver que l’opposition soit fonctionnellement présente, mais que nous ne puissions en comprendre la valeur.13 Tout cela est inévitable. Enfin, les cas de télescopages (jugés) accidentels d’unités sont formalisés de la même manière: ainsi, un accent détaché du ‹ı› au-dessus duquel il devrait être est transcrit au-dessus de ce dernier, même s’il se trouve en réalité au-dessus d’un ‹r› situé plus à droite, comme dans la figure 2.5: ‹notaíre›. Cependant, pour risqué qu’il soit, ce pari est pleinement justifié par le fait que nous cherchons quelque chose, mais que nous ne savons pas ce que nous allons trouver. Nous ne savons pas s’il y a des rai’ sons valables pour opposer les deux signes ‹·› et ‹·/›, mais l’opposition est maintenue au cas où ces raisons existeraient; en outre, la fréquence et la constance d’une alternance de ce type donnent déjà à penser qu’il est utile de procéder ainsi. Le système terminologique devrait idéalement permettre de tenir compte de la différence entre matière, substance, forme et représentation. Néanmoins, pour des raisons pratiques, nous ferons comme si nous avions devant nous des formes et nous hiérarchiserons les différents types rencontrés pour aboutir au tableau hiérarchique (→2.2.5). 2.2.1
Unité de base et première dichotomie
Tirons parti immédiatement du fait que la langue écrite ait un médium de nature spatiale pour poser une première dichotomie. Ayant admis dans un premier temps que nous n’avons transcrit que des formes d’expression qui expriment une valeur, nous ’ pouvons, par commodité, transcrire ces formes entre petits chevrons (p. ex.: ‹i›, ou ‹·›). Considérons l’ensemble des unités d’une langue pourvues d’une forme d’expression. Ces unités linguistiques, en vertu de la double articulation, peuvent être minimales ou non. Les unités de la langue écrite qui pourront être considérées comme minimales d’une façon ou d’une autre, seront nommées scriptèmes (figure 2.6).14 ’
13 Voir en l’occurrence le «cas insoluble» de l’opposition de ‹ › et ‹ /› dans Document (1272–03), · ·
voir notre étude (Mazziotta à paraître). 14 Lat. scriptio ‘action d’écrire’, scriptura ‘écriture’; terme qui remplace ici le graphème de
certaines théories prenant en compte la «mise en page» (→2.3.2.2).
27
scriptème @unité linguistique minimale @à médium spatial F IG . 2.6 – Concept de scriptème scriptème @minimal @spatial grammème @non organisateur spatial
topème @organisateur spatial
F IG . 2.7 – Types de scriptèmes
Par commutation, on isole assez facilement des unités discrètes véhiculant le sens, jusqu’à aboutir à des segments minimaux: «conute choſe ſoit a chaſcon et a tos ke [. . .]» (Document 1280–05–04, 2).
Par ailleurs, nous pouvons constater que la manière dont s’organisent les unités constitue également un véhicule de sens. Observons à nouveau la réalisation présentée en figure 2.3, p. 26. On voit clairement que le texte se présente sous la forme d’une suite de blocs espacés: il y a une espace plus large entre ‹cheaus› et ‹quí› qu’entre le ‹c› et le ‹h› du premier de ces blocs. De plus, ces derniers sont positionnés les uns par rapport aux autres de manière à ce que leur ordre soit significatif. Nous distinguons de la sorte deux types d’unités significatives en fonction de leur forme d’expression. Nous proposons de nommer topèmes les unités non discrètes qui structurent et organisent l’espace.15 Dans ce cadre, nous définissons donc le topème positivement, comme un scriptème organisant l’espace graphique, le distinguant des unités qui ne sont pas des topèmes, que nous nommerons grammèmes.16 D’un point de vue perceptuel, les occurrences de grammèmes sont en effet organisées les unes par rapport aux autres: elles peuvent se suivre de haut en bas, de gauche à droite, etc., elles peuvent être espacées les unes des autres, ou au contraire se superposer. Le terme topème recouvre ainsi l’ensemble des procédés de disposition relative des grammèmes. Un scriptème sera donc soit un grammème, soit un topème (figure 2.7). On peut dès à présent faire remarquer que le couple organiseur/organisé entretient une relation de présupposition mutuelle – interdépendance sur le plan syntagmatique, ou solidarité, disait Louis Hjelmslev (1968, 51–52). Dès lors qu’il est question d’occurrence de scriptèmes, tout agencement de grammèmes est un topème17 , et tout grammème est forcément positionné par rapport aux autres, nature spatiale de la substance oblige. 15 Gr. tìpo ‘lieu, endroit’.
La notion de topème convient également pour désigner l’organisation particulière de la page imprimée, qu’on nomme habituellement mise en page. 16 Le terme est proposé par Swiggers/Van Hoecke (1991). 17 Nous reviendrons ci-dessous (→2.2.2.2) sur les difficultés pratiques que pose cette définition.
28
grammème @non organisateur spatial plérégramme @significatif
cénégramme @distinctif
F IG . 2.8 – Types de grammèmes: critère fonctionnel
2.2.2
Critère fonctionnel de double articulation
Cette première distinction posée, nous pouvons à présent nous servir de la double articulation, qui caractérise toute langue, pour distinguer plusieurs types de grammèmes et plusieurs types de topèmes. 2.2.2.1
Types de grammèmes
Les grammèmes peuvent être divisés en deux groupes distincts. En observant la chaîne page 28, nous constatons que toutes les unités ne sont pas similaires: les unités minimales qui véhiculent le sens se différencient de celles qui n’ont de valeur que distinctive – principe de la double articulation. Ainsi, même sans faire référence à l’oral, ‹conute› se découpe en trois unités significatives (cp. ‹conurent›, ‹conut›, etc.): ‹con› (sens lexical) + ‹u› (catégories verbales18 ) + ‹t› (catégories verbales) + ‹e› (genre). Par contre, ‹conu› est formé de quatre unités exclusivement distinctives. Nous dirons donc, suivant ici Nina Catach,19 que ‹conu› est plérémique et qu’il est constitué de quatre unités cénémiques.20 . En tant que scriptème non organisateur, minimal au point de la signification, ‹conu› est un plérégramme constitué de scriptèmes non organisateurs également, mais limités à une valeur distinctive: des cénégrammes. On peut regrouper cet ensemble sous l’hyperonyme grammèmes (figure 2.8). À ce stade, la relation d’hypo-hyperonymie entre grammème et les co-hyponymes plérégramme et cénégramme implique que le grammème ne soit pas forcément minimal sur tous les niveaux d’articulation à la fois: il sera plérégramme ou cénégramme suivant qu’il est minimal au point de vue de la première ou de la seconde articulation. Dans ‹conute›, ‹conu› comme ‹c› sont des grammèmes, le premier un plérégramme, le second un cénégramme; de même, ‹e› y est un plérégramme composé d’un seul cénégramme ‹e›.
18 Nous passons ici sur les difficultés de l’analyse morphématique et nous permettons quelque
imprécision. 19 Qui reprend (cf. Catach 1979, 22) le terme de Haas (1976), lequel s’inspirait directement de
Hjelmslev. Voir cependant la note 20 ci-dessous. pl rh ‘plein, rempli’, gr. kenì ‘vide’, gr. grmma ‘caractère, d’écriture’ Il nous semble cependant que la manière dont Nina Catach reprend le rapprochement de Haas n’est pas en accord total avec la terminologie de Hjelmslev, pour qui les plérématèmes sont des glossèmes du contenu et non de contenu, c’est-à-dire des unités linguistiques entièrement situées sur le plan du contenu, alors que l’adjectif plérémique de Nina Catach s’applique à des signes à part entière; voir Hjelmslev 1939, 143, Hjelmslev 1954, 48–49. Nous adoptons malgré tout le terme.
20 Gr.
29
topème @organisateur spatial plérétope @significatif
cénétope @distinctif
F IG . 2.9 – Types de topèmes: critère fonctionnel
2.2.2.2
Types de topèmes
Quelle que soit la sorte de valeur qu’on peut y voir, les grammèmes sont organisés par les topèmes. En poussant le concept de topème à ses limites, on peut considérer que les groupements de plérégrammes ainsi que les groupements de cénégrammes sont construits à l’aide de topèmes. Ainsi, la figure 2.3 montre des séparations entre plérégrammes concaténés, eux-mêmes formés de cénégrammes qui s’enchaînent. Les topèmes ont donc un rôle à jouer aux deux niveaux de la langue écrite – ce qui est une conséquence directe de l’interdépendance entre grammèmes et topèmes: tout grammème actualisé, même cénémique, présuppose un topème. Néanmoins, il y a une différence fondamentale entre ce qu’on voudra bien dès lors considérer comme deux types de topèmes: les topèmes qui organisent les plérégrammes sont susceptibles de comporter un surcroît de sens – on les nommera donc plérétopes –, alors que ceux qui organisent les cénégrammes sont de simples formes distinctives, que nous nommerons cénétopes (figure 2.9). Dans l’exemple de la page 28, il y a un plérétope qui organise ‹conute› par rapport aux mots qui l’entourent, de même que les unités qui le composent (cénégrammes) sont organisées par des cénétopes. 2.2.3
Critère spatial
Prendre en compte le caractère @spatial repose la question de l’autonomie au niveau des plérégrammes et invite à déterminer sur quel axe les unités discrètes sont construites et combinées. La démarche permet par ailleurs de se passer complètement de l’oralité, évitant l’écueil dénoncé par Roy Harris: «Du côté des ‹autonomistes›, le problème est plus grave, parce que, s’ils posent comme postulat l’indépendance sémiologique de l’écriture, dans la pratique, ils sont bien embarrassés pour commencer ailleurs que par une correspondance déjà établie entre telle langue parlée et tel système d’écriture. Les prétendues analyses ‹autonomes› commencent toujours par considérer les structures graphémiques par rapport à une fonction phonographique ou logographique qui est sous-entendue. On se demande si ce n’est pas refuser la primauté de la parole en tant que doctrine théorique, quitte à la réinstaller comme présupposé méthodologique.» (1993, 364).
2.2.3.1
Autonomie des plérégrammes
La question de l’autonomie posée au niveau des plérégrammes nous invite à affiner le classement de ceux-ci. Examinons la substance des plérégrammes de la figure 2.10. Les chaînes sont composées de cénégrammes, dont le premier est plus imposant que les autres. Ce cénégramme est considéré comme une littera notabilior (Parkes 1992, 30
F IG . 2.10 – Exemple de 1282–02–01, 2)
cénégramme
«marqué»
(Document
plérégramme @significatif hétérogramme @dépendant
autogramme @autonome
F IG . 2.11 – Types de plérégrammes: critère d’autonomie
305) par les médiévaux: il porte une marque qui permet à l’œil de le distinguer des autres cénégrammes. Il peut donc être dit marqué; il y a entre la substance de ce cénégramme et celle du ‹c› qui suit une différence qui n’est pas d’ordre segmental, mais qui nécessite des unités de ce type pour se manifester. Ce rapport de dépendance est similaire à celui qu’entretiennent les topèmes et les grammèmes. Néanmoins, puisque les grammèmes se définissent par le fait qu’ils n’organisent pas l’espace, ces marques supplémentaires sont une sorte de grammème. La question de la valeur de ces grammèmes non autonomes que constituent ces marques est particulièrement complexe. Dans certains cas, ces marques semblent clairement correspondre à une segmentation du texte en phrases: dans l’exemple qui suit, ‹conute› commence une nouvelle phrase21 (les grammèmes marqués sont transcrits en gras): «·· a toſ ceas ki ceſ preſens lettres veront et ouront · li homeſ delle chieſe deu font conoi [2] ſtre veriteit · conute choſe ſoit a chaſcon et a tos ken lan de graſce · m · cc · ſeitante et onc [. . .] vienrent par˘deuant nos entre saínte [4] marie et sain lamber a liege · me dame kathelíne [. . .] dune part · et ſi troiſ enfans [. . .] dautre part deſour dítte» (Document 1271–07–25, 1). ˘
Nous pouvons estimer que la valeur de la marque est significative: le grammème est donc plérémique. Il pourrait arriver que la présence de la marque soit non significative, voire non distinctive, ce dont on ne peut préjuger. Dans ce second cas, il s’agirait d’un problème que génère notre transcription a priori des matériaux étudiés (comme discuté sous →2.2.0.2): nous aurions maintenu un caractère pour rien, eu égard à la forme d’expression. Par contre, dans le premier cas, il faudrait considérer que la marque est d’un niveau d’articulation (v. supra) supérieur au cénégramme et que c’est l’ensemble formé par cette marque et d’autres unités de même niveau d’articulation qui construit un cénégramme distinct. Dans ce cas, la question de la marque se pose au niveau de la construction du cénégramme (→2.2.3.2). Pour ces raisons, nous nous dispensons d’affiner la hiérarchie des cénégrammes, approfondissant uniquement celle des plérégrammes (figure 2.11).
21 Nous définissons ce terme, qui est loin de trouver une acception qui convienne à tous, dans
la section →3.4.1.2 du chapitre où nous décrivons notre modèle linguistique.
31
F IG . 2.12 – Exemple de ‹t› (Document 1282–02–01, 2)
2.2.3.2
Axes de construction et de combinaison des grammèmes
Le problème de la construction des grammèmes pose en premier lieu la question fondamentale de la limite du cénégramme: qu’est-ce qui empêche de considérer que la substance soulignée dans la figure 2.12 ne puisse être analysée en une composition de ‹ı› et de ‹¯›, puisqu’on retrouve ces composants par ailleurs? Qu’est-ce qui nous permet de dire que la transcription ‹t› est acceptable et que ‹t› n’apporterait rien de plus? Comparons les plérégrammes (autogrammes): ‹et› et ‹z–›.22 L’observation de la distribution des occurrences de ces deux signes révèle qu’ils sont équivalents du point de vue du sens: on trouve indifféremment l’un ou l’autre dans des positions tout à fait similaires; par exemple dans la formule _À tous présents et à venir_.23 Sur le plan de l’expression, ‹et› est constitué de plusieurs cénégrammes concaténés, alors que la même analyse ne pourrait être faite de ‹z–›: soit ce dernier est indécomposable, soit, si l’on devait considérer qu’il est constitué de cénégrammes.24 , on y décèlerait ‹z› et ‹–› Dans le cas de ‹et›, l’axe sur lequel s’organisent les cénégrammes pour former les plérégrammes est le même que celui sur lequel s’enchaînent ces plérégrammes, mais pas dans le cas de ‹z–›. Cela devient particulièrement clair quand ces plérégammes sont observés en contexte: present et avenir. . . vs present z– avenir. . .
Si nous estimions que ‹e› ou ‹t› sont également décomposables, nous constaterions que le discernement de leurs formants est impossible sans opérer le même changement d’axe. Le cénégramme se laisse donc définir par le caractère @indécomposable sur le même axe que celui sur lequel sont formés les plérégrammes.25 Rationalisons la notion d’axe en tirant parti du concept de topème. Dans les faits, les topèmes sont des unités difficiles à dénombrer, mais la proximité relative des gram22 Le second grammème est l’une des abréviations usuelles qu’on trouve pour et dans les ma-
nuscrits médiévaux. 23 Formule d’adresse fréquente. L’adresse est la partie de la charte qui exprime le destinataire
du message de l’acte écrit (Guyotjeannin et al. 1993, 75). En l’occurrence, toute personne amenée à lire le document. 24 En se fondant, par exemple, sur l’argument matériel du ductus: le signe est tracé en plusieurs étapes. 25 Sans vouloir entrer dans un débat dont la complexité dépasse le cadre de notre étude autant que celui de nos compétences, il nous semble que la définition reste valable pour analyser les écritures dites «idéographiques» (égyptien, chinois), où les plérégrammes sont organisés en chaînes, et construits suivant un autre principe (le chinois inscrit ses plérégrammes dans un carré avant de les enchaîner). Il y a de la même façon un moment de rupture situé entre la construction et la combinaison des grammèmes. Les écritures dites «idéographiques» construisent les plérégrammes sur un axe différent de celui de leur combinaison; les écritures dites «alphabétiques» construisent les cénégrammes sur un axe différent de celui de leur combinaison. La présence d’un axe constant sur lequel s’organisent les plérégrammes est une condition sine qua non à une syntagmatique de type linguistique.
32
mèmes peut être, du point de vue de la substance, purement et simplement mesurée: certains grammèmes sont plus proches les uns des autres et constituent des blocs plus ou moins distants d’autres blocs formés de la même façon (voir p. 28). Pour commencer, on peut faire l’économie de la description des relations entre les unités qui appartiennent à des blocs différents: elles peuvent être décrites de manière médiate, dans la mesure où les relations entre les différentes unités de ces groupements et les relations entre ces derniers sont définies de manière satisfaisante. Les topèmes organisent et orientent la chaîne, où chaque unité peut être simplement définie par son rang dans la succession des autres unités du même ordre sur cet axe. D’un point de vue pratique, la description est satisfaisante si l’on se limite à définir la position d’une unité par rapport à celle qui la précède et celle qui la suit directement. On peut dire qu’il y a rupture de l’axe à partir du niveau où la position relative des grammèmes ne peut plus être décrite de la sorte, mais où il faut admettre que leur configuration ne se laisse appréhender que dans son ensemble. Ainsi, pour ‹et›, le topème se laisse définir comme une concaténation relative: ‹e› est suivi de ‹t›; par contre, si ‹z–› est vu comme une composition de ‹z› et ‹–›, ces deux unités ne sont pas simplement enchaînées. Ceci appelle deux conclusions: (a) il convient de distinguer deux types de plérégrammes et deux types de cénégrammes sur base de ce critère; (b) une fois l’axe de construction déterminé, tout changement d’axe implique une rupture et il n’y a plus lieu de parler des mêmes unités. a. Deux types de pléré/cénégrammes. Les plérégrammes du type ‹et› doivent ainsi être distingués des plérégrammes comme ‹z–›. Les premiers sont formés de cénégrammes ordonnés sur un seul axe de combinaison, lequel correspond à celui sur lequel se combinent à leur tour les plérégrammes; nous nommerons caténogrammes26 ces autogrammes dont les cénégrammes constitutifs sont alignés sur un axe par des topèmes «orientés». Les seconds, quoique s’alignant sur un axe unique, sont formés de cénégrammes qui ne sont pas organisés suivant un axe particulier; nous les nommerons nébulogrammes.27 Cela nous permet de proposer la représentation de la figure 2.13. En ce qui concerne les cénégrammes, nous distinguerons, d’une part, ceux qui se combinent sur un seul axe, comme ‹e› ou ‹a›, pour construire les plérégrammes et d’autre part, les cénégrammes qui, comme le trait dans l’abréviation de et, ne sont pas combinés suivant un unique axe, mais prennent une configuration qui ne peut être prévue sans connaître l’unité formée. Nous nommons les premiers linéogrammes,28 les seconds périgrammes.29 Cette représentation doit être considérée comme provisoire: nous verrons (→2.2.4.2) que les faits sont en réalité plus complexes (figure 2.14). b. La rupture comme indice de changement de niveau. Revenons à la question qui a engendré notre discussion: pourquoi ne pas diviser ‹e› ou tout autre linéogramme 26 Lat. catena ‘chaîne’. 27 Lat. nebula ‘brouillard’.
Cette analyse reste valable dans le cas d’«accidents»: en japonais, le kanji signifiant ‘deux’ a beau être composé de deux traits superposés, alignés exactement sur le même axe que celui dans lequel s’enchaînent les plérégrammes, il reste un nébulogramme, parce qu’il commute avec des unités qui sont sans conteste des nébulogrammes (comme le kanji pour ‘dix’). 28 Lat. linea ‘ligne’. 29 Gr. per ‘autour de’.
33
plérégramme @significatif hétérogramme @dépendant
autogramme @autonome
caténogramme @topèmes de construction orientée
nébulogramme @topèmes de construction non orientée
F IG . 2.13 – Types de plérégrammes: axe de construction cénégramme @distinctif linéogramme @axe de combinaison unique
périgramme @axe de combinaison multiple
F IG . 2.14 – Types de cénégrammes: axe de construction (provisoire)
en plus petits cénégrammes? Rien n’empêche de le faire. Cependant, dès lors qu’on change d’axe de combinaison/construction, on n’a plus affaire aux mêmes unités: il y a entre ‹c› et ‹e› une différence qu’on pourrait isoler, par commutation, dans la boucle ajoutée pour former ‹e› à partir de ‹c›, mais cette valeur distinctive ne sert pas à distinguer deux unités dont la valeur est significative. Contrairement aux modèles phonétiques articulatoires,30 permettant de distinguer des traits non discrets dans les sons, il est possible de diviser les cénégrammes en unités discrètes plus petites, ce qui fonde toute la légitimité de la question. Cela signifierait donc que la langue écrite serait au moins triplement articulée. . . Pour considérer un objet au potentiel expressif infini et dont les signes sont arbitraires comme une langue, le regard du linguiste tel que nous l’avons défini a besoin de trouver deux articulations, mais peut ignorer les niveaux d’articulation supérieurs (subordonnés) au deuxième. Cette prise de position est ainsi appliquée au problème évoqué ci-dessus au sujet des hétérogrammes: si l’hétérogramme a une valeur distinctive entre deux cénégrammes, il n’est pas plus nécessaire pour nous de l’analyser que de considérer comme une unité la boucle ajoutée à ‹c› pour construire ‹e›. 2.2.4
Paraphrasabilité et plurisystème
La paraphrasabilité se définit comme la capacité, pour une unité, à être exprimée par une unité différente. Abordons successivement ce caractère (→2.2.4.1) et les implications qu’il a sur le système de la langue écrite (→2.2.4.2).
30 À nouveau, la comparaison avec la phonétique est ici purement didactique et n’implique
aucune corrélation entre l’oral et l’écrit.
34
2.2.4.1
Paraphrasabilité
Nous avons mentionné ci-dessus le problème des axes de construction/combinaison des grammèmes (→2.2.3.2), opposant le caténogramme ‹et› au nébulogramme ‹z–›, mais spécifiant qu’ils étaient sémantiquement équivalents. En d’autres termes, il est possible de paraphraser le plérégramme ‹et› par ‹z–› et vice-versa.31 Il est par ailleurs remarquable que cette équivalence concerne également le plan syntaxique: gloser une unité par une autre ne perturbe pas les relations entre les constituants. Ce caractère de @paraphrasabilité par des unités d’un autre ordre semble commun aux deux types d’autogrammes; et bien que certains mots ne puissent être abrégés par un signe spécial, cette potentialité n’est jamais exclue (c’est le cas des notes tironiennes, par exemple). De plus, le caractère peut s’appliquer également aux cénégrammes, puisque certains périgrammes sont paraphrasables en un ou plusieurs linéogrammes (c’est le cas du tilde abréviatif). Il faut cependant remarquer: (a) que le nombre de scriptèmes n’est pas pour autant constant, de même que le nombre de plérégrammes; (b) que certains nébulogrammes résistent à la conversion. a. Altération du nombre de scriptèmes. Entre ‹et› et ‹z–›, le nombre de morphèmes est constant, de même que le nombre de plérégrammes. Qu’on examine à présent l’abréviation ‹9›, qu’on paraphrase par ‹con›, ‹com›, qui peuvent avoir la valeur de c’on suivant le contexte. Dans ce cas, la paraphrase comporte deux caténogrammes: ‹c› (pronom relatif) et ‹on› (pronom personnel): la paraphrase résout l’amalgame que présentait ‹9›, où il n’était pas possible de discerner deux formes d’expression correspondant à ces deux contenus. Ces considérations, qu’il ne faut pas perdre de vue, n’invalident en rien l’emploi du caractère de paraphrasabilité. b. Nébulogrammes non paraphrasables. Il convient en outre de distinguer les nébulogrammes qui sont paraphrasables de ceux qui ne le sont pas. Ainsi, dans «se il raportoient sor leur seremens ke om nos fesist tort ·/ leueskes nos doit aidier ·» (Document 1242–05–02, 13).
le nébulogramme ‹·/› ne pourrait pas être paraphrasé par un ou plusieurs caténogrammes sans au moins modifier la structure syntaxique de la phrase:32 *se il raportoient sor leur seremens ke om nos fesist tort alors leueskes nos doit aidier ·
En conséquence, on distinguera deux types de nébulogrammes: ceux qui sont paraphrasables, nous les nommerons logogrammes, ceux qui ne le seront pas prendront le nom de ponctogrammes (figure 2.15).
31 Pareillement, et avec les mêmes précautions que ci-dessus (note 25), il nous semble que le
critère est opérationnel pour les langues écrites dites «idéographiques», où les unités peuvent – Gelb (1973, 121) mentionne des syllabaires divers tirés des valeurs phonétiques des logogrammes pour le sumérien, l’égyptien, le chinois, etc. – être glosées par des nébulogrammes désémantisés, c’est-à-dire convertis en cénégrammes, par le principe du rébus. Ce point mériterait un approfondissement. 32 Le mot censé paraphraser le nébulogramme est souligné.
35
nébulogramme @axe de construction indéterminé logogramme @paraphrasable
ponctogramme @non paraphrasable
F IG . 2.15 – Types de nébulogrammes
F IG . 2.16 – Exemple d’abréviation 1271–12–03a, 11)
2.2.4.2
par
contraction
(Document
Abréviations et plurisystème
Le terme plurisystème, repris de Nina not. Catach (1988a, 248s.) doit ici être replacé dans une optique distributionnelle et dans le système de termes qui vient d’être présenté. Il est à nos yeux une conséquence directe du caractère de paraphrasabilité. L’équivalence entre ‹et› et ‹z–› ne correspond qu’à une petite partie des faits. Les unités significatives ne sont pas, tant s’en faut, toutes intégralement composées sur le même axe ou complètement «désaxées». En nous concentrant sur les problèmes posés par ce que les paléographes nomment abréviation (a), nous proposerons de nuancer le système que nous venons d’exposer (b). a. Traitement des abréviations. La langue écrite des chartes offre plusieurs exemples de mixité. Les phénomènes de ce genre, étudiés par les paléographes (voir p. ex. Stiennon 1991, 145s.) et dénommés abréviations par ces derniers, ont été classés empiriquement en cinq catégories: l’abréviation par contraction «consiste à prélever au sein d’un mot une ou plusieurs lettres, [et] s’accompagne d’habitude d’un signe d’abréviation placé au-dessus du mot»; l’abréviation par suspension «affecte la fin du mot, privé ainsi d’une ou plusieurs lettres et muni [le plus souvent] d’un point, point-virgule ou d’un autre signe qui marque l’arrêt»; l’abréviation par lettres suscrites «consiste à placer une lettre [souvent] de petit module comme exposant ou coiffe à une ou plusieurs lettres principales»; les signes spéciaux sont des «signes d’abréviation de valeur précise ou déterminée»; et enfin, les graphismes sont des «symboles représentant un mot» (Stiennon 1991, 145–147). Ces définitions pratiques nous permettent d’avoir une idée de ce qu’on peut rencontrer dans les chartes. Voyons à présent comment ces formulations peuvent être traduites en termes qui s’intègrent à notre système, partant à nouveau des faits observés. Par exemple, le premier mot de la figure 2.16 peut être paraphrasé par ‹cheualiers›. On voit clairement qu’une partie des grammèmes (‹c›, ‹h›, ‹e›, ‹u›, ‹a›, ‹l›, ‹s›) s’enchaînent sur le même axe, mais qu’un autre (‹∼›) vient se superposer à la construction. Si l’on applique notre classification de manière rigide, on ne peut que conclure que la réalisation que nous avons sous les yeux est un nébulogramme. Par ailleurs, le deuxième mot de la figure 2.17 peut être paraphrasé par ‹autre›, ce qui remet en question notre classement des cénégrammes: le ‹e› que nous y lisons
36
F IG . 2.17 – Exemple d’abréviation par lettre suscrite (Document 1236–07, 6)
logogramme @au moins partiellement paraphrasable par un ou plusieurs linéogrammes F IG . 2.18 – Concept de logogramme
est incontestablement une unité qui ressemble au premier ‹e› que l’on retrouve dans ‹cheualiers›, c’est-à-dire, selon les principes énoncés ci-dessus, un linéogramme (qui s’enchaîne sur un axe unique avec d’autres linéogrammes). Or, dans ‹aute ›, l’axe est rompu: nous avons affaire à un plérégramme de type nébulogramme. Il n’y a dès lors que deux solutions: 1/ soit considérer que ce ‹e› est une unité différente dans ‹aute › et dans ‹chevaliers›, et dans ce cas, notre classement reste valable; 2/ soit, ce qui rencontre une intuition, considérer qu’on a bien affaire à la même unité, et dans ce cas, le classement des cénégrammes est à revoir. Raisonnons par l’absurde. La seule différence entre les ‹e› des deux mots qui servent de bases à notre réflexion est leur position par rapport aux autres cénégrammes. Or, puisque les positions relatives des grammèmes sont également des unités, non discrètes, certes, mais conceptuellement isolables (unités que nous avons nommées topèmes), il n’est pas cohérent de voir en ‹e› et ‹e › deux unités minimales différentes. La première solution n’est pas valable: ‹e› en exposant est constitué du cénégramme ‹e› et du topème qui le met en exposant par rapport aux autres cénégrammes. Dans ces deux cas, subsiste le problème de la paraphrasabilité: les nébulogrammes ‹cheual˜s› et ‹aute › peuvent être paraphrasés, ce sont donc des logogrammes. . . mais si l’on y regarde de près, une partie seulement est paraphrasable. Or, cette partie n’est pas un plérégramme, mais elle entre dans la composition de l’un d’eux. Dans un cas, c’est la combinaison du topème et du cénégramme qui est intégralement paraphrasée. Ainsi, le tilde est complètement absent de ‹cheualiers›; dans l’autre cas, seul le topème est paraphrasé, puisque l’unité placée en exposant se retrouve dans la forme non abrégée. Ce même cas de paraphrasabilité partielle apparaît dans des formes comme ‹9uiers› mis pour ‹conuiers› ou ‹t7re› mis pour ‹terre›. Il faut donc distinguer les abréviations par graphisme des autres types d’abréviations: seul le graphisme est un logogramme «pur», puisque lui seul est intégralement paraphrasable. Les autres moyens d’abréger un mot se servent d’une combinaison de grammèmes caténogrammiques et nébulogrammiques pour former des unités qui ne sont ni tout à fait l’une ni tout à fait l’autre de ces catégories. b. Révision du système Tous ces problèmes énoncés, il faut donc au minimum revoir les caractères des logogrammes comme indiqué dans la figure 2.18.
37
2.2.5
Synthèse: hiérarchie des scriptèmes
On trouvera p. 39 l’arbre de hiérarchie de ces concepts, reprenant les caractères définitoires correspondants (voir les conventions exposées sous →1).
2.3
La ponctuation comme objet d’étude
L’analyse qui précède a permis d’établir un système cohérent, et, partant, de nommer exactement les unités dont nous voulons parler. C’est à l’intérieur de ce système que nous situons la ponctuation, que nous avons définie jusqu’à présent de manière intuitive. Nous exposerons les principales définitions qu’on a pu donner du terme et nous analyserons leur construction ainsi que leurs implications. Cela nous mènera à forger notre propre définition (→2.3.1). La valeur des signes fera l’objet de la seconde partie de cette section (→2.3.2). 2.3.1
Recherche d’une définition
Il est clair que «[l]es études qui s’attaquent de front à la question de la ponctuation sont en général à restituer dans des analyses qui abordent l’écrit d’une façon globale et s’intègrent à une approche théorique de la linguistique» (Jaffré 1991, 64). Néanmoins, nous n’entreprendrons pas ici un tour d’horizon du même type que ceux que proposent Jean-Pierre Jaffré (1991) et Jacques Anis (2004) et nous éviterons d’entrer dans les méandres de la littérature concernant toutes les tentatives de définition de la langue écrite. Nous donnerons tout d’abord un bref aperçu critique des définitions que les spécialistes ont pu donner de notre objet – la manière dont ils l’ont conceptualisé. Il ne s’agira pas pour nous de critiquer leur point de vue en disant qu’ils se trompent et qu’ils oublient tel ou tel signe, qu’ils donnent à la ponctuation un sens trop large ou trop restreint: il s’agira plutôt de critiquer leur méthode de définition. Avant de présenter (sans conclure par une définition qui lui serait propre), les essais de Nina Catach, Jacques Anis et Claude Tournier en la matière, Véronique Dahlet souligne toute la difficulté qu’il y a à vouloir délimiter clairement le concept de ponctuation: «Définir la ponctuation est un exercice retors et difficile puisque, comme on le verra à l’analyse, il s’agit tout à la fois de doter la ponctuation de son statut linguistique, de la démarquer du matériau alphabétique et enfin, d’indiquer le principe directeur de sa fonction.» (Dahlet 2003, 17).
Comment les chercheurs se sont-ils affranchis de ce programme? 2.3.1.1
Définitions existantes
a. Ludmilla Védénina. Au point de départ de toute démarche de définition de la ponctuation, il y a, croyons-nous, un ensemble d’unités reconnues intuitivement comme des «signes de ponctuation». Le «degré zéro» de la définition consiste à énumérer les 38
39
ponctogramme (2.2.4) @non paraphrasable
F IG . 2.19 – Types de scriptèmes (classement complet)
logogramme (2.2.4) @paraphrasable
cénétope (2.2.2.2) @organisateur de cénégrammes
topème (2.2.1) @organisateur spatial
plérétope (2.2.2.2) @organisateur de plérégrammes
périgramme (2.2.3.2) @axe de combinaison multiple
cénégramme (2.2.2.1) @distinctif
linéogramme (2.2.3.2) @axe de combinaison unique
nébulogramme (2.2.3.2) @topèmes de construction non orientée
autogramme (2.2.3.1) @indépendant @axe de combinaison unique
caténogramme (2.2.3.2) @topèmes de construction orientée
hétérogramme (2.2.3.1) @dépendant
plérégramme (2.2.2.1) @significatif
grammème (2.2.1) @non organisateur spatial
scriptème (2.2.1) @minimal @spatial
signes en question, ou à simplement les évoquer, comme le fait Ludmilla Védénina, dont les travaux ébauchent une définition en extension qui témoigne d’une vision large de la ponctuation (→2.3.2.2): «Par ponctuation, nous entendons non seulement les signes comme le point, la virgule, etc., mais également certains procédés typographiques comme l’emploi des caractères, l’espace blanc entre les signes, etc.» (Védénina 1989, 1).
La principale difficulté que pose cette approche est que, constituant un inventaire flou («etc.»), elle ne permet pas de sortir de l’intuition. b. Le ‹Bon usage›. Pour prétendre à la scientificité, la définition doit nécessairement être rédigée en intension, comme l’est déjà celle du Bon usage:33 «La ponctuation est l’ensemble des signes conventionnels servant à indiquer, dans l’écrit, des faits de la langue orale comme les pauses et l’intonation, ou à marquer certaines coupures et certains liens logiques.» (Grevisse/Goosse 2007, §116).
Dès qu’elle s’efforce de trouver ce qui fédère les unités réunies intuitivement, la définition manifeste un point de vue sur l’objet ponctuation, et, plus généralement, sur l’objet langue écrite. Il est donc prévisible qu’on retrouve des définitions de type phonographique et des définitions de type autonomiste (→2.1.2.2). La définition du Bon usage correspond tout à fait à la perspective phonographique, puisqu’elle considère que le trait définitoire de la ponctuation est d’être un transcodage. C’est cette fonction elle-même qui rassemble les différentes unités regroupées sous le terme. Néanmoins, la définition de Maurice Grevisse ne se limite pas à mettre en relation l’écriture et l’oralité: elle est complétée par l’évocation d’autres fonctions, sous une forme restant abstraite et intuitive. Cette tentative est représentative de l’attitude qui consiste à essayer de définir la langue écrite par le biais de la langue orale, puis à se rendre compte des limites de la démarche. c. Nina Catach. Prenant le parti de ne pas immédiatement réduire la ponctuation à un transcodage, Nina Catach forme la proposition suivante: «Ensemble des signes visuels d’organisation et de représentation accompagnant le texte écrit, intérieurs au texte et communs au manuscrit et à l’imprimé; la ponctuation comprend plusieurs classes de signes graphiques discrets et formant système, complétant ou suppléant l’information alphabétique.» (Catach 1980, 21, repris textuellement dans Catach 1996, 9).
Ici, la définition se détache de la fonction des signes pour rendre compte de leur distribution et de la relation qu’ils entretiennent avec les autres unités de la langue écrite. Elle reste cependant floue («plusieurs») et centrée sur les modes d’écriture traditionnellement dits «alphabétiques». Bien qu’insuffisante pour permettre de répondre à la question «Ceci est-il un signe de ponctuation?», face à un signe choisi au hasard dans n’importe quelle langue écrite, la tentative se rapproche de notre perspective autonomiste. Néanmoins, l’abandon de l’idée de transcodage n’est qu’apparente: la définition est complétée dans l’exposé de l’auteur, qui ajoute: 33 Tout comme celles de la plupart des grammaires et dictionnaires l’ayant précédé. Voir l’in-
ventaire constitué par Claude Tournier (1980, 31–33).
40
«Nous parlerons, pour être clairs [sic], d’intonèmes à l’oral et de ponctèmes pour les signes écrits.» (Catach 1996, 105).
mais aussi: «Il s’agit d’unités fondamentalement suprasegmentales et syntaxiques.» (Catach 1996, 105).
La perspective relève dès lors du phonocentrisme et mène Nina Catach à confondre les propriétés distributionnelles de la ponctuation et celles de l’intonation sur la base d’une ressemblance fonctionnelle. Il nous paraît difficilement défendable qu’un fait de ponctuation puisse être reconnu comme suprasegmental.34 d. Jacques Anis. Soucieux de doter la perspective autonomiste (→2.1.2.2) d’un ensemble de concepts organisés en système, Jacques Anis abandonne le concept de ponctuation au profit d’une opposition entre trois types d’unités, regroupées sous l’hyperonyme graphème ‘unité minimale de la forme graphique, définie par sa fonction dans la communication écrite’ (Anis et al. 1988, 245): les alphagrammes, les logogrammes et les topogrammes, définis comme suit: «alphagramme: graphème alphabétique, unité purement distinctive. logogramme: graphème unique correspondant à une unité significative (ex. &, $) ou groupement tendant à un fonctionnement synthétique (sigles, logos). topogramme: graphème ponctuo-typographique, qui contribue à la production du sens, en tant qu’organisateur de la séquentialité et indicateur syntagmatique et énonciatif.» (Anis et al. 1988, 245–246).
Nous ne critiquerons pas ici les définitions des termes alphagramme et logogramme, qui recouvrent approximativement les unités que nous avons rassemblées respectivement sous les notions de linéogramme et de nébulogramme (→2.2.3.2). La définition de topogramme nous intéresse plus, parce qu’elle intègre intuitivement la notion de ponctuation. Elle a l’avantage de spécifier exactement la fonction des signes. Malheureusement, chacun des formants du terme ponctuo-typographique dérange: 1/ la réalité floue de ponctuation est employée comme s’il s’agissait d’un acquis bien défini, alors que c’est précisément ce concept qu’il faut délimiter; 2/ il mêle à la forme des considérations sur la substance (typographie). Il est difficile d’admettre cette conception sans aménagement, d’autant qu’elle pose à nouveau explicitement la question de l’extension du champ de la ponctuation (→2.3.2.2). e. Claude Tournier. S’affranchissant presque complètement de la fonction des signes pour écrire sa définition de la ponctuation, Claude Tournier délimite préalablement les notions de graphème «la plus petite unité de la chaîne écrite ayant un correspondant phonique et/ou sémique susceptible d’une analyse linguistique»35 (Tournier 1980, 35) et reprend de Nina Catach l’emprunt à Louis Hjelmslev de l’opposition entre cénème et plérème36 (Tournier 1980, 35). Il explique enfin que les signes de ponctuation ont 34 Dans ses premiers travaux sur la question, l’auteur parle de «fonction suprasegmentale»
(Catach 1980, 22). 35 L’approche dans son ensemble n’est pas purement autonomiste. 36 Voir note 20.
41
ponctuation @ensemble des ponctogrammes @propre à une langue écrite F IG . 2.20 – Concept de ponctuation
un contenu sémantique et sont indécomposables (Tournier 1980, 36) avant de conclure comme suit: «La ponctuation est l’ensemble des graphèmes purement plérémiques, non décomposables en unités de rang inférieur, et à caractère discret.» (Tournier 1980, 36).
Cette définition est obtenue par calibrage du concept par rapport à d’autres concepts prédéfinis, par héritage de classe et par spécification de caractères supplémentaires par rapport à l’hyperonyme; chacun des termes employés peut être critiqué indépendamment. Cette démarche correspond exactement à celle que nous avons nous-même adoptée. Ensuite, le caractère général de la formulation, rendu possible par l’absence d’a priori quant à la fonction des signes, la rend utilisable dans un cadre où nous ne savons pas quelle sera la forme des unités rencontrées. La définition de Claude Tournier nous convient donc particulièrement. Nous la prendrons comme modèle. 2.3.1.2
Définition adoptée
Si nous nous fondons sur la démarche de Claude Tournier et continuons dans le chemin que nous avons tracé, il nous suffit de sélectionner, parmi les scriptèmes définis tout au long de la section →2.2, ceux qui recouvrent l’extension traditionnelle des signes de ponctuation. En l’occurrence, les ponctogrammes, c’est-à-dire les plérégrammes autonomes non paraphrasables (→2.2.4). Pour une langue écrite particulière, nous définirons simplement ponctuation en ces termes: «ensemble des ponctogrammes d’une langue écrite spécifique» (figure 2.20). Par extension, nous nommerons également ponctuation la simple présence des ponctogrammes. 2.3.2
Valeur des ponctogrammes
Nous avons vu dès l’introduction que les études sur la ponctuation médiévale s’efforçaient de catégoriser les différentes fonctions de la ponctuation (→0.1.1.1). Les ponctogrammes étant des signes à part entière, il paraît en effet nécessaire de décrire leur valeur, tributaire de la fonction de la ponctuation dans la langue écrite. Nous pourrions passer en revue les conceptions des différents chercheurs quant à leur valeur de la ponctuation,37 . Pour l’heure, nous préférons adopter l’attitude 37 Voir les conceptions de Lidya Hirschberg 1965 qui considère les ponctogrammes de la
même manière que les constituants des structures syntaxiques; Ivan Fónagy 1980, qui attribue aux ponctogrammes une valeur sémantique permettant de distinguer des synonymes, homonymes et signes polysémiques; Ludmilla Védénina 1980, Nina Catach 1980, 21–25 et Claude Tournier 1980, 37–38, qui distinguent de multiples fonctions, dans une optique similaire à celle présentée dans l’introduction (→0.1.1.1); ou Jacques Anis et al. 1988, 122, qui insistent sur le caractère organisateur de la ponctuation.
42
pratique suivante: les ponctogrammes apparaissent devant ou derrière d’autres grammèmes, qui contribuent eux-mêmes à la construction d’unités syntaxiques. Il nous semble profitable d’adopter à nouveau un point de vue général sur la question. 2.3.2.1
Multiplicité des fonctions
D’un point de vue sémiotique, les scriptèmes sont capables de remplir simultanément de nombreuses fonctions38 relevant, d’une part, de la langue et de la relation entre langue écrite et oralité et, d’autre part, de ce que rend possible la spatialité qui caractérise la langue écrite. Nous focalisant sur les ponctogrammes, nous choisissons d’en décrire la fonction démarcative (Klinkenberg 2005, 179–180), qui suppose que les ponctogrammes sont avant tout des index, des signes «ayant pour fonction générale d’attirer l’attention sur un objet déterminé et pour fonction particulière de donner un certain statut à cet objet» (Klinkenberg 2005, 187). Pour traiter notre problème, disons que la ponctuation délimite des structures syntaxiques, mais que nous ne pouvons accéder au surcroît de sens qu’elle confèrerait au segment délimité. Déterminer exactement quel constituant est délimité est en soi problématique, puisque, dans la majorité des cas observés, les ponctogrammes apparaissent au moins entre deux constituants. Il semble que la plus raisonnable des positions à adopter est de considérer tout d’abord que les ponctogrammes marquent simplement les structures aux bornes desquelles ils apparaissent. Tout le travail d’analyse des chapitres →5 à →7 consistera à dépasser progressivement la simple notion de marquage pour identifier quelles constructions sont effectivement délimitées et quelles formes d’expression prennent les ponctogrammes. Anticiper sur les développements qui suivront nous permet d’exemplifier la démarche. Soit le ponctogramme souligné dans: [7] prent ıhl en fıez de la glıſe · en tel manıre ke ſe de luj´ defaloıt ſenz hoır «· et le remanant ’ de ſon corſ · ke la terre reuenroıt a hlei hglısei ſaz le humerſ ſa femme» (Document 1236–05, 6).
Adoptant un découpage traditionnel, on peut dire que le ponctogramme est à la fois: à la fin de ſon corſ, à la fin de corſ, à la fin de la subordonnée conditionnelle ſe de’ luj´ defaloıt ſenz hoır de ſon corſ, au début de l’apodose, etc. Le ponctogramme ‹·› marque simultanément toutes ces structures. Ce n’est qu’au bout d’une longue analyse que nous serions en mesure de dire que la marque délimite essentiellement la protase (→6.1.4.6), et que la forme d’expression du ponctogramme est partiellement spécifique à cette fonction (→7.3). 2.3.2.2
Largeur du champ
a. Ponctuation «au sens étendu». La tentative de définition de Ludmilla Védénina a la particularité d’étendre explicitement le champ de la ponctuation à un ensemble d’unités qui n’entrent pas dans la notion traditionnelle. Reprenons: «Par ponctuation, nous entendons non seulement les signes comme le point, la virgule, etc., 38 Voir Klinkenberg 2005, 168–169.
43
mais également certains procédés typographiques comme l’emploi des caractères, l’espace blanc entre les signes, etc.» (Védénina 1989, 1, nous soulignons).
Cela pris en compte, on constate que les définitions des topogrammes de Jacques Anis et de la ponctuation de Nina Catach recouvrent également ces procédés. Cette dernière nous livre son point de vue dans son Que sais-je? sur la ponctuation (1996, 7–8): «L’étude de la ponctuation peut se comprendre au sens large ou au sens étroit. Au sens large, la mise en page (MEP) comportera les signes,39 mais aussi tous les procédés typographiques de mise en valeur du texte, titres, marges, choix des espaces et des caractères, et[,] au-delà[,] agencement général des chapitres et façonnement du livre. Au sens étroit, on lui accorde en général une quinzaine d’éléments graphiques étroitement liés au texte alphabétique: essentiellement séparateurs (virgule, point-virgule, point final, d’exclamation, d’interrogation, de suspension); et signes de communication ou de «message» (deux points, guillemets, tirets simples ou doubles, parenthèses, crochets). Il est nécessaire d’y ajouter l’usage des blancs et des majuscules, piliers, avec le point, les plus anciens de la ponctuation, plus que jamais indispensables.» (italiques dans le texte).
Traduit dans notre système conceptuel, la ponctuation ainsi «élargie» (le sens restreint dépasse déjà notre propre définition en intégrant les «blancs» et les «majuscules») comprend l’emploi des topèmes et celui des hétérogrammes, ce qui revient à regrouper dans une catégorie unique deux ou trois types de scriptèmes fondamentalement différents selon le point de vue adopté pour la conceptualisation – au moins quatre caractères différencient ces unités. Il y a dès lors lieu de justifier ce regroupement: quels caractères ces unités auraient-elles en commun? b. Présupposé fonctionnel. La plupart des études actuelles, dont celles qui ont porté sur la ponctuation médiévale (→0.1.1), admettent d’emblée que les hétérogrammes et les topèmes «fonctionnent souvent ensemble (en se complétant ou en se remplaçant)» (Lavrentiev 2000, 26) pour remplir des fonctions spécifiques. Il est certes envisageable de se fonder sur cette complémentarité comme hypothèse de travail, mais nous ne le ferons pas. Le terme ponctuation continuera d’être appliqué ici aux seuls ponctogrammes. L’étude des relations entre les ponctogrammes et le reste du système graphique ne sera pas abordée dans les pages qui suivent. Le statut des «blancs», qui relèvent des topèmes de notre système, mérite néanmoins qu’on s’y intéresse. Nina Catach (1980, 18) le justifie pleinement dans les termes suivants: «Cependant, on ne peut se satisfaire longtemps d’une délimitation aussi étroite (dix à onze signes) du secteur considéré. [. . .] En l’absence de ponctuation, que reste-t-il? Un blanc, lequel est déjà un signe, le plus primitif de tous, ‹un signe en négatif›.»
Nous adhérons à cette idée moyennant de petits ajustements. Il nous semble qu’il n’y a pas de «blanc» en l’absence de ponctogramme, mais une absence: les plérétopes mobilisés n’ajoutent pas un «blanc», ils structurent l’espace en fonction des grammèmes en présence. Il reste toutefois évident que la valeur de la ponctuation ne peut être envi-
39 C’est-à-dire, les signes de ponctuation au sens étroit, que l’auteur définit plus loin – voir plus
bas dans cette même citation.
44
Forme
Nom latin le cas échéant
Description
· ·· / // –’ · / · ; : ¶ ·/ ·¶·
punctus
simple point deux points enchaînés barre oblique deux barres obliques enchaînées trait horizontal point surmonté d’un trait incurvé point surmonté d’une barre oblique point surmontant un trait incurvé superposition de deux points signe au tracé complexe point suivi d’une barre oblique paraphus précédé et suivi d’un point
virgula virgula plana punctus elevatus punctus elevatus punctus versus colon paraphus
TAB . 2.1 – Inventaire des ponctogrammes relevés
sagée que si nous considérons simultanément l’ensemble des endroits où elle apparaît et l’ensemble des endroits où elle n’apparaît pas. 2.3.3
Inventaire des formes
Suivant la définition choisie, la ponctuation relevée dans les documents de notre corpus prend les formes reprises dans la table 2.1.40 Remarquons que nous avons considéré comme un seul ponctogramme ce qui pourrait également être interprété comme une séquence.
2.4
Conclusions
a. Nécessité de l’élaboration de bases théoriques. Au terme de ce chapitre, nous avons à notre disposition une définition que nous croyons solide du concept de ponctuation. Pour en arriver là, il a été capital de passer en revue l’ensemble des unités de la langue écrite. En effet, d’un point de vue théorique, on ne peut définir ces signes sans comprendre la manière dont ils s’intègrent au système dans son ensemble. On a vu que ce n’est que par une sélection progressive de propriétés très précises que nous sommes arrivé à délimiter clairement les concepts. D’un point de vue pratique, faire l’économie de l’aspect généraliste de notre étude n’aurait pas mené bien loin sans qu’il ne soit nécessaire de faire appel à l’intuition pour justifier la catégorisation de telle ou telle unité. b. Consensualité du classement obtenu. Par ailleurs, s’il est question d’intuition, on remarquera que le classement des unités correspond généralement à la perception intuitive qu’on en a. La correspondance est nette: – lettre correspond à linéogramme; – idéogramme correspond à logogramme; 40 Nous donnons à chaque forme le nom latin correspondant, cf. Parkes 1992. Voir la section
Transcription des annexes pour un exemple de réalisation de chacun de ces ponctogrammes.
45
– signe de ponctuation correspond à ponctogramme. Peut-être notre analyse est-elle, en fin de compte, tributaire de représentations traditionnelles. Cela importe peu, puisque notre démarche est évaluable indépendamment de ces modèles aux contours flous. Ainsi, revenons sur les termes: qu’est-ce qu’une lettre? qu’est-ce qu’un idéogramme? qu’est-ce qu’un signe de ponctuation? À ces questions, il n’était pas possible de répondre clairement. Les termes étaient disparates, les notions floues. Les relations entre celles-ci apparaissent désormais très clairement, et l’on peut par exemple apprécier à la fois la différence et les points communs entre les ponctogrammes et les idéogrammes. c. Autonomie de la description. Fait capital pour le bon déroulement de la suite de notre étude, les unités de la langue écrite ont été définies à l’aide de concepts qui s’aventurent le moins loin possible dans la description de leur valeur. Ainsi, la seule considération concernant cette dernière a été de poser la distinction entre les plérégrammes et les cénégrammes. Nous n’avons pas dépassé la simple opposition «il y a un sens» vs «il n’y en a pas». Cette autonomie de la description des unités de la langue écrite par rapport au plan du contenu fonde la possibilité de comparaisons ultérieures. d. Importance de la terminologie. Nous nous sommes permis ce que d’aucuns pourraient juger comme étant une «débauche» de nouveaux termes. Il faut cependant admettre que nous n’avions pas le choix. Les mots disponibles étaient trop peu nombreux et trop spécifiques à des conceptions auxquelles nous n’adhérons pas pour permettre la nomination de toutes les unités que nous avons pu dégager. Sans ces innovations, les concepts n’auraient pas pu être manipulés efficacement.
46
3
Modèle d’analyse linguistique
L’objectif de ce chapitre est de décrire l’ensemble des règles qui ont été suivies pour identifier, analyser et classer les unités linguistiques contenues dans les textes du corpus. Il s’agit donc de donner une description sommaire de l’ancien français des chartes liégeoises du treizième siècle tel que nous concevons son fonctionnement. Nous avons dû construire un modèle personnel pour mener à bien la description. Celui-ci, élaboré sur la base des données que livrent les textes, prend la forme de définitions de concepts par sélection des caractères que nous avons jugés suffisants pour forger une définition appropriée (→1). Quant aux exemples qu’on lira dans les lignes qui suivent, nous les avons voulus avant tout illustratifs: notre modèle pose des hypothèses avec lesquelles les extraits relevés, que nous espérons suffisamment représentatifs, s’accordent généralement. Nous ne discutons que les cas douteux qui méritent au moins un commentaire. L’analyse exhaustive du corpus qui permettra au lecteur de critiquer le détail de notre travail se trouve en annexe, sous la forme d’éditions électroniques annotés.1 Enfin, la description ne tient pas compte de la ponctuation originale, à laquelle elle sera comparée dans la deuxième partie de notre étude. Dans cette optique, il nous a paru plus commode de présenter les extraits dans une transcription modernisée: cela les rend plus lisibles et cela évite de rapprocher a priori la morphosyntaxe et le système graphique. Après avoir posé quelques préalables méthodologiques (→3.1), nous opposerons ensuite les concepts de morphologie et de syntaxe, distinction sans laquelle il n’aurait pas été possible de travailler (→3.2). Cela permettra de définir trois classes de mots fondamentales (→3.3). Enfin, l’essentiel de l’exposé sera consacré aux relations syntaxiques que ces mots entretiennent en discours, que nous présenterons suivant un principe analytique, partant des plus grandes unités pour aboutir aux plus petites (→3.4).
3.1
Préalables méthodologiques
Avant d’entrer dans la description, nous voudrions en évoquer les bases méthodologiques. Dans une première partie, il s’agira d’expliciter la position que nous adoptons par rapport à la terminologie linguistique, problème incontournable que nous ne pourrions ignorer sans entraîner l’ensemble de l’exposé dans le flou le plus absolu (→3.1.1). Nous verrons que les choix opérés dans ce chapitre diffèrent de ceux qui ont été posés dans le cadre du chapitre →2. Nous présenterons ensuite les unités qui 1
Voir la section Analyses syntaxiques des annexes.
47
peuvent être considérées comme des données fournies par les documents (→3.1.2). La section s’achèvera sur les implications de la démarche de description de l’ancien français et les obstacles qu’elle rencontre (→3.1.3). 3.1.1
Concepts et terminologie linguistique
Il paraît opportun d’exposer d’emblée la manière dont nous allons nous comporter vis-à-vis de la terminologie.2 On sait à quel point la description linguistique est tributaire d’une longue tradition, s’appuyant trop souvent sur des notions vagues et sur un cadre théorique hétéroclite. Nous nous efforcerons d’éviter ces écueils, en proposant l’intégration de termes traditionnels à un système de définitions plus rigoureux, suivant le modèle exposé au chapitre →1. Nous ne réviserons donc pas intégralement la terminologie linguistique. En premier lieu, nous prendrons garde d’éviter un des pièges dénoncés par Georges Mounin dans l’introduction de son Dictionnaire de la linguistique (1974, X - XI). «Il y a certainement une psychologie du chercheur, et même une psychopathologie, dont il faut prendre [XI] conscience. La conviction qu’on a découvert quelque chose parce qu’on a rebaptisé un concept déjà bien élaboré par quelqu’un d’autre doit être une maladie professionnelle du savant, du jeune savant, du candidat-savant.»
Il serait bien outrecuidant de chercher à donner un nouveau nom à des concepts déjà clairement délimités, ce qui mènerait en outre à tomber dans un autre piège, qui n’a pas manqué d’attraper certains des plus géniaux théoriciens (Mounin 1974, XIII - XIV): «[I]l paraît bien imprudent de croire comme, en 1928, Hjelmslev – lequel a largement appliqué son axiome – que ‹la terminologie est une question de goût›. Elle ‹ne touche pas aux réalités›, poursuit-il, oubliant que la science est une œuvre collective, qu’une langue, même une langue scientifique, est un instrument de communication, et que le néologisme impénitent, si génial soit-il, est presque toujours sanctionné sur ce point par l’échec: on n’apprend pas ‹sa langue›, on ne le lit pas, on le lit mal, on ne le comprend pas, on l’abandonne sur le bord de la route. L’histoire de la linguistique, comme celle de beaucoup d’autres sciences, est un immense cimetière de voitures termino-[XIV]-logiques. . . qui n’ont jamais roulé ou presque. Cimetière peu visité, dont la visite serait pourtant très instructive. Des 106 termes créés par Hjelmslev il en survit 5% dans l’usage commun.»
Par ailleurs, à moins de rester à un degré d’abstraction qui rendrait la lecture laborieuse, il est très difficile de définir progressivement les concepts employés sans avoir besoin pour ce faire de concepts qui n’ont pas encore été décrits, mais dont on a au moins une représentation intuitive. Cette difficulté est liée au phénomène de circularité, inhérent à de nombreuses terminologies. En outre, pour être compris, nous devons partir de bases connues. Afin que l’exposé reste accessible et puisse être situé dans la réflexion linguistique sur l’ancienne langue, il est inévitable de partir parfois de ces notions floues qu’offre la description traditionnelle, mais en guise d’approche intuitive exclusivement; une fois le concept cadré, nous essayerons d’en donner une définition
2
Sur la problématique du lien entre la conceptualisation et la terminologie (→1).
48
plus stricte, dans les limites données par le modèle employé.3 Cette approche nous permettra de «récupérer» les termes traditionnels.4 Par exemple, on emploiera la notion de «conjonction de coordination» pour arriver à délimiter l’énoncé (→3.4.1), alors que le concept ne sera redéfini que bien plus loin dans le chapitre (→3.4.7.2). 3.1.2
Les unités de base
Dans un cadre très abstrait, il est souvent possible de refuser à tout élément le statut de donnée: tout phénomène est effectivement catégorisé et formalisé par le cerveau humain, dans une dynamique cognitive complexe qui dépasse le cadre de notre travail et de nos compétences. Pour une étude empirique comme celle-ci, il nous semble cependant que nous pouvons simplifier le problème et admettre que le corpus nous livre directement des informations, préalablement à toute analyse. Nous considérons que les documents délimitent les contours des unités que sont les textes (→3.1.2.1) et les mots (→3.1.2.2). 3.1.2.1
Unité maximale: le texte
L’unité la plus large, le texte, a l’avantage d’être la moins artificielle (→a). Nous décrirons brièvement ici comment le texte doit être mis en relation avec le contexte de son utilisation (→b) avant de proposer une définition de l’unité (→c). a. Le texte comme donnée. Le segment «maximal», celui dont part l’analyse linguistique, est relativement simple à délimiter pour qui travaille à partir d’un corpus: «Si l’on peut parler de données (nous laissons cela comme une condition dans le sens épistémologique), ces données sont, pour le linguiste, le texte, dans sa totalité absolue et non analysée.» (Hjelmslev 1968, 21).
Les bons philologues (qui, dans le meilleur des mondes, travaillent avec les linguistes à l’établissement des textes), savent que le texte est déjà le résultat d’une analyse qui implique un regard linguistique. Néanmoins, au point de vue de la hiérarchisation des –shiérarchisation des structures, qui est l’objet de la section →3.4, le texte est bien la seule structure linguistique dont on ne puisse dire qu’elle est intégrée dans une autre plus large. Au delà du texte, il n’y a rien qui soit linguistiquement structuré. b. Document et texte. Malgré tout, il se pourrait que les limites supérieures du texte ne coulent pas de source. Par exemple, pour Knud Togeby (1965, 6), la langue est «considérée comme un texte infini dont il faut décrire la structure». Pour que les choses soient claires, il est nécessaire d’articuler la définition du texte avec celle du document que constitue la charte. Les définitions qu’on rencontre dans les manuels écrits par les historiens tentent d’en rendre compte: 3 4
De ce point de vue, la démarche est similaire à celle suivie au chapitre →2. De ce point de vue, par contre, la démarche est complètement différente de celle suivie au chapitre →2, où nous devions construire une nouvelle terminologie. Nous récupérons les termes d’une manière assez similaire à celle de Denis Creissels (1995) dans ses Éléments de syntaxe générale, si ce n’est que le présent modèle est focalisé sur une langue particulière.
49
[authentification [écrit [parole [action]]]]
F IG . 3.1 – Schématisation du type de texte charte selon Marie-Guy Boutier «La charte n’est pas à proprement parler un terme technique, mais plutôt un terme générique, recouvrant une variété confuse de documents. N’étant pas technique, le mot est assez flou. On l’emploie généralement pour désigner un acte écrit, émanant le plus souvent d’une autorité royale, religieuse ou seigneuriale, mais jamais à une époque où l’auteur multiplie les documents dans le cadre d’administration ad hoc. Une charte contient soit une concession de biens, de droits,. . . soit une décision judiciaire.» (Guyotjeannin et al. 1993, 25, italiques en grasses dans le texte). «Une charte est un acte par lequel se manifeste au Moyen Âge la volonté de l’auteur de l’acte écrit et qui constitue normalement un titre entre les mains de son bénéficiaire.» (Cárcel Ortí 1994, §385).
Comme l’avouent les auteurs, ces définitions sont approximatives, mais elles replacent cependant le document dans un cadre pragmatique clair: l’objet charte est construit par un ou plusieurs individus pour servir à communiquer un message à d’autres individus dans une situation qui justifie ce transfert d’information, dont le texte est le véhicule. Cette description «externe» situe le document dans le monde (pourquoi il est écrit, par qui, pour qui, etc.) et place en conséquence le texte dans un contexte. Selon JeanMichel Adam (1999, spéc. 37–40), cette insertion d’une structure linguistique dans une situation d’énonciation définit de manière générale le discours. Le contexte ainsi que les contraintes sociales et pragmatiques influencent la manière dont le texte est structuré en séquences ordonnées (ce que Jean-Michel Adam nomme texture). Le fait est extrêmement prégnant dans le cas des chartes, et MarieGuy Boutier (2003) a pu montrer que la structure énonciative du document est entièrement pensée dans le sens de son utilisation. Une charte, écrit-elle, est un «écrit adressé authentique faisant connaître une parole créant ou attestant une action juridique» (41). Après avoir exposé que la charte «publiait» par écrit la parole performative d’un acte juridique (exprimé par un verbe) – schématiquement: figure 3.1. Tous ces éléments de définition trouvent un écho dans les chartes, qui suivent pratiquement toujours la progression suivante: 1/ l’auteur de l’acte, qui profère la parole performative s’identifie; 2/ la parole en question est recensée et l’action juridique est identifiée par un verbe spécifique; 3/ les autorités compétentes corroborent la véridicité de cet écrit (c’est-àdire la conformité entre la parole et sa représentation écrite). Les contraintes que le texte subit contribuent donc en grande partie à le définir. Cette spécificité du type de texte implique que, quelles que soient les conclusions tirées des analyses basées sur ces textes, nous devrons être conscient qu’elles ne valent que pour la famille des chartes appartenant au corpus étudié. c. Définition. Nous pouvons donc, dans le cadre de notre étude, nous satisfaire de la définition formalisée de la figure 3.2. 3.1.2.2
Unité minimale: le mot
Nous pouvons admettre que les mots nous sont «donnés» comme le texte, mais dans une moindre mesure (→a). Cela justifie à nos yeux que nous prenions le mot comme 50
texte @unité linguistique en présence @non intégré à une unité linguistique plus vaste @véhiculant une information @suivant une stratégie de communication liée à la situation F IG . 3.2 – Concept de texte
unité de base. Il nous faudra peser ce choix (→b). On distinguera ensuite les occurrences des mots et des lexèmes en opposant les niveaux d’abstraction (→c), puis les notions seront clairement définies (→d). a. Le mot comme «donnée». Bien que cela soit plus discutable, et devra être nuancé, les scribes ont ressenti le besoin de séparer les chaînes de linéogrammes par des «blancs».5 . Ce faisant, ils nous livrent un texte partiellement analysé. Le mot, conçu alors comme une unité graphique, est également donné. Cependant, les textes analysés étant préalablement transcrits,6 le mot doit être conçu comme une graphie homogénéisée. Le mot est ainsi posé comme une unité de base de la description.7 b. Besoin impérieux d’une définition. Il est vrai que le mot se laisse quant à lui difficilement définir avec rigueur, si bien qu’il «est volontiers banni au profit de la recherche d’unités significatives minimales, chaque linguiste ayant alors sa terminologie propre: lexie, synapsie,8 lexème, unité significative, etc.» (Dubois et al. 2002, 313). Ainsi, dans son Dictionnaire de la linguistique, Georges Mounin va jusqu’à écrire que «le mot n’est pas une réalité de linguistique générale» (1974, 223). Pourtant, aussi douteux que paraisse ce terme depuis l’arrivée du structuralisme, force est de constater qu’il correspond à une réalité intuitive qui s’impose à beaucoup comme une évidence. Émile Benveniste, dans son article sur les Structures de l’analyse linguistique (1964, 123) déclare le terme «irremplaçable». Il est néanmoins vrai que cette «évidence» doit être nuancée et qu’il serait effectivement nécessaire de définir précisément ce qu’on entend par mot.9
5 6 7 8 9
Les topèmes organisant les linéogrammes créent des espaces qu’on peut appeler blancs Voir →2.2.3.2 a concernant les linéogrammes. Voir la section Transcriptions des annexes. Exception faite des phénomènes d’amalgame, qu’il serait absurde de négliger (Feuillet 1988, 72). Il nous semble que le terme (Benveniste 1974, 171–176) ne s’insère pas bien dans la liste: la synapsie est une forme de composition lexicale. Il faut mentionner ici le livre de Maurice Pergnier (1986), qui, décrivant l’histoire de la notion, et surtout son rejet par la linguistique structuraliste et ses descendants, propose de réhabiliter le terme sans l’aide de critères sémantiques, se basant sur les travaux de Jean Gagnepain (1982), qui se fonde sur une analyse distributionnelle. Malheureusement, il considère que la «préposition» fait partie de mots comme les «noms», ce qui l’amène à poser des marques ø là où la préposition n’apparaît pas. En plus d’être critiquable dans son principe (voir Lemaréchal 1997), cette hypothèse a le défaut de ne pas être d’un caractère assez général pour être transposée facilement à l’ancien français. Elle demande en outre à être démontrée pour chaque langue, et nous ne voyons pas comment cela pourrait être possible ici.
51
c. Occurrences, mots et lexèmes. Enfin, nous voudrions poser ici une importante distinction, dont nous aurons constamment besoin. Dans son excellent Comprendre la linguistique (2002), Robert Martin oppose trois niveaux d’abstraction. Reprenons ses termes: «Les énoncés sont construits, selon les besoins, au moyen d’un instrument qui permet de les générer (et, inversement, de les comprendre). Constitué de signes et de règles combinatoires, cet instrument n’est autre que la langue. F. de Saussure (Cours de linguistique générale, 1916) a opposé nettement la langue et la parole: la langue est un système inscrit dans la mémoire commune, qui permet de produire et de comprendre l’infinité des énoncés; la parole est l’ensemble des énoncés effectivement produits. Depuis, on a ajouté (notamment le linguiste français G. Guillaume) un troisième terme, celui de discours: le discours est l’ensemble infini des énoncés possibles, dont la parole est un sous-ensemble réalisé. La langue est alors le système capable d’engendrer (et de décoder) le discours.» (55, italiques emphatiques en grasses dans le texte).
À chacun de ces trois niveaux d’abstraction (langue, parole et discours10 ), nous ferons correspondre trois concepts différents. Au niveau le plus concret, celui des formes attestées, nous rencontrons des occurrences séparées les unes des autres par des blancs (que ces blancs soient reconstruits par la démarche éditoriale ou non). Nous pouvons regrouper un ensemble d’occurrences en vertu de leur équivalence de forme d’expression et de contenu, et les représenter par une seule unité, plus abstraite, à laquelle nous réserverons le nom de mot. Par exemple, dans l’extrait «cilh ki sont et ki a_venir sont» (Document 1274–05–31b, 2).
il y a deux occurrences du mot sont. Ainsi l’occurrence relève de la parole (elle est attestée dans un énoncé effectivement réalisé), alors que le mot fait plutôt partie du discours. Mais nous savons que le mot sont entretient une relation particulière avec d’autres mots, comme estre, est, estoient, etc. Toutes ces formes sont des formes fléchies relevant, dira-t-on en termes traditionnels, du même paradigme. On atteint ici le niveau de la langue: celui de l’inventaire des signes et des règles qui permettent de les employer. Cet ensemble de formes fléchies peut à son tour être représenté par une unité, plus abstraite encore, que nous nommerons lexème, la considérant comme une unité de la langue. Par commodité, nous emploierons les conventions traditionnelles pour donner une forme d’expression à cette unité très abstraite, représentant les «verbes» par leur infinitif (estre, dans notre exemple) et les «noms» par leur forme neutralisée. Par ailleurs, nous emploierons le terme lexème indifféremment pour les mots «lexicaux» comme chevalier, afaitier, etc. et pour les mots «grammaticaux», comme il, de, etc. Nous donnons ainsi au terme le sens pratique d’‘unité du dictionnaire’. d. Définitions. Nous devons donc définir précisément les concepts de mot, occurrence et lexème. Pour cette étude, il nous semble que les définitions formalisées suivantes peuvent convenir:11 au niveau de la parole se trouve l’occurrence (figure 3.3); au niveau du discours se trouve le mot (figure 3.4); au niveau de la langue se trouve le lexème (figure 3.5). 10 L’acception du terme est donc ici différente de celle que lui donne Jean-Michel Adam et que
nous avons mentionnée ci-dessus (→3.1.2.1 b). 11 Elles se révèleraient sans doute insuffisantes pour mener une réflexion plus approfondie.
52
occurrence @graphie @relevant de la parole @homogénéisée par la démarche éditoriale F IG . 3.3 – Concept d’occurrence
mot @abstraction de la forme et du sens communs à un ensemble d’occurrences @relevant du discours F IG . 3.4 – Concept de mot
lexème @abstraction du signe commun à un ensemble de mots @relevant de la langue F IG . 3.5 – Concept de lexème
3.1.3
Décrire l’ancien français
Le texte et les mots ne constituent que le point de départ: si l’on veut comprendre comment ces unités sont construites et comment les mots se combinent, il faut entamer une démarche d’analyse. Nous partirons du modèle général de la triple organisation de l’énoncé, qui servira de base à l’ensemble de l’analyse (→3.1.3.1). Cela mènera à envisager le sens des énoncés du corpus. Nous verrons alors comment la question de la compréhension de textes écrits dans un état de langue ancien a été abordée (→3.1.3.2). Le délicat problème de l’évaluation des analyses linguistiques poursuivra la réflexion (→3.1.3.3). Enfin, nous synthétiserons nos remarques en soulignant les limites inhérentes à la démarche choisie (→3.1.3.4). 3.1.3.1
Décrire la langue: triple organisation de l’énoncé
Du fait de son aspect très général, le modèle de la triple organisation de l’énoncé ou «théorie des trois points de vue» est vu par ses créateurs comme le cadre préalable à l’analyse de tout énoncé linguistique («phrase-énoncé»). Nous commencerons par exposer succinctement en quoi consiste ce modèle, qui postule qu’un énoncé peut être analysé de trois manières idéalement indépendantes (→a), avant de montrer en quoi ces différentes analyses sont nécessairement entrelacées (→b). a. Exposé synthétique. La théorie des trois points de vue, élaborée à partir des travaux de František Daneš (1964) par Claude Hagège (notamment 1984 et 1999, en particulier 27–31) et Gilbert Lazard (cf. Feuillet 1988, 36), fournit un cadre strict à l’analyse de l’énoncé,12 défini comme «une production linguistique acceptée par les locuteurs 12 L’origine de la théorie est donnée par Lazard 1998, 80. Dans le monde anglo-saxon, on
retrouve les mêmes conceptions chez Michael Alexander Kirkwood Halliday (1985).
53
énoncé @unité linguistique complète @transmet un message @suit une stratégie énonciative F IG . 3.6 – Concept d’énoncé
natifs comme complète et possédant une intonation reconnue comme liée à ce fait» (Hagège 1999, 27). Ainsi, tel que l’a exprimé Claude Hagège: «Le premier [point de vue sur la phrase-énoncé] l’envisage en relation avec les systèmes de la langue. On étudie donc, selon cette perspective, les rapports entre les termes, ainsi que l’expression de ces rapports. C’est le point de vue morphosyntaxique ou point de vue 1. Le deuxième relie les phrases au monde extérieur dont elles parlent. Ce ne sont pas, cette fois, des formes que l’on retient, mais les sens transmis par elles, d’où le nom de sémanticoréférentiel qui est ici proposé pour désigner le point de vue 2. Enfin, le point de vue 3, la phrase est considérée dans ses rapports avec celui qui la profère, relié lui-même à un auditeur. Le locuteur choisit une certaine stratégie ou mode de représentation, introduisant une hiérarchie entre ce qu’il énonce et ce à propos de quoi il l’énonce. De là le nom d’énonciatifhiérarchique que l’on proposera pour ce point de vue.» (1986, 276).
L’acte de communication linguistique (énonciation) se manifeste par l’expression d’un message (ou contenu sémantique) en rapport avec le monde. Cette expression mobilise le potentiel morphosyntaxique de la langue et est énoncée suivant une visée communicationnelle spécifique à la situation discursive et aux intentions du locuteur. Nous transposons cette théorie dans notre système de conceptualisation (→1), ce qui nous mène à formuler la définition formalisée du concept d’énoncé à l’aide de trois caractères correspondant aux points de vue (figure 3.6).13 Cette définition rapproche l’énoncé du texte (→3.1.2.1). Toutefois, le fait de constater qu’un texte est constitué d’énoncés distincts relève déjà de l’analyse, et la subdivision du texte en énoncés14 est loin d’être tout à fait évidente. Ignorons temporairement cet aspect, auquel nous reviendrons.15 Chacun des trois points de vue permet de poser un regard différent sur l’énoncé et mène à une analyse spécifique. Claude Hagège (1986, 276) insiste également sur le fait que la théorie de la triple organisation ne postule aucune hiérarchie entre les points de vue: il ne s’agit pas de niveaux, mais de plans qui ne sont pas hiérarchisés.16 On ne soulignera jamais assez la nécessité d’éviter les confusions entre les plans, ce qui n’est possible que si ces derniers sont bien définis, mission qu’accomplit la théorie de manière très satisfaisante.
13 On verra ci-dessous (→3.4.1.1) que l’application de cette définition au corpus mérite une
discussion approfondie. 14 Il est tout à fait possible qu’un texte ne soit constitué que d’un seul énoncé. 15 Voir les choix posés pour le corpus (→3.4.1). 16 Ce qui est un postulat assez complexe à maintenir en pratique: étant donné que les données
des points de vue 2 et 3 ne sont accessibles que par le biais du point de vue 1.
54
b. Interférences entre les points de vue. Claude Hagège précise également qu’il est évident que ces différents points de vue entrent naturellement en relation et sont loin d’être toujours clairement descriptibles indépendamment les uns des autres. «Toute étude d’un seul point de vue isolé des deux autres est un artifice ignorant la réalité des liens indissolubles entre les trois.» (Hagège 1986, 277).
Par exemple, les phénomènes d’ambiguïté ne peuvent être décrits efficacement sans recourir à la fois aux points de vue morphosyntaxique et sémantico-référentiel.17 Admettons que la question de la compréhension des énoncés soit résolue et considérons l’extrait suivant: «La afaitat [‘transférer (un droit réel immobilier) à (un bénéficiaire) devant la juridiction compétente et selon les formes prescrites’18 ] ilh frere Marsille [. . .] l’alut ke freres Wa-[8]-tirs [. . .] aportat a la maison de_le Vas Benoiete.» (Document 1260–02–21a, 6).
L’exemple montre que, d’un point de vue strictement morphosyntaxique, la principale différence entre l’alut. . . et frere Marsille se situe sur l’axe paradigmatique: frere Marsille commute avec li et l’alut. . . avec le,19 mais aussi par le fait que frere Marsille est en variation libre avec a frere Marsille, qui ne présente pas la même ambiguïté, comme l’atteste «La afaitarent elles a [5] frere Libier de Frelus, a owez de la maison de la Vas Benoiete delés Liege, delle ordene de [6] Citeaz, xvii verges de terre» (Document 1263–07–20, 4).
Cependant, ces propriétés paradigmatiques ne sont pas évidentes si l’on ne connaît pas les compatibilités syntaxiques du verbe afaitier dans ses relations avec le nom aleu. Cette connaissance, qui est d’ordre lexical, est liée à la connaissance du sens du verbe, laquelle valide l’interprétation qui fait de frere Marsille le bénéficiaire du procès et de aleu le patient. Il n’est pas raisonnable de se priver des informations livrées par le point de vue sémantico-référentiel pour décrire efficacement la structuration syntaxique,20 même si le sens est inapte à définir à lui seul cette structuration. Il est donc, de manière générale, impossible de commencer la description d’une langue par une analyse qui soit exclusivement morphosyntaxique. Pour le linguiste, il faut tenter de reconstituer ce plan, par le biais d’une dialectique permanente entre les trois points de vue (en particulier entre le premier et le deuxième). Néanmoins, nous devons prendre garde de bien identifier le point de vue dont relèvent les éléments mis en relation. De ce fait, il est d’une importance capitale que la terminologie employée reflète cette distinction des points de vue. Nous suivrons ainsi l’exemple de Gilbert Lazard (1999b), qui propose de parler de procès, participants et circonstances au point de vue sémantique et de verbe, actants et circonstants au point de vue morphosyntaxique – nous formaliserons plus loin cette terminologie (→3.4.2), qui sera adoptée grosso modo. 17 Voir également Soutet 1998, 7, qui montre que la distinction entre grammaticalité et inter-
prétabilité n’est pas aussi franche qu’on l’aurait voulu. 18 Cf. Boutier 2003, 44. 19 Voir sous →3.4.2.2 comment tirer profit de cette commutation. 20 Cet exemple sera à nouveau discuté (→3.4.2.1).
55
3.1.3.2
Comprendre un état de langue passé
La constante interférence entre les points de vue n’est malheureusement pas la seule difficulté dont il faut tenir compte. Comme nous travaillons sur l’ancien français, nous sommes immédiatement confronté à un problème méthodologique majeur: la langue que nous étudions n’est plus la langue d’aucun locuteur vivant. a. La reconstruction du sens. Christiane Marchello-Nizia (1985, 483–484) l’explique très clairement: il faut être locuteur natif pour pouvoir dire si un énoncé possède ou non du sens ou si plusieurs énoncés ont le même sens. Pour le descripteur, seule la reconstruction du sens est envisageable, laquelle peut parfois se faire simplement à l’aide des grammaires et des dictionnaires disponibles. . . et aboutit à une traduction. L’auteur souligne qu’il ne faut jamais oublier que cette reconstruction, souvent perfectible et parfois franchement insuffisante, est avant tout une hypothèse, qui peut être renforcée ou affaiblie par des recherches ultérieures. Nous pensons que les chartes constituent un terrain d’enquête privilégié.21 Grâce aux historiens et aux diplomatistes, notamment, nous sommes à même de cerner l’enjeu pragmatique des textes, et leur mise en série confirme généralement les hypothèses que nous pouvons formuler concernant leur sens. b. Stabilité de la description morphologique. Pour l’ancien français en général, il semble que nous puissions compter sur une série d’hypothèses stables. Ainsi, on admet généralement que la morphologie de l’ancien français est relativement bien décrite et consensuelle: «[L]a morphologie du nom et celle du verbe (qui englobent l’ensemble des prédéterminants du substantif et des pronoms) configurent un domaine privilégié où le descripteur se sent à l’aise. Il n’encourt là aucun risque de commettre des anachronismes. L’identification, l’analyse des morphèmes, leur attribution à tel ou tel dialecte requièrent des compétences étendues mais qui excluent, à ce niveau, une interprétation de rendement expressif de ces traits. Il n’est donc pas surprenant que la morphologie soit la partie la plus solide de la ‹grammaire› de l’ancien français.» (Wagner 1974, 56).
Même s’il faut relativiser cette prétendue absence de risque,22 les grammairiens et linguistes de l’ancien français mettent à notre disposition un système «qui marche», et qui est basé sur la compréhension. C’est parce que nous comprenons les phrases «Et nos, maire et eskeviens devant dit, par jugement, si ke drois et lois [17] porte, afaitames cest hyretage a la maison del Vauz Saint Lambert» (Document 1270–03–24, 16). «me sires Wilhames afaiterat a le glise totes ces choses devant dittes» (Document 1278–08–01, 10). «Et la afaitat
[4]
et werpit et quittat chi Libiers desur_dis a me dame l’abbesse et a frere
21 On ne peut pas en dire autant de l’ensemble des textes en ancien français (Wagner 1974, 70). 22 Jean-Pierre Chambon 2003 a ainsi pu proposer une révision de la description morphologique
de la flexion substantivale en l’ancien occitan allant dans le sens d’une très importante simplification. Il conclut par ailleurs son étude en disant: «Il est connu que la flexion substantivale en ancien occitan diffère peu de ce qu’on observe en ancien français et en ancien provençal. On peut donc s’attendre à ce que ce type d’analyse que nous avons préconisé ci-dessus puisse convenir aux deux autres langues médiévales de la Galloromania [. . .]».
56
Lambier, a owés d’eas et de_lur maison desur ditte, tos les alués qu’ilh [5] tenoit et avoit ens el choir et ens elle vilhe d’Oire» (Document 1280–07–20, 3).
que nous pouvons comparer afaitames, afaiterat et afaitat et y déceler: 1/ d’une part un radical verbal afait-, portant le sens «lexical» du verbe; 2/ d’autre part la série de désinences -ames, -erat, -at, qui expriment des catégories grammaticales et peuvent se retrouver à la suite du radical de tous les verbes qui ont un infinitif en -er. Le lecteur comprenant ces extraits est à même de compartimenter le sens, d’identifier les segments qui le véhiculent, et d’arriver à la conclusion que certains mots sont analysables en segments exprimant des types de sens différents: le radical portant un sens «lexical», la désinence exprimant des catégories. Nous verrons que cette analyse des catégories grammaticales se révèle utile pour classer les mots en fonction de leur potentiel morphologique (→3.3). 3.1.3.3
Juger et prévoir la structure
Malheureusement, cette simple interprétation ne suffit pas à aboutir à une description des relations qui construisent les énoncés. Or, pour décrire synchroniquement un système linguistique, il faut pouvoir poser, au moins de manière relative, des jugements d’acceptabilité. a. Rôle opératoire de la paraphrase. Le descripteur ne peut faire appel à sa propre compétence pour valider ses analyses. Robert-Léon Wagner (1974, 70) résume de manière efficace le problème: «Faute d’intuition, quel moderne s’aventurerait dans les démarches que les générativistes ont mises au point? Ces va-et-vient de l’admis, du toléré à l’impossible d’où se dégagent peu à peu les conditions latentes qui assurent l’intelligibilité d’un syntagme et font varier les niveaux de grammaticalité? À chaque instant l’étude de l’ancien français conduit à mesurer l’écart de la connaissance à la puissance comme les limites de la connaissance elle-même.»
On ne peut donc évaluer intuitivement la grammaticalité des constructions, ce qui complique la description morphosyntaxique. Faut-il pour autant baisser les bras? Non, si l’on en croit Christiane Marchello-Nizia. Pour résoudre le problème, elle préconise une démarche qui prend appui sur la paraphrase et la compréhension (1985, 488, italiques dans le texte): «c’est le recours aux énoncés paraphrastiques qui compense, en quelque sorte, l’absence de locuteur témoin. Ainsi, lorsqu’une règle proposée produit, entre autres, un énoncé qu’on ne trouve jamais attesté, l’on ne dispose d’aucun critère, de personne, pour juger de son acceptabilité: a priori, ce n’est pas parce qu’une phrase ne se trouve pas dans les textes qui nous sont parvenus qu’elle n’existait pas ou qu’elle était impossible. Mais l’on peut faire le raisonnement suivant: l’on ne peut certes prouver que l’énoncé en question n’appartient pas à l’état de langue dont on veut faire la grammaire – l’absence d’un énoncé ne fait pas preuve; mais si l’on constate qu’un autre énoncé qui le paraphrase est, lui, attesté, on peut faire l’hypothèse que le premier énoncé était agrammatical.»
La paraphrase met en effet en évidence des faits de figement et des blocages transformationnels liés à certaines formules ou à certaines unités du lexique.23 23 Voir Marchello-Nizia 1985, 488–490.
57
b. Évaluer les commutations. En ce qui nous concerne, nous aurons surtout besoin de valider des commutations. La paraphrase est particulièrement efficace pour évaluer le figement et les combinaisons de mots. Elle peut également servir à évaluer les commutations, quoique de manière un peu différente. Comment procéder concrètement? Raisonnons à partir d’un exemple. Nous définirons plus loin (→3.4.2.2) deux fonctions «régimes», distinguées par la forme du pronom (le ou li) avec laquelle commutent les constituants immédiats de la proposition. Imaginons que nous posions que les formes soulignées dans les phrases suivantes commutent toutes avec le (sans tenir compte des contraintes de position), ce qui les rangerait dans la classe des régimes du premier type:24 «reportarent el main nostre [6] maior, en tesmong de nos eskeviens, l’yretage deseur nomeit tot entierement» (Document 1268–03–10, 5). «[. . .] Johans [. . .] ki astoit venuz a ses jors aprés la mort [3] de son pere [= avait atteint sa majorité. . .], vient par devant moi [. . .]» (Document 1270–11–26, 2). «[. . .] ne molesterons mon [12] signor Humbier Corbea, chevalier desoir dit [. . .]» (Document 1287–09–08, 11). «[. . .] ne molesterons mon [12] signor Humbier Corbea, chevalier desoir dit [. . .]» (Document 1287–09–08, 11).
Pour chacune de ces quatre commutations, nous posons deux hypothèses: premièrement, la substitution d’une forme à l’autre ne modifie pas le sens du contexte (au sens linguistique du terme) et les énoncés se traduiront de la même manière, sauf à l’endroit de la commutation; deuxièmement, l’énoncé obtenu après commutation est acceptable. Si l’une de ces deux conditions n’est pas remplie, on peut dire que la commutation n’est pas valable. Il y a dès lors trois cas envisageables: 1/ les commutations postulées sont confortées par des attestations; 2/ les commutations ne sont pas attestées et sont incompatibles avec le sens ou avec le reste du système décrit; 3/ les commutations ne sont pas attestées et paraissent compatibles avec le sens et avec le reste du système. La seule chose qui puisse valider une commutation est de rencontrer dans le corpus (ou dans un corpus proche) un contexte qui montre qu’elle est probable; par exemple, la première commutation est validée par l’existence de «Et cis [17] dans Anthones desor dis entre Sainte Marie et Saint Lambert a Liege le reportat en mes maens [. . .]» (Document 1270–11–26, 16).
L’extrait montre qu’il est possible d’avoir le comme régime du verbe reporter. Néanmoins, comme les commutations impliquent l’axe paradigmatique (les unités ne sont donc pas présentes), la démonstration ne peut aboutir à une preuve: on constate simplement que, dans l’entourage du même verbe et sans en changer le sens, on peut rencontrer le à la place de l’yretage. . . pour désigner le patient. Il est également envisageable d’invalider certaines hypothèses de commutation. La traduction le permet parfois. Par exemple, la reconstruction où le est censé commuter avec venuz a ses jors aprés la mort de son pere, 24 Que nous noterons R2 (et non R1) plus loin.
58
*Johans, [. . .] ki l’astoit, vient par devant moi.
déstructure les catégories de temps et d’aspect véhiculées par le verbe. Le sens de astoit change: avec le pronom, le procès est statif et le verbe dénote un état; avec le participe passé et son complément, le procès est dynamique et le verbe dénote un changement d’état. Si la commutation proposée ne fait pas que modifier le sens de ce qui est remplacé et altère profondément la valeur du contexte, on peut raisonnablement la rejeter. Pareillement, nous écarterons toute commutation rendant l’énoncé ininterprétable, comme celle qui remplace ne par le et aboutit à: **le molesterons mon signor Humbier Corbea.
En dehors de ces cas, on ne peut pas prouver qu’une commutation est possible. Ainsi, l’hypothèse de commutation de mon signor. . . avec le dans l’entourage de molester ci-dessus ne peut pas être confortée par d’autres attestations du verbe dans le corpus (où il s’agit d’un hapax), mais ne semble pas poser de problème au point de vue du sens et de la conformité avec le reste du système. Il faut alors l’admettre provisoirement (pour éventuellement la rejeter plus tard): sans cette souplesse, aucune description ne serait possible. 3.1.3.4
Relativité des modèles
Le modèle qui sera présenté dans les pages qui suivent a été construit sur des bases empiriques: nous avons fait correspondre les concepts aux données par le biais d’un aller-retour permanent entre la théorisation et les faits. En conséquence, la démarche n’a été ni hypothético-déductive, ni complètement inductive: la stabilité relative des théories n’a été atteinte que par une dialectique de tous instants, que nous ne pourrons présenter dans les moindres détails, mais dont nous donnerons le résultat. Le modèle défini est ainsi limité par le corpus, qui circonscrit les faits observés, et l’on se gardera donc de le généraliser aveuglément à d’autres variétés de l’ancien français, fussent-elles de la même époque. Par ailleurs, l’analyse étant fondée sur l’hypothèse que nous comprenons les documents, il est possible que l’amélioration de la compréhension mène à réviser les fondements du modèle proposé ou certaines de ses parties. Il est en effet toujours possible de mieux comprendre les textes. Enfin, la modélisation est également limitée par des contraintes pratiques: il ne nous a pas paru envisageable, vu les milliers d’unités et de relations impliquées dans le corpus, de justifier toutes les analyses, par exemple en recherchant les commutations attestées et en les dénombrant, ou en évaluant la probabilité qu’une commutation non attestée soit correcte.25 En fin de compte, puisque le corpus peut s’ouvrir et que les analyses sont perfectibles, il est possible que le modèle qui en découle évolue ou soit même radicalement révisé. De ce fait, nous avons décidé de toujours privilégier l’hypothèse la plus simple en cas de doute. 25 L’ensemble des analyses fournies dans la section Analyses syntaxiques des annexes devrait
fournir une base solide à une entreprise de ce type.
59
3.2
Morphologie et syntaxe
Sachant à présent sur quelles unités nous allons travailler et les difficultés que nous allons rencontrer, nous voudrions expliquer sous quel angle il est possible d’analyser les unités. Nous délimiterons ici les domaines respectifs de la morphologie et de la syntaxe. Cette dernière sera envisagée comme un système de relations entre les constituants (→3.2.1), alors que la morphologie sera considérée comme relevant du plan de l’expression (→3.2.2). Nous verrons enfin que les constituants peuvent être des groupes de mots, des mots isolés ou des morphèmes, ce qui nous a amené à distinguer plusieurs «niveaux» dans la syntaxe (→3.2.3). 3.2.1
La syntaxe comme un système de relations
Définir la notion recouverte par le terme syntaxe n’est pas chose aisée: comme tous les concepts héritiers d’une longue tradition en linguistique et comme la linguistique ellemême, la définition du concept de syntaxe est loin d’être complètement consensuelle. L’acception que reçoit le terme doit être précisée. En l’occurrence, la syntaxe est vue ici comme un système de relations fondées sur le concept de dépendance (→3.2.1.1). La caractérisation des relations entre constituants se fait sur la base de la «relation minimale» posée par Alain Lemaréchal (→3.2.1.2). 3.2.1.1
Un système de dépendances
Qu’on compare les approches différentes de Louis Hjelmslev (1968), Lucien Tesnière (1965), André Martinet (1979) ou de Claude Hagège (1999), on sera frappé par un présupposé commun: la syntaxe est élaborée à partir d’éléments irréductibles, qui prennent la forme de structures ou de relations. L’inventaire des fonctions possibles entre deux unités de la langue que donne Louis Hjelmslev est sans doute le plus général d’un point de vue épistémologique. Il systématise ces fonctions en trois types (1968, ch. 11): la détermination, l’interdépendance et la constellation. La taxinomie des fonctions est établie sur la base du critère exclusif de la condition d’existence des unités mises en rapport (en termes hjelmsléviens, des fonctifs qui contractent la fonction). Les unités peuvent en effet être de deux types: soit elles sont la condition nécessaire d’occurrence d’une autre unité, et dans ce cas on les nomme constantes (c), soit elles ne le sont pas, et elles sont nommées variables (v). Ces définitions impliquent qu’une unité ne se définit que par son comportement vis-à-vis d’autres unités. En vertu de cette distinction, les fonctions sont définies comme suit: – une détermination met en rapport une variable et une constante; – une interdépendance met en rapport deux constantes; – une constellation met en rapport deux variables. Ces fonctions interviennent tant sur le plan paradigmatique (unités en absence, qui entretiennent des rapports désignés sous le nom générique de corrélations) que sur le plan syntagmatique (unités en présence, qui entretiennent des rapports désignés sous le nom générique de relations). Sur ce dernier plan, les relations sont:
60
– la sélection, qui est une détermination; – la solidarité, une interdépendance; – la combinaison, une constellation. Par exemple, pour un héritier de Louis Hjelmslev comme Knud Togeby (1965, 74), il y a solidarité entre une «conjonction de subordination» et une «subordonnée» en français moderne: la présence simultanée des deux constantes est la condition de la subordination. Telle qu’elle est conçue par Lucien Tesnière (1965, ch. 2 et 3) dans ses Éléments de syntaxe structurale, la syntaxe de dépendance affirme que «[l]’ensemble des mots d’une phrase constitue [. . .] une véritable hiérarchie» (ch. 2, §5), où certains mots, dits régissants commandent un ou plusieurs subordonnés. Ensemble, régissant et subordonné forment un nœud. L’auteur précise: «[T]out subordonné suit le sort de son régissant. Soit par exemple la phrase: mon vieil ami chante cette jolie chanson [. . .], si j’en renverse les éléments pour dire: cette jolie chanson charme mon vieil ami [. . .], le substantif ami, en passant de la fonction de sujet à celle de complément d’objet, entraîne avec lui les adjectifs mon et vieil qui dépendent de lui.» (ch 3, §4, italiques en grasses dans le texte).
Cette remarque exprime le principe de dépendance, que Lucien Tesnière ne définit pas, mais que Paul Garde formule ainsi: «[T]oute relation syntaxique (entre morphèmes dans le mot, entre mots dans la phrase) s’établit entre deux termes dont l’un, subordonné, dépend de l’autre, principal. Le terme principal (s’il s’agit de mots, le mot principal) est celui qui contient l’information [160] sur les rapports syntaxiques entre l’ensemble constitué par le principal et son subordonné et l’environnement de cet ensemble.» (Garde 1981, 159–160).
Termes principal et subordonné s’unissent pour, selon les termes de Lucien Tesnière, former un nœud. Le plus important des nœuds est appelé nœud des nœuds et commande tous les subordonnés, ce qui le place «au centre de la phrase, dont il assure l’unité structurale en en nouant les divers éléments en un seul faisceau. Il s’identifie avec la phrase.» (ch. 3, §15). La relation qui unit un régissant à ses subordonnés est dite relation de connexion (ch. 1); c’est cette relation de dépendance qui permet à la phrase d’exister en tant que telle, puisque toute la hiérarchie est fondée sur elle. Comparé à l’inventaire de Louis Hjelmslev, ce principe de dépendance est transposable en termes de variable et de constante. La connexion doit dès lors être comprise comme une relation entre deux termes et l’on peut la qualifier de sélection, allant du mot régi au mot régissant. Dans sa Grammaire fonctionnelle du français, André Martinet exprime cette conception: «On peut également exprimer le rapport entre un élément, le noyau, conditionnant l’apparition d’un autre, le déterminant, en disant que le déterminant est une expansion du noyau. Lorsqu’on désire seulement marquer le rapport de dépendance, on peut parler du noyau et de ses satellites.» (1979, 10, italiques en gras dans le texte).
On reconnaît, exprimées dans un cadre formel moins sophistiqué, les mêmes idées que celles de Louis Hjelmslev: il y a des constituants (les noyaux) qui sont la condi61
syntaxe @règles de dépendance et de coocurrence des unités en présence F IG . 3.7 – Concept de syntaxe
tion nécessaire à l’existence d’autres constituants (les satellites), dans un rapport fort proche de celui existant entre variables et constantes hjelmsléviennes. La classification que Claude Hagège donne dans La structure des langues, fondée sur une induction à partir des structures observées dans de nombreuses langues du monde, est également d’ordre très général: «Il n’existe que trois relations possibles, universellement, au sein de l’énoncé: la prédication, la détermination (et ses cas particuliers, la subordination et la complémentation), la coordination [. . . ]» (Hagège 1999, 34).
Claude Hagège ne donne cependant pas de définition explicite de chacune de ces fonctions — on aurait aimé que sa synthèse comprenne une définition rigoureuse de la notion de détermination. Néanmoins, nous avancerons (sans toutefois pouvoir en être tout à fait certain) que ce qu’il nomme prédication, condition d’existence de la phrase-énoncé, met en relation de dépendance réciproque les termes qui la contractent (fonction de solidarité chez Hjelmslev), alors que la détermination correspond à une sélection et la coordination à une combinaison. Nous ne pensons pas trahir la pensée de ces auteurs en affirmant que la syntaxe est généralement conçue comme un monde de relations hiérarchisées entre les unités en présence, où la hiérarchie se traduit par le fait que l’apparition de certains segments est conditionnée par celle d’autres segments dont on peut dire que les premiers dépendent (schématiquement: figure 3.7). Dans la mesure où seules les unités en présence sont abordées, limiter le domaine de la syntaxe à celui des dépendances26 des segments les uns par rapport aux autres permet de la distinguer clairement de la morphologie (→3.2.2), mais aussi d’évacuer de sa description toute considération sémantique. Par exemple, en français moderne, la «préposition» à est syntaxiquement définie par le fait qu’elle dépend d’une autre unité. De même, on peut dire sans risque de se tromper que le «sujet» et le «prédicat» dépendent l’un de l’autre, en ce sens que la relation qui les lie, la prédication, est la condition d’existence de la phrase-énoncé. 3.2.1.2
Relation minimale
En ancien français, la question de la dépendance ne s’aborde pas aussi facilement (→3.1.3.3) et il faut limiter l’interprétation. On peut, pour ce faire, tirer parti de la «relation minimale», telle qu’elle a été définie par Alain Lemaréchal (1997, 3): une relation «dont le signifiant est la simple coocurrence et le signifié un simple ‹il y a de la relation›». Cette relation, qui joue à la fois sur le plan sémantique et sur le plan syntaxique, est, nous dit l’auteur, repérable à l’aide de marques intégratives: «Comment cela peut-il fonctionner? La première condition est qu’il y ait une indication des frontières aussi bien du segment englobant que des segments englobés, ce qui relève des marques démarcatives/intégratives déjà rencontrées. Il est indispensable qu’il y ait des 26 Nous incluons également dans ce terme le sens d’interdépendance de la glossématique.
62
instructions indiquant où finit et commence un mot, un syntagme, etc.; du coup, on voit que la syntaxe ne peut faire l’impasse sur des questions d’accent, d’harmonie vocalique (et consonantique), de sandhi, de tempo, de registre de hauteur, etc., tous phénomènes qui ont, de ce fait, les caractéristiques du signe, et constituent de véritables marques; de même que les questions d’ordre des mots, fixe ou non, etc.» (Lemaréchal 1997, 103).
Cette théorie nous séduit beaucoup, et nous la ferons nôtre au prix de modifications mineures. Tout d’abord, nous préférerons constituant à segment, terme qui sous-entend la continuité des éléments qui le composent – ce qui n’est pas nécessairement le cas. Ensuite, ce qui est certainement beaucoup plus important, le medium employé dans nos chartes (voir ch. →2) n’est pas adéquat à l’expression de phénomènes prosodiques. Nous limiterons en conséquence les marques intégratives à l’indice donné par le fait que les constituants fonctionnent ensemble dans un constituant plus large, ce qui nous oblige à faire appel au sens. Pratiquement, nous commencerons par constater, sur la base de critères sémantiques,27 que certains mots fonctionnent ensemble. Par exemple, dans «[. . .] damoiselle Sybille, filhe mon saingnor Leone [. . .], vint par devant [3] nos et par devant les hommes de le Chiese Deu» (Document 1260–02–03, 2).
damoiselle Sybille, filhe mon saingnor Leone exprime l’agent du procès ‘venir’. Il y a une relation entre les contenus des constituants et il est raisonnable de dire que, puisque cette relation sémantique existe, il y a là une relation syntaxique potentielle. Il est tout aussi plausible de se baser sur cette relation pour dire que chacun des mots du constituant qui exprime l’agent entretient une relation à un niveau d’intégration inférieur à celle qui le relie au procès. Mais de ces relations syntaxiques, on ne peut encore rien dire d’autre à ce stade. Il faut donc permettre au descripteur d’indiquer qu’il existe une relation entre les mots sans statuer sur le statut hiérarchique réciproque de ces mots. Au bout du compte, la syntaxe est définissable comme l’ensemble des relations de dépendance qui existent entre les constituants, mais il n’est pas nécessaire de qualifier le type de dépendance pour affirmer qu’il y a dépendance. Face à une structure qu’on peut analyser en constituants immédiats, au sens traditionnel,28 sans postuler de hiérarchie a priori, nous pouvons dire, en suivant Alain Lemaréchal, que la structure est formée de ses constituants immédiats et d’une relation minimale qui les lie; ce qui peut être représenté comme dans la figure 3.8.29 Cela nous permet de formaliser le concept de constituant immédiat (désormais CI, figure 3.9) et, réciproquement, celui de relation (figure 3.10).
27 Voir →3.4.2.1 pour les principes suivis au niveau de l’organisation des constituants autour du
verbe (syntaxe argumentale, →3.2.3.1). Le niveau de la construction des syntagmes (qu’on dira immédiat, →3.2.3.1) est singulièrement plus compliqué (→3.4.7.3 et →3.4.7.4). 28 C’est-à-dire celui proposé par Leonard Bloomfield (1970, 153), que Henry-Allan Gleason (1969, 109) formule de manière limpide: «Un constituant immédiat (abréviation courante C. I.) est un des deux (ou plus de deux) constituants qui forment directement une construction donnée.» 29 Cette schématisation correspond à celle qu’en fait Alain Lemaréchal (1997, 126); nous ne nous sommes permis que des modifications d’ordre esthétique.
63
[constituant immédiat]
relation
[constituant immédiat]
F IG . 3.8 – Représentation de la relation minimale
constituant immédiat (CI) @unité linguistique en présence @contenue dans une structure plus large qu’il sert à construire directement @contractant une relation avec un autre CI de même niveau F IG . 3.9 – Concept de constituant immédiat
relation @dépendance ou coocurrence à l’intérieur d’une structure englobante @implique au moins deux constituants immédiats F IG . 3.10 – Concept de relation
3.2.2
La morphologie et le système de marques
Nous voyons donc la syntaxe comme un système de dépendances et de coocurrences entre constituants. La question qui se pose dès lors est de savoir comment ces relations sont exprimées. L’opposition saussurienne entre expression et contenu distingue la syntaxe de la morphologie, relégant cette dernière au domaine des marques (→3.2.2.1). Mises en rapport avec la relation minimale, les marques lui apportent un surcroît d’information, qu’Alain Lemaréchal nomme spécification (→3.2.2.2). 3.2.2.1
Expression et contenu
Depuis ses débuts en tant que science30 autonome, la linguistique distingue les plans du contenu et de l’expression. Le signe saussurien en est la première application explicite (Saussure 1967, 97 sqq.). La reformulation de Louis Hjelmslev (1968, ch. 13) formalise ensuite la distinction: il est à présent fort commun de dire qu’il faut éviter de confondre le plan de l’expression et le plan du contenu (qui ne peut être atteint que de manière médiate). On n’aura donc aucune peine à bien distinguer les deux plans fondamentaux: celui du contenu et celui de l’expression de ce contenu. Dans ce second plan, on trouve par conséquent toutes les marques qui servent à exprimer un contenu syntaxique. Ces marques ne sont ainsi pas des relations (des faits de syntaxe), mais un des moyens de les projeter sur le plan de l’expression. Dans le cadre du syntagme verbal, Gilbert Lazard (1994, 1) énumère ces marques:31 «Les relations entre le verbe et les termes nominaux sont indiquées par plusieurs procédés, souvent employés simultanément. Les uns sont des morphèmes relateurs, ordinairement affixés au nom ou situés dans leur voisinage. D’autres, indices actanciels généralement intégrés à la forme verbale, sont en coréférence avec certains termes nominaux. En outre, dans 30 Ou «proto-science» dirait Gilles-Gaston Granger, cf. Lazard 1999a, 68. 31 Voir aussi Lemaréchal 1997, 123.
64
beaucoup de langues l’ordre des termes joue un rôle fondamental. Certaines connaissent des formes plus ou moins poussées de coalescence entre terme nominal et verbe.»
Les marques d’expression sont au moins de trois ordres: morphologique (flexion, emploi d’adpositions, phénomène d’accord et de rection), séquentiel (ordre des constituants) et lexical (phénomènes de figement, qui impliquent une modification des propriétés transformationnelles32 ). À cela, on ajoutera l’intonation, qui sert également à exprimer les relations, mais aussi l’intégration du constituant à une construction plus large (Lemaréchal 1997, notamment 123). Il n’y a bien entendu aucune raison que ces types de procédés soient employés exclusivement pour marquer les relations entre le noyau verbal et les termes nominaux. Dès lors, traiter les marques d’expression segmentales et leur contenu sans les distinguer nettement est d’autant plus absurde que ces procédés segmentaux sont en concurrence, ou plutôt en superposition, avec les autres procédés.33 3.2.2.2
Marques et spécification
Les relations syntaxiques sont donc exprimées par des marques. Voyons comment ces dernières s’articulent autour de la relation minimale. Si l’on reprend les vues qu’Alain Lemaréchal a exposées dans Zéro(s) (1997), les marques sont des contraintes qui s’ajoutent à la relation minimale pour la spécifier, c’est-à-dire en préciser la valeur sémantique;34 par exemple, dans: «li abbesse [4] et li covens [. . .] ont doneit a trecens a Ja-[5]-kemin le Rotial [. . .] .» (Document 1260–02–21b, 3).
la marque segmentale facultative a spécifie la relation entre ont doneit et Jakemin et fait de ce dernier le bénéficiaire.35 Selon Alain Lemaréchal, les marques sont hiérarchisées (122–123): en particulier, il considère que les marques intégratives ou démarcatives sont toujours présentes et que les marques séquentielles et catégorielles s’y superposent. Dans cette vision des choses, les marques segmentales viennent se greffer, en dernier lieu, aux marques catégorielles. Ce qui importe surtout, c’est que ce sont les marques intégratives qui révèlent la relation minimale et que les autres types de marques ne font que s’y ajouter. La spécification est une surimpression des marques. La préexistence de la relation minimale suppose que toute contrainte supplémentaire se superpose à ce «bruit de fond cosmologique» (Lemaréchal 1997, 107). Par conséquent, celui qui repère une spécification repère forcément une relation minimale du même coup. On peut ainsi relativiser ce qui a été dit plus haut (→3.2.1.2): il n’y a pas que la sémantique qui permette de repérer une relation minimale. On peut se servir
32 Voir notamment Gross 1996, 12–13. 33 Voir Lemaréchal 1983, où l’auteur montre que c’est la superposition de ces marques qui
permet de lever l’ambiguïté posée par les marques segmentales «homonymes». 34 Cf. Lemaréchal 1997, en particulier 107–114. 35 Nous étudions le phénomène ci-dessous (→3.4.4.2).
65
spécification
[constituant]
relation
h i mot spécifiant reste du constituant
F IG . 3.11 – Représentation de la spécification
[ont doneit]
h
[a] Jakemin. . .
i
F IG . 3.12 – Structure de ont doneit a Jakemin. . . fonctions syntaxiques @au moins un terme est un constituant relation @les termes sont des constituants
spécification @un terme est une relation
F IG . 3.13 – Types de fonctions syntaxiques suivant les termes reliés
des catégories véhiculées par les segments (phénomènes d’accord) pour la mettre en évidence.36 Lorsqu’elle est segmentale, nous représenterons la spécification par une flèche grisée pointant non vers un constituant, mais vers une relation (figure 3.11). Dans notre exemple, la relation est spécifiée par a, qui reste un constituant de a Jakemin (→3.4.6.3), comme représenté dans la figure 3.12. Ce que le schéma montre bien, c’est que le mot a, qui spécifie la complémentation, n’a de valeur qu’en présence de cette dernière. La spécification est ainsi une fonction seconde, contractée par un constituant (si la marque est segmentale) et une autre fonction. Il serait utile de réserver le terme relation aux fonctions premières, qui relient par contre deux constituants. On schématisera cela par la figure 3.13. 3.2.2.3
Des marques qui n’expriment pas que des relations
D’autre part, l’analyse est légèrement compliquée par le fait que les marques, lorsqu’elles sont segmentales, «indiquent non seulement les relations entre les mots, mais aussi les catégories grammaticales et les types énonciatifs» (Feuillet 1988, 72). La phrase «li veskes et li cuens i [= à la charte] ont pendut lors sayaus.» (Document 1236–12–15, 12).
est analysable facilement grâce aux désinences casuelles, qui indiquent en même temps la catégorie du nombre. En termes traditionnels, li veskes et li cuens sont tous 36 Dans les cas de discontinuité, cela est même fondamental. Les langues comme le latin ou
le sanscrit ne requièrent pas la continuité des constituants du syntagme: pour y retrouver les relations minimales, on est obligé de passer par une analyse des marques synthétiques (donc segmentales).
66
deux des «sujets» au singulier, alors que lors sayaus est un «complément d’objet direct» au pluriel. On sait qu’en ancien français, la présence d’un -s à la fin d’un «nom» masculin indique conjointement son nombre (catégorie) et la relation qu’il entretient avec les autres unités (ici, le verbe). L’amalgame des marqueurs segmentaux fusionne indications de relations et de catégories et oblige à poser marqué + marqueurs morphologiques comme analyse du mot, puis à distinguer les marques en fonction du type de contenu qu’elles véhiculent (catégories ou relations). 3.2.3
Niveaux d’analyse syntaxique
Intuitivement, on voit bien que toutes les relations de dépendance ne sont pas du même ordre: certaines relations semblent fondamentales et permettent à l’énoncé d’exister, d’autres jouent à un niveau inférieur. Nous verrons tout d’abord comment Gilbert Lazard présente cette distinction entre les niveaux d’analyse syntaxique sous la forme d’une tripartition (→3.2.3.1). Nous mettrons ensuite la question des marques en rapport avec cette division en trois niveaux (→3.2.3.2). 3.2.3.1
Tripartition de la syntaxe selon Gilbert Lazard
Les dépendances ne jouent pas toutes au même niveau. Dans un article nommé La distinction entre nom et verbe en morphologie et en syntaxe (1984), Gilbert Lazard disait: «On peut donc se représenter la morphosyntaxe comme un continuum dont l’une des extrémités couvre les séquences les plus courtes, l’autre, disons, la proposition bien entendu, cette dernière limite est arbitraire: on peut considérer des séquences plus longues, phrase complexe et même ensembles supérieurs à la phrase, mais ce n’est pas nécessaire pour notre propos. Par définition, ce continuum ne se divise pas en parties bien distinctes. Il est cependant pratiquement nécessaire d’y définir approximativement des zones. Il est commode d’en distinguer trois: 1) la morphologie: ce terme entendu ici dans son sens traditionnel, comme l’étude des unités et de leurs combinaisons à l’intérieur du ‹mot›; ce dernier terme est lui-même bien difficile à définir précisément, mais il représente dans beaucoup de langues une réalité indéniable, même si ses contours restent un peu flous; 2) la syntaxe ‹immédiate›: c’est celle du syntagme, au sens ordinaire du terme, c’est-à-dire celle qui étudie les combinaisons du mot avec ses satellites; 3) la syntaxe de proposition ou ‹phrastique›: elle décrit la nature et les rapports du prédicat et des actants (et des circonstants).»
Cette partition délimite les domaines respectifs d’une syntaxe dite de mot (que Gilbert Lazard nomme, non sans une inévitable ambiguïté, morphologie), une syntaxe immédiate et une syntaxe de phrase, que nous préférons dire argumentale.37 La première concerne les relations entre les formants des mots, la deuxième celles entre les constituants immédiats du syntagme, la troisième les relations entre les constituants immédiats des propositions.38 Cette dernière est fondamentale, puisqu’elle permet l’ex37 Voir la distinction entre phrase et énoncé (→3.4.1.2). 38 Voir →3.4.2 sur la distinction entre phrase-énoncé et proposition.
67
syntaxe @règles de dépendance et de cooccurrence des unités en présence s. de mot @entre les CI du mot
s. immédiate @entre les CI du syntagme
s. argumentale @entre les CI de la proposition
F IG . 3.14 – Types de syntaxe
pression d’un procès et de ses participants au travers du prédicat et de ses arguments; elle fonde l’énoncé, lui pourvoyant simultanément les caractères @unité linguistique complète et @transmet un message. Adoptant cette tripartition, nous pensons que le concept de syntaxe que nous avons défini plus haut doit être subdivisé (figure 3.14). De cette façon, la formation de droiture (Document 1236–07, 7) ou tresfons (Document 1236–07, 3) par affixation d’une base est un fait relevant de la syntaxe de mot, alors que la combinaison de ces unités avec un mot comme lor est un fait de syntaxe immédiate: «[N]os aiderons le vesque et l’eglise de lor droitures a maintenir [. . .]» (Document 1242–05–02, 10).
Les relations qui unissent nos et le vesque à aiderons relèvent quant à elles de la syntaxe argumentale. 3.2.3.2
Des marques à tous les niveaux
Considérons exclusivement les marques de relations: si la partition de la syntaxe en trois zones est légitime, la langue doit fournir les moyens d’exprimer les relations dans ces trois zones. Nous nous attendons donc à trouver des marques: 1/ qui explicitent la formation des mots; 2/ qui indiquent les relations immédiates; 3/ qui indiquent les relations argumentales. a. Syntaxes argumentale et immédiate. Le fait qu’une unité soit accordée à une autre peut relever de la syntaxe immédiate, – comme c’est le cas dans lors sayaus ci-dessus –, ou de la syntaxe argumentale – comme dans nos aiderons. . . dans l’exemple abordé. Toute marque est susceptible de jouer simultanément à ces deux niveaux de syntaxe. Il faudra donc être attentif à ces superpositions. Ainsi, dans la phrase suivante, «[N]os volons ke ces choses soient estaules [. . .]» (Document 1242–05–02, 18).
la marque du pluriel présente dans choses est impliquée dans la relation immédiate qui lie ce mot à ces et contribue également à exprimer la relation (de syntaxe phrastique) qui existe entre choses et soient: le fait que ces deux mots s’accordent indique qu’ils fonctionnent ensemble. b. Syntaxe de mot. Au niveau de la syntaxe de mot, le phénomène est différent. Comme c’est le cas pour le français moderne (Soutet 1998, 5), il nous semble qu’en ancien français, les constituants du mot n’entretiennent de relation syntaxique directe qu’avec le reste du mot qu’ils servent à former. En conséquence, la seule cooccurrence d’une base (ou d’un radical, ou d’un thème) avec une désinence qui lui est compatible 68
suffit à marquer la relation syntaxique qui les unit pour former le mot. On ne trouve à ce niveau que des relations minimales. Cette désinence marque parfois d’autres relations syntaxiques que le mot entier entretient avec d’autres constituants, mais ces considérations ne relèvent plus des procédés de combinaison des constituants: si on évalue une marque du point de vue de sa valeur, on cesse de la voir comme un constituant. Ainsi, dans l’exemple ci-dessus, la marque segmentale -s à la fin de choses entretient une relation avec chose (syntaxe de mot), mais à ce niveau, elle ne fait que fonctionner avec le reste du mot, rien de plus.
3.3
Parties du discours
La section précédente a montré qu’il était possible de séparer d’un côté, les considérations sur la construction des mots et la manière dont les marqueurs véhiculent les catégories qui leur sont inhérentes; de l’autre, la manière dont les mots entrent en relation sur l’axe syntagmatique, ainsi que les moyens formels employés pour marquer ces relations. Nous considérerons comme résolues les difficultés posées par le fait que les marqueurs fonctionnent à ces deux niveaux et décrirons ici la manière dont nous concevons la construction du mot. De l’avis de Jack Feuillet,39 la littérature sur les «parties du discours» est abondante et les tentatives de définition sont dans l’ensemble toujours inabouties, si bien que l’on songerait à abandonner un concept aussi flou, qui amalgame des considérations morphosyntaxiques et sémantiques sans réellement les distinguer nettement: on s’échine tant bien que mal à classer des mots. Les critiques ainsi adressées aux principaux essais de classement paraissent tout à fait fondées. Toutefois, bien que Jack Feuillet propose de renoncer à classer les mots et de se focaliser plutôt sur les grands constituants,40 nous devons classer les mots avant d’entamer (→3.4) l’analyse déductive: il apparaîtra ultérieurement que certains d’entre eux constituent de véritables pivots pour la description de la syntaxe immédiate et de la syntaxe argumentale. En premier lieu, nous verrons succinctement ce qu’on peut reprocher aux démarches de classement qui mélangent les points de vue exposés précédemment (→3.3.1) et pourquoi un classement exclusivement syntaxique, à la base duquel on trouve les conceptions de Lucien Tesnière, n’est pas réalisable (→3.3.2). Enfin, nous montrerons comment nous avons tiré parti de la manière dont la syntaxe de mot et la sémantique (au niveau des catégories exprimées) s’articulent pour élaborer le classement retenu (→3.3.3). 3.3.1
L’impasse de la voie traditionnelle
Si l’on se borne à suivre les critères de la grammaire traditionnelle, la définition des parties du discours se fait sur une base éclectique, qui mélange sans uniformité les critères de points de vue hétérogènes – principalement les points de vue morphosyn-
39 Voir entre autres sa conclusion (1988, 71–75). 40 C’est la position qu’il défend dans Feuillet 1983; Feuillet 1988.
69
taxique et sémantico-référentiel (voir p. 53). Le fait est bien connu et l’on reprendra simplement les observations de Jack Feuillet: «Un des traits les plus remarquables de cette analyse est l’utilisation de critères différents pour définir les constituants: le nom est ‹le mot qui sert à désigner, à ‘nommer’ les êtres animés et les choses [. . .], non seulement les objets, mais encore les actions, les sentiments [etc.]› (Grevisse 1969, 172), le verbe ‹est le mot qui exprime soit l’action faite ou subie par le sujet, soit l’existence ou l’état du sujet, soit l’union de l’attribut au sujet› (Grevisse 1969, 533) [. . .] On a affaire ici à des définitions de type notionnel, alors que pour le pronom (qui remplace le nom), l’adjectif (qui accompagne le substantif) [etc.], on a des définitions de type fonctionnel qui se distinguent des définitions de type positionnel utilisées pour la préposition (‹placée devant› le substantif) [. . .].» (Feuillet 1988, 61, typographie modifiée).
Un tel classement ne peut servir de base à des dépouillements systématiques, parce qu’il ne permet pas de déterminer avec exactitude en quelle proportion les phénomènes observés au niveau du verbe ou du nom, par exemple, sont comparables. De plus, d’un point de vue plus pratique, il laisse une grande latitude à l’intuition de l’analyste (un nom peut également exprimer une action. . .) et se révèle très difficile à mettre en œuvre dans le cadre d’un balisage exhaustif. Faute de cadre rigoureusement défini, le point de vue sémantico-référentiel mène à des résultats peu fiables. 3.3.2
L’impasse de la voie syntaxique
Il est donc essentiel de choisir un critère et de s’y tenir pour arriver à un classement consistant. Le critère qui paraît le plus rigoureux est d’ordre syntaxique. Pour les linguistes qui l’adoptent, les lexèmes peuvent être classés en fonction de l’information – stockée dans le lexique – qui concerne leurs compatibilités syntaxiques (Feuillet 1988, 67–68). C’est la perspective de Lucien Tesnière (1965) et, à sa suite, de Paul Garde (1981) et d’Alain en particulier Lemaréchal (1989). Lucien Tesnière et les partisans de son modèle considèrent que les lexèmes possèdent intrinsèquement des compatibilités avec d’autres lexèmes, qui leur permettent de fonctionner automatiquement avec ces derniers (principe de connexion, →3.2.1); par exemple, un adjectif et un substantif mis en présence l’un de l’autre contracteraient automatiquement une connexion. Cette théorie de la connexion va de pair avec celle de la translation, qui permet, à l’aide d’autres mots ou morphèmes que Lucien Tesnière nomme translatifs, à des mots qui ne sont pas compatibles41 de contracter néanmoins une connexion.42 Il affirme que dans le livre d’Alfred, si le substantif Alfred est capable de se connecter à livre, c’est parce qu’il a été transféré en adjectif.43 Suivant le modèle tesniérien, Paul Garde classe ainsi les parties du discours du russe par rapport aux relations de dépendance qu’elles peuvent entretenir.44 Établir 41 Il y a «changement de nature syntaxique» (Tesnière 1965, ch. 151, §19). 42 Lucien Tesnière ne limite pas la translation à un phénomène marqué par un segment. Il peut
y avoir translation sans translatif (1965, ch. 162, §1). Cela pose le problème méthodologique des marques ø, sur lequel on ne s’attardera pas ici. 43 Voir cependant Lemaréchal 1989, 129–138 pour une révision de cette analyse, présentée synthétiquement p. 126 ci-dessous. 44 Voir supra (→3.2.1.1) la définition de la dépendance dans la conception de Lucien Tesnière et de ses continuateurs.
70
le classement sur ce principe implique cependant qu’on puisse toujours se prononcer sur le statut des constituants (principal ou subordonné) et qu’on ait connaissance de cette «information sur les rapports syntaxiques» contenue dans le principal. Or, le discernement est loin d’être évident pour l’ancien français (→3.1.3.3). La voie syntaxique, surtout si elle fait appel à la théorie des translations, n’est pas adéquate pour traiter le corpus préalablement à une analyse des relations. Elle suppose en effet une vue d’ensemble des rapports entre les mots en présence, vue qui n’est pas accessible à ce stade. Nous devons donc renoncer à cette voie pour éviter la circularité du raisonnement. 3.3.3
Catégories sémantiques grammaticalisées et syntaxe de mot
Pour disposer d’une base de travail qui serve à construire un modèle des relations syntaxiques entre les mots sans faire appel à ces dernières, le seul moyen de procéder est de décrire les mots du point de vue de leur formation, et selon les morphèmes qui les composent. Si l’on se résout à ne faire usage que des informations livrées par les lexèmes en dehors de toute intégration syntaxique, il faut, dans la mesure du possible, faire abstraction des contextes dans lesquels ils sont rencontrés pour se focaliser sur le contenu sémantique de leurs formants. La description se limite ici à la manière dont certains contenus sémantiques abstraits sont exprimés de manière systématique (c’està-dire les catégories grammaticales). Nous exploiterons donc le critère morphologique. Le plus gros reproche qui pourrait lui être fait est qu’il mène à une taxinomie qui «ne saurait prétendre à l’universalité»:45 «Le principe morphologique, consistant à grouper ensemble les mots ayant un même type de flexion, est incompatible avec l’universalité, puisqu’il ne peut s’appliquer aux langues qui ont une flexion peu développée ou inexistante.» (Garde 1981, 158).
Néanmoins, à cet égard, quel que soit le point de référence choisi, aucun classement ne pourrait être valable pour toutes les langues. André Martinet (1979, §1.12) le confesse à propos de sa tentative distributionnelle, mais cette limite pourrait également être valable pour un classement syntaxique: «Les classes de monèmes ressemblent à ce qu’on désignait traditionnellement comme les ‹parties du discours›. En renonçant à ce terme, nous marquons simplement qu’il n’y a pas de parties du discours valables pour toutes les langues, et qu’il faut, pour chacune d’elles, distinguer les classes en fonction de leurs compatibilités particulières.»
La classique définition différentielle de la valeur des membres du système46 rend impossible toute tentative de classement universel. Quelle que soit l’optique choisie, seuls les critères de description peuvent revêtir un caractère général: lié au point de vue morphosyntaxique, le classement en parties du discours est forcément propre à la langue décrite – ce qui n’exclut pas que certaines langues puissent avoir des inventaires de parties du discours assez proches. 45 Comme le dit Jack Feuillet 1988, 64, qui mentionne l’avis de Paul Garde, cité ici. 46 Cf. Saussure 1967, 158–162.
71
Sur les bases choisies, nous rangeons les mots en trois grandes classes distinctes: celle des verbes (→3.3.3.1), celle des noms (→3.3.3.2) et celle des adverbes (→3.3.3.3). 3.3.3.1
Verbes
D’après Jack Feuillet (1988, 84), les catégories que sont le temps, le mode et l’aspect doivent, d’un point de vue général, être considérées comme portant sur l’ensemble de la phrase-énoncé plutôt que sur un de ses constituants en particulier – dans une optique de description déductive. Pour l’ancien français, ces catégories sont toujours morphologiquement rattachées à un mot qui en supporte obligatoirement les marques.47 Par commodité, on désignera ce mot du nom de verbe.48 Par exemple, dans la phrase: «La afaita Werris [. . .] a sangor Arnult [. . .] ii verges 1267–10–29, 6).
[7]
et demie d’aluez» (Document
le mot afaita supporte les marques morphologiques (amalgamées dans sa désinence) qui situent dans le passé le procès exprimé, et permettent également de dire qu’il s’agit d’une action ponctuelle assumée comme «réelle» par l’énonciateur. Aucune autre unité de l’énoncé ne le permet: même si certains mots comportent des informations similaires (le mot la à l’initiale pose le cadre temporel autant que le cadre spatial), ces mots n’expriment pas ces contenus au moyen de marques morphologiques systématiques. Par conséquent, le verbe s’oppose au non-verbe par la présence obligatoire d’une désinence exprimant ces catégories de temps, mode et aspect, les catégories verbales. Suivant ce modèle, il n’est pas possible de rencontrer un verbe sans qu’il soit porteur de ces informations. Qu’on ait affaire à des modes «personnels» ou à des formes dites «nominales» du verbe (participe et infinitif), on constate qu’il véhicule ces mêmes catégories. Il est vrai que l’opposition entre le présent et le passé ne doit pas être appliquée sans précaution aux autres modes que l’indicatif,49 mais quel que soit le mode, les catégories verbales expriment toujours une position temporelle par rapport à un repère du même ordre, ainsi que la manière dont le procès est ou non actualisé. Par ailleurs, ces modes «nominaux» s’opposent aux «déverbaux» par leur caractère systématique: tous les verbes peuvent être mis au participe ou à l’infinitif, alors que les dérivations par des suffixes comme -able, -tion ne sont pas prévisibles (elles relèvent du lexique). Cela oblige à poser une distinction fondamentale entre des formes comme paiable 47 Nous ignorons ici les cas de coordination, qui impliquent que plusieurs mots comportent des
morphèmes grammaticaux coréférents à ces mêmes catégories (→3.4.7.2). 48 Le fait semble fort répandu, si l’on en croit David Cohen (1989, 264), qui n’hésite pas à
proposer, d’un point de vue général: «Le verbe, conjonction de phrase, en tant qu’il est le lieu où se manifeste la relation prédicative, tend à être chargé des morphèmes généraux de la phrase et se manifester ainsi, éventuellement, dans des formes marquées comme ‹aspectives›, ‹temporelles›, ‹diathétiques›, ‹personnelles›, etc.» Voir en outre Cohen 1989, 53. 49 Voir Wilmet 2003, § 374s., spéc. § 374 et 377.
72
(Document 1259–05, 4) et paier (Document 1259–01–16, 6), la première ne comportant pas de morphèmes exprimant des catégories verbales. Le modèle ne se prononce pas sur le statut des morphèmes constitutifs pris isolément. L’équivalence des environnements – les deux formes peuvent avoir un complément qui commence par le mot a et qui précise la valeur sémantique du complément comme celui du bénéficiaire, voir sous 3.4.4.2 –, est un phénomène touchant le lexique et la syntaxe qu’il n’est pas du ressort du présent classement d’expliquer.50 Cette première classe correspond donc exactement à la classe traditionnelle des verbes, dont les grammairiens décrivent la flexion («conjugaison»).51 Nous aurons l’occasion de constater que cette propriété morphologique du verbe, qui le place au centre de la proposition, est une base opératoire très utile pour commencer l’analyse des relations (→3.4.1.2). 3.3.3.2
Noms
Parmi les non-verbes, certains lexèmes sont capables de véhiculer les marqueurs exprimant les catégories du genre et du nombre. Ces catégories sont plus faciles à rattacher aux mots que les catégories verbales. Même chez les plus réticents à partir des unités les plus petites, on constate que «le genre est une propriété de la base» (Feuillet 1988, 96),52 alors que le nombre est une catégorie qui se manifeste souvent de manière discontinue, sur plusieurs mots. Ces catégories sont dites catégories nominales et les non-verbes qui sont susceptibles de les véhiculer sont des noms. Notons que le fait de supporter pareilles catégories n’est pas l’apanage de ces derniers, et que les formes dites «participiales» des verbes peuvent également les exprimer. Nous poserons trois questions importantes au sujet de la classe des noms: (a) qu’en est-il de la flexion casuelle? (b) peut-on parler de «pronoms»? (c) peut-on distinguer le «substantif» de l’«adjectif»? a. Flexion casuelle. Le cas «n’est pas une catégorie» (Feuillet 1988, 97). En effet, la variation morphologique casuelle n’indique pas un contenu sémantique descriptible en dehors de toute relation contractée sur le plan syntagmatique. Par exemple les occurrences de homme dans les phrases suivantes «[. . . ] je Lowis Naveaz, [. . .] et li autre homme de_le Cize Deu faisons kenoiestre verité» (Document 1260–02–21a, 1). «Johans, archeprestres de Liege, a la requeste des hommes [. . .] de_le Chize Dehui [. . .] avons pendut a ces lettres presentes nostre saial » (Document 1260–02–21a, 18).
sont toutes deux des masculins pluriels, la différence de contenu ne s’envisage que par rapport aux relations que le mot entretient avec son entourage.53 Néanmoins, même 50 Voir les réflexions sur le parallélisme entre le niveau argumental et le niveau immédiat, à la
fin de →3.4.6.1 a et →3.4.6.1 b. Pour les problèmes que ce parallélisme pose, →3.4.7.1. 51 Voir, par exemple, Moignet 1988, 52–81. 52 Comme les catégories que l’auteur dit «d’espèce», comme animé/inanimé, humain/non hu-
main, qui ont peu d’implication pour l’ancien français. 53 Dans la mesure où la syntaxe est la forme linguistique d’expression de ce procès, on pourra
tirer profit de la flexion casuelle pour caractériser les relations, voir l’exposé sous →3.4.2.2.
73
s’il n’est pas une catégorie, le cas reste une propriété morphologique et peut être mis à contribution pour affiner le classement. b. Statut du «pronom». De fait, les mots qui acceptent la flexion casuelle sont de plusieurs sortes: ils peuvent suivre des paradigmes différents («déclinaisons»), que les grammaires de l’ancienne langue distinguent et énumèrent.54 Ce n’est pas le lieu de se prononcer sur les éventuelles «lacunes» ou «faiblesses» du système casuel en ancien français et sur son hétérogénéité. Il est plus utile de constater simplement que les noms ont, de ce point de vue, un potentiel expressif plus ou moins riche; certains noms permettent l’expression de plus de deux cas: les «pronoms personnels de la troisième personne» et les «pronoms relatifs». On réservera ici le terme pronom (Pn) à ces noms dont le paradigme permet la distinction de plus de deux cas – ce qui exclut je, tu, nos et vos.55 Nous tirerons parti de cette richesse flexionnelle pour analyser la construction de la proposition autour du verbe (→3.4.2.2 a). c. Distinction «substantif» vs «adjectif». D’autre part, nous préférons ne pas distinguer ici une éventuelle classe des «adjectifs» et une classe de «substantifs» par rapport à leurs compatibilités syntaxiques (avec le mot «intensifieur» trés, par exemple, qui obligent à parler d’«adjectifs substantivés»56 ) ou sémantiques. En ce qui concerne la taxinomie présentée, la distinction de classe ne serait justifiée que si elle était fondée sur un critère morphologique: les «adjectifs» seraient des noms acceptant deux genres, alors que les «substantifs» n’en accepteraient qu’un seul. On serait alors forcé d’admettre que les quelques «substantifs» qui possèdent ce potentiel, comme la paire marchise et marchis sont des «adjectifs», comme le montre l’extrait suivant: «Je, Ermesens, contesse de Lucemborg et de_La Roche et marchise d’Erlons, et je, Hanris, ses fiz, cuens [2] de Lucemborg et marchis d’Erlons, fasons conissant [. . .]» (Document 1243–07–09, 1).
Mieux vaudrait, dans ces conditions, opter pour une autre terminologie, qui mettrait en évidence la distinction.57 Nous trouvons raisonnable de distinguer les pronoms des autres noms, mais il ne nous a pas paru nécessaire d’affiner davantage le classement. 3.3.3.3
Adverbes
Ce classement laisse un groupe qui se caractérise négativement par le fait qu’il n’est porteur ni de catégories verbales, ni de catégories nominales; les unités de ce groupe seront nommées adverbes. On conviendra qu’il ne faut pas traiter ici le problème des unités que l’on désigne sous les noms de «prépositions» et «conjonctions»: en vertu de la définition choisie, 54 Voir, par exemple, Wagner 1974, 91–107 ou Moignet 1988, 17–27. 55 Cela exclut les pronoms au sens d’Émile Benveniste (1946), qui les classe suivant un critère
sémantique. 56 Ou même l’inverse. . . voir Buridant 2000, §70 pour un exemple flagrant. 57 Par exemple, noms monogenres (comme homme), épicènes (comme afr. tel ou grand) et
bigenres (comme afr. petit ou marchis).
74
partie du discours @lexème @définie par des marques flexionnelles verbe @catégorie verbale
non-verbe @sans catégorie verbale
nom @catégorie nominale
non-pronom @paradigme pauvre
adverbe @sans catégorie nominale
pronom @paradigme riche
F IG . 3.15 – Types de parties du discours
il s’agit bien d’adverbes,58 puisqu’ils n’expriment ni des catégories verbales, ni des catégories nominales. Or, les distinguer des autres adverbes ne pourrait se faire que sur des bases syntaxiques et distributionnelles, ce qui n’est pas le propos d’un classement morphologique. Il va sans dire que le foisonnement des valeurs sémantiques véhiculées par les adverbes ne sera pas abordé ici.59 3.3.4
Synthèse
a. Hiérarchie des concepts. Nous avons donc défini les classes morphologiques de l’ancien français des chartes, que nous nommons parties du discours, par la hiérarchie conceptuelle de la figure 3.15. b. Reclassement des «parties du discours» traditionnelles. En accord avec ce classement, nous rangeons les parties du discours traditionnelles (mentionnées entre guillemets) comme suit. La classe des verbes contient les «verbes» traditionnels, ce qui exclut les déverbaux par dérivation. La classe des pronoms rassemble les «pronoms» personnels de la troisième personne et les relatifs, ce qui exclut tous les autres «pronoms», qu’ils soient personnels (je, tu,. . .), possessifs (mien, tien, sien,. . .), démonstratifs, (cest, cel, etc.) ou indéfinis (autre, certain, etc.). Parmi les noms qui ne sont pas des pronoms, nous trouvons les «substantifs» et «adjectifs» (en ce compris les déverbaux comme paiable), ainsi que tous les «pro58 À ce propos, Jack Feuillet (1983, 25) déclare: «le critère morphologique n’est pas non plus
satisfaisant: certaines langues ‹isolantes› n’auraient plus qu’une seule partie du discours; le français réunirait dans une classe unique adverbes, conjonctions, prépositions et interjections.» Mais quel problème y a-t-il à cela? On peut très bien classer les unités d’un point de vue morphologique, puis d’un point de vue syntaxique. Il est normal que les descriptions ainsi focalisées regroupent en une seule classe des unités dont on perçoit intuitivement la disparité. L’erreur serait de vouloir d’emblée mélanger les critères. 59 Voir →3.4.4.4 et →3.4.6.3. D’un point de vue syntaxique, les prépositions et conjonctions sont liées à des fonctions particulières.
75
noms» qui n’entrent pas dans la classe précédente, mais comportent des marques de genre et de nombre (ce qui exclut en, ici, la, etc.). Quant aux adverbes, ils regroupent les traditionnels «adverbes» (alors, pourtant, etc.), mais aussi les «prépositions» (de, a, etc.) et «conjonctions» (se, quand, ou, etc.) qui n’entrent pas dans la classe des pronoms (comme le relatif qui). La classe comprend également les «adverbes pronominaux», auxquels nous avons refusé le statut morphologique de pronom. c. Nécessité de la mise en contexte. La classification des lexèmes «en langue» reste cependant impossible à réaliser sans observer les faits de discours et sans opérer des commutations. Ce sont les phénomènes d’accord qui, à cet égard, sont les plus révélateurs. Ainsi, les catégories supportées par un mot ne portant pas de désinence peuvent être décelées quand il est accordé avec d’autres mots. Par exemple, le mot pais est «indéclinable», mais une attestation du type «le60 pais ki est faite entre mon signor le veske de Liege [. . .] et Waleran» (Document 1237–09–16, 2).
permet de constater (par l’accord du participe passé de faire) que pais supporte en l’occurrence les catégories du féminin et du singulier et est donc un nom et non un adverbe.
3.4
Description analytique de l’ancien français des chartes
Poursuivons notre analyse à partir des unités «données» (→3.1.2). Après avoir classé les mots et la manière dont ils sont construits, essayons de comprendre comment les textes fonctionnent, en descendant progressivement dans la hiérarchie des structures pour revenir au mot. Nous aurons ainsi, par une démarche déductive, examiné les relations à tous les niveaux entre nos deux unités de base, qui constituent les bornes de l’analyse présentée dans cette section. C’est à Louis Hjelmslev que l’on doit la formulation limpide du principe d’analyse déductive (ou analytique) en linguistique: «Le seul procédé possible pour dégager le système qui sous-tend ce texte61 est une analyse qui considère le texte comme une classe analysable en composantes; ces composantes sont à leur tour considérées comme des classes analysables en composantes, et ainsi de suite, jusqu’à exhaustion des possibilités de l’analyse. [. . .] La linguistique contemporaine [. . .] a désigné ce procédé, et d’autres plus [22] ou moins analogues, du terme de déduction.» (Hjelmslev 1968, 21–22).
La première subdivision du texte, ainsi que toutes les divisions ultérieures, consistent en l’inventaire des unités de niveau hiérarchique directement subordonné. Les unités résultant de chaque division ont un statut similaire par rapport à cette dernière. Si le découpage du texte isole des énoncés, tout segment résultant de cette division devra être considéré comme un énoncé. Pratiquement, cela signifie qu’il n’est 60 En dialecte liégeois, dont la scripta laisse parfois paraître des traits (Remacle 1948), l’«article
défini» est épicène. 61 C’est-à-dire celui qui est ‹donné› au linguiste (→3.1.2.1).
76
pas possible d’isoler des segments qui, bien que n’étant pas des énoncés (comme des syntagmes, par exemple), soient de même niveau que des énoncés. Pour des raisons qui apparaîtront dans l’exposé, nous ne pourrons appliquer rigoureusement la démarche déductive à notre corpus. Notre recherche de solutions pratiques sera parfois incompatible avec cette position théorique. Du point de vue de l’élégance de l’analyse, cela est bien décevant, mais il ne peut en être autrement. Néanmoins, il nous a semblé pertinent d’organiser notre exposé de manière analytique. La description analytique de la langue des chartes met en évidence quatre types d’éléments significatifs, jouant à quatre niveaux d’intégration différents. En premier lieu, nous analysons la manière dont le texte est décomposable en énoncés. Ce niveau d’intégration ne relève pas de la syntaxe, mais permet d’en définir les limites. Il fera l’objet du premier développement, qui sera l’occasion de définir la phrase par rapport à l’énoncé (→3.4.1). Au niveau d’intégration situé directement endessous de la combinaison des énoncés intervient la constitution de la phrase-énoncé, organisant les termes autour d’un noyau verbal, organisation qui relève de la syntaxe de la phrase,62 que nous avons qualifiée d’argumentale (→3.4.2). Vient ensuite le niveau de la construction du noyau verbal (→3.4.3) et de ses grands constituants arguments, où des moyens morphosyntaxiques sont mis en œuvre pour clarifier ou spécifier la relation qu’ils entretiennent avec le verbe (→3.4.4). Les énoncés qui ne sont pas des phrases ne pourront être analysés de la même manière (→3.4.5). Enfin, l’agencement de constituants dans un cadre indépendant du procès exprimé – c’est-àdire les faits de syntaxe proprement immédiate (voir également →3.2.3.1) – constitue le dernier type de niveau d’intégration (→3.4.6). Une fois cette hiérarchie présentée, il restera à aborder les phénomènes et problèmes d’analyse généraux qu’on peut rencontrer à tous ces niveaux (→3.4.7). 3.4.1
Du texte à la phrase, en passant par l’énoncé
En guise de première approche, nous dirons que le texte se compose d’une succession d’énoncés et que la première étape de l’analyse consiste à distinguer ces derniers les uns des autres. Pour commencer, voyons en quoi il est impossible de procéder de manière purement analytique pour faire ce premier découpage. Nous opposerons l’énoncé à la phrase, ce que nous n’aurions pu faire jusqu’à présent (→3.4.1.1). En définissant la phrase de manière empirique, nous distinguerons les énoncés qui sont des phrases de ceux qui n’en sont pas (→3.4.1.2). Enfin, viendra le détail des règles suivies pour résoudre les problèmes que pose cette première étape dans la segmentation (→3.4.1.3). 3.4.1.1
Délimiter l’énoncé et la phrase: limites de la démarche analytique
Avant d’aborder l’analyse syntaxique de la phrase-énoncé, il faut trouver le moyen de segmenter le corpus de manière systématique, à l’aide de critères qui ne relèvent idéalement pas de l’organisation syntaxique de la phrase. L’intérêt de l’approche est évident: exclure les faits syntaxiques du processus de segmentation permettrait d’éviter la circularité. Il paraît donc logique de dire: 62 Voir →3.2.3.1.
77
«[L]a décomposition du texte en phrases ne saurait se faire sur le modèle de la décomposition de la phrase en ses unités inférieures.» (Soutet 1998, 8).
La question qui se pose évidemment d’emblée est de savoir comment délimiter les unités intégrées pour former le texte, sans se servir de ce qu’elles contiennent pour procéder.63 Les tenants de la glossématique préconisent ainsi le recours à la prosodie pour déterminer les contours de la phrase: «Le point de départ d’une procédure analytique est la phrase du contenu, définie par son rapport avec la modulation [c’est-à-dire la prosodie]. La matière première de la syntaxe est donc un inventaire de toutes les unités de la langue qui peuvent jouer le rôle de phrase.» (Togeby 1965, 62).
Mais cette façon de faire pose problème. En effet, si l’on n’hésite pas à faire de l’intonation une propriété de l’objet recouvert par le concept d’énoncé, «[. . .] une production linguistique acceptée par les locuteurs natifs comme complète et possédant une intonation reconnue comme liée à ce fait.» (Hagège 1999, 27).
de manière générale, l’énoncé ne correspond toutefois pas forcément à la phrase. Prenons un exemple moderne (pour éviter de compliquer l’exposé): les segments La porte! ou Magnifique! prononcés dans des situations adéquates sont considérés comme des énoncés – suivant la définition donnée précédemment (→3.1.3.1 a) –, mais ils obéissent à des règles de formation différentes de celles mobilisées pour construire Ferme la porte, il fait froid! ou Cette plante est magnifique!, qu’on considère généralement comme des phrases.64 L’intonation peut donc se révéler impropre à délimiter les phrases. Comme le dit André Martinet (1979, §1.25),65 «Il s’y ajoute souvent une courbe de la mélodie du discours avec montée initiale et descente finale, par exemple, dans la phrase à deux prédicats coordonnées Il est venu, puis il est reparti. Il peut y avoir contradiction entre l’unité assurée par les relations internes et celle que suggère la mélodie du discours; dans Il pleut. . . Je ne sors pas, par exemple, avec la montée initiale de la courbe et descente sur la finale, la mélodie suggère une seule phrase. Mais l’absence de marque de liaison entre les deux parties de l’énoncé nous amène à interpréter cet énoncé comme composé de deux phrases.»
Cependant, cette prosodie est inaccessible; et se servir de la ponctuation pour délimiter les phrases serait une faute de méthode flagrante dans une recherche qui vise précisément à établir les conditions et modalités d’une telle corrélation. Le regard autonomiste sur la langue écrite rend utopique la démarche proprement déductive. Il n’est pas possible de délimiter les énoncés à l’aide d’indices qui leur seraient tous exté63 La démarche analytique l’interdit en effet: «[Des] linguistes américains, comme Bloch et
Haas, emploient apparemment la démarche analytique, mais en réalité la procédure inverse, toute unité étant définie par ses parties: major sentence, par exemple, par le fait de contenir final clause, clause par predicate, predicate par inflected expression.» (Togeby 1965, 61). 64 «Ces énoncés syntaxiquement achevés [les phrases] se distinguent par là d’énoncés qui le cas échéant s’avèrent à peu près équivalents en tant que véhicules d’un message donné dans une situation de communication donnée, mais ne se prêtent pas aux mêmes transformations.» (Creissels 1995, 33). 65 Et, pareillement, Leonard Bloomfield (1970, 161).
78
rieurs. Nous sommes forcé de les situer par rapport aux constituants qu’ils contiennent ou à ceux qui sont intégrés à d’autres phrases: pour déterminer l’étendue d’une unité syntaxique, on a le plus souvent besoin de connaître les limites de ses constituants et de comprendre les relations que ces constituants entretiennent. Nous devons nous résoudre à délimiter l’énoncé et la phrase de manière empirique, à l’aide des constatations des grammairiens de l’ancien français. 3.4.1.2
Phrases-énoncés et énoncés non phrastiques
Devant cette difficulté, nous définirons la phrase de manière empirique comme l’énoncé correspondant à la phrase «verbale» traditionnelle (→a), l’opposant ainsi aux constructions qui n’ont pas cette particularité (→b). a. Définition empirique. Pratiquement, délimiter les énoncés ne serait pas chose aisée si l’on n’était aidé par une observation empirique essentielle. Les philologues et linguistes de l’ancien français ont en effet remarqué que, pour reprendre les termes traditionnels, la phrase était le plus souvent «verbale», c’est-à-dire fondée sur un «verbe conjugué à un mode personnel» (qu’on nommera prédicat par commodité), ce qui correspond à un verbe portant des marques de la catégorie de la personne (→3.3.3): «La phrase sans verbe est rare en AF dans la langue littéraire. On la trouve surtout dans la langue parlée66 (ordres, exclamations) et dans le style concis des maximes et des proverbes.» (Ménard 1994, §203).
Au vu des exemples relevés dans les grammaires, les phrases «non verbales» sont employées dans des situations d’énonciation très spécifiques, ou sont insérées dans des discours où elles ont une place prédéterminée. Gérard Moignet (1988, 97), qui ne donne comme exemple de phrase non verbale que la phrase «nominale», cite deux exemples de proverbes:67 «Les mors as mors, les vis as vis.» (Perceval, 3630). «de bien fait col frait [=‘rompu’].» (Renart, 9518).
ainsi que quatre exemples d’exclamation «quel mal, quel duel, quel felonie qu’en tel guise estes perie!» (Pir. Tisbé, 722). «Le vin aforé [= ‘mis en perce’] de nouvel. . .!» (S. Nic., 642). «Hareu! le leu! le leu! le leu!» (Robin et Mar., 603). «Escaper, li fil a putain!» (S. Nic., 442).68
On s’attend à ce que l’immense majorité des phrases rencontrées soient «verbales». Il est donc légitime de partir de la «phrase verbale» pour commencer à segmenter le 66 C’est-à-dire dans la représentation écrite que les textes livrent de la langue parlée. 67 Nous modifions la typographie. Claude Buridant (2000, §69) cite une partie de ces mêmes
exemples et des suivants. 68 Gérard Moignet souligne qu’il s’agit ici d’un «cas sujet».
79
texte, pour peu qu’on ne lui assigne pas une structure a priori qui fausserait l’analyse.69 D’une certaine manière, la démarche, contrainte par la difficulté inhérente aux matériaux, se rapproche de celle d’André Martinet (1979, §1.25, nous soulignons):70 «On appelle phrase l’ensemble des monèmes qui sont reliés par des rapports de détermination ou de coordination71 à un même prédicat ou à plusieurs prédicats coordonnés.»
Pareille approche n’est pas si éloignée de celle de Lucien Tesnière, qui faisait du verbe le nœud des nœuds (→3.2.1). Si l’on conserve la définition de l’énoncé telle qu’elle a été donnée ci-dessus (→3.1.3.1 a), ce n’est pas la présence ou non d’un verbe fléchi à un mode personnel qui détermine si un segment linguistique employé dans une certaine situation signifie quelque chose et est proféré selon une visée communicative particulière: seul le point de vue morphosyntaxique se doit de rendre compte de cette différence avec une phrase verbale. Par souci d’économie, les phrases verbales étant majoritaires, nous réserverons désormais l’emploi du terme phrase à ces dernières. Nous distinguerons dès lors: des énoncés qui sont des phrases (phrases-énoncés); des énoncés qui ne sont pas des phrases (énoncés non phrastiques). Le mot phrase renverra donc à une certaine forme d’organisation morphosyntaxique, où le procès est exprimé à l’aide d’un lexème de nature verbale (→3.3.3.1) conjugué à un mode personnel et où le reste des constituants s’organisent autour de lui. La propriété fondé sur un verbe conjugué à un mode personnel permet de délimiter l’intension de la phrase à l’intérieur de celle de l’énoncé. La conséquence pratique de cette conception est que nous considérons qu’aucun énoncé n’est constitué de plusieurs phrases. En vertu des principes exposés, le texte suivant72 est aisément divisé en énoncés distincts (que nous avons, selon l’usage moderne, séparés par des points): *Nos fasons connissance de veriteit. Sacent tuit cilh qui sunt et qui a_venir sunt que, par devant nos, vinrent Elyas c’om dist li Coens, dame Lyse, sa feme, Frankes Brebenchons et Lowis, d’une part, et freres Pieres, d’autre. La conurent ilh, Elyas, dame Lyse, sa feme, Frankes et Lowis desoure nomeis, que de la quarte partie des wendes noves c’om dist de la Costerie, avoient fait don et vesture a frere Piron devant nomeit. Si orent en_covent par devant nos Elyas, dame Lyse, sa feme, Frankes et Lowis que jamais n’en iroient encontre cele vesture que ilh avoient fait. Par ce que ce soit plus ferme cose et plus estable avons a ceste presens letres pendut nos saieaus en tesmongage de veriteit. Ce fu fait l’an del Incarnation Nostre Saingnor m cc lx et set, le joedi aprés le Grant Quareme. (texte artificiel construit en simplifiant Document 1268–03–01)
Seule une démarche synthétique (et le recours aux structures examinées dans les sections suivantes) permettrait de pallier le manque d’une connaissance intuitive de la langue et laisserait juger de la complétude d’une structure. Dans les constructions
69 Comme le schème de réécriture générativiste P → SN + SV (Feuillet 1988, 77–81). 70 La question de la coordination sera abordée ci-dessous, →3.4.7.2. 71 Voir →3.4.1.3 et →3.4.7.2 à ce sujet. 72 L’exemple a été fortement simplifié pour les besoins de l’exposé. Aucun texte du corpus ne
pourrait être aussi facilement segmenté.
80
suivantes, qui constituent des phrases-énoncés, on voit que chaque fin d’énoncé est marquée par le début du suivant, et vice versa:73 1. Nos fasons connissance de veriteit. 2. Sacent tuit cilh qui sunt et qui a_venir sunt que, par devant nos, vinrent Elyas c’om dist li Coens, [3] dame Lyse, sa feme, Frankes Brebenchons et Lowis, d’une part, et freres Pieres, d’autre. 3. La conurent ilh, Elyas, dame Lyse, sa feme, Frankes et Lowis desoure nomeis, que de la quarte [6] partie des wendes noves c’om dist de la Costerie, avoient fait don et vesture a frere Piron devant nomeit. etc. Intuitivement, on remarque déjà que les «propositions subordonnées» de la grammaire traditionnelle sont structurées de manière similaire aux phrases.74 b. Énoncés non phrastiques. Le cas des énoncés non phrastiques ne complique pas vraiment les choses. À la suite d’une division du type de celle qui vient d’être exposée, les segments qu’on ne peut voir comme des phrases pour des raisons morphologiques font forcément partie de la deuxième catégorie d’énoncés, puisque chaque segmentation isole des unités de même niveau.75 Le protocole76 prend souvent la forme d’un énoncé non phrastique, comme: «A_tos ceas qui ces presens letres veront, li homme delle Cise Deu, salus et conoiestre verité.» (Document 1267–10–22, 1).
[2]
Celui-ci reste inanalysé quand les phrases ont toutes été identifiées. En outre, les chartes sont des documents fortement formalisés, et on remarque vite que les énoncés non phrastiques sont quasi toujours localisés au début (protocole) ou à la fin du texte (seing notarial). De plus, le contenu informatif limité de ces énoncés concorde tout à fait avec les observations des grammairiens: l’énoncé non phrastique est limité en ancien français à des situations énonciatives ou textuelles spécifiques. Seules les anacoluthes, exceptionnelles, n’entrent pas dans le canevas. La tradition juge généralement qu’il s’agit d’erreurs. Elles pourraient être problématiques, parce que, contrairement aux énoncés non phrastiques «normaux», il ne serait pas possible d’en prévoir l’apparition. Il y a parfois lieu de relativiser ce point de vue. Le corpus ne livre que trois cas:77 «A toz cheaz et a totes celes a cui ces amoines ki en ceste chartre sunt escrit n’unt ilh soulement fours ke lor vie en recherrunt [26] totes en Robermont» (Document 1247–06, 25). 73 Voir néanmoins le problème des incidentes, sous →3.4.4.5 b. 74 Voir →3.4.4.5 et →3.4.6.4 pour les différents emplois de ces subordonnées. 75 Cf. p. 76. 76 Début du texte d’une charte, reprenant de manière stéréotypée une ou plusieurs des informa-
tions et formules suivantes: invocation (formule par laquelle l’acte est mis sous la protection divine), suscription (mention de l’autorité de qui la charte est émanée), adresse (public visé), salut (formule de salut). On parle également de protocole initial (Guyotjeannin et al. 1993, 72–76). 77 Il est nécessaire de citer intégralement le contexte qui précède. Le début de la phrase qui suit la construction interrompue est souligné.
81
«Saicent trestuit cilh ki sunt et ki a_venir sunt ke de [3] conten ki astoiet entre la maison de_le Vas Benoite delés Liege, del ordene de Citea, d’une part, et Facin [4] de Ceris, d’atre part, endroiet d’une terre ke cilh Facin clamoiet devant le maor et les enskevins de [5] Ceris, de cui cille terre devoiet movoier, encontre la maison de la Valz Benoiete devant dite; la quele [6] maison de la Valz Benoiete et cilh Facins se misent en nos, Lowi et Tiri, devant le maor et les enskevins [7] de Ceris qu’ilh tenroiet de hat et de bas che ke nos dirins [. . .]» (Document 1260–05–09, 2). «Nos faison a savoir ke nos, arbitre enliut de_le contraversion ki estoit entre me damme l’abesse de Robert-mont et le co-[4]-ven, d’une part, et le saignor Gerar de Hermees, chevalier, d’autre part, sor chu ke mes sires Gerars de Hermeeis deman-[5]-doit sor les masuiers l’abesse devant ditte et le covent, mainent a Hermeeis sor l’aluez l’abesse et le covent devant_dit, [6] forche et resteal et corrueie. Et nos, li arbitre desor nomeit, presiens en_nos le fais del arbitre [. . .]» (Document 1263–03–31, 3).
Le premier cas est effectivement peu orthodoxe, puisque deux «pronoms relatifs» sont employés pour un seul verbe personnel. Commentons les deux autres, qui sont fort semblables. Tout d’abord, on pourrait penser que l’«erreur» consisterait en ce que ces propositions s’achèvent toutes brutalement après un très long constituant complexe contenant une ou plusieurs subordonnées. Néanmoins, le constituant en question exprime le thème, et toutes ces anacoluthes ont lieu dans une proposition qui a fonction de «complément» par rapport au verbe de la notification (savoir ou conoistre). Or, cette position particulière correspond à l’endroit où débute la partie du discours diplomatique qu’on nomme exposé.78 Il est remarquable que la limite entre la notification et l’exposé soit un point de rupture important dans la structure du document diplomatique. Néanmoins, d’un point de vue morphosyntaxique, cette rupture n’est pas marquée par le début d’une nouvelle phrase.79 Le nombre d’attestations très réduit ne permet pas d’avancer de conclusion générale, mais nous ne serions pas étonné de rencontrer d’autres cas d’anacoluthes à cet endroit particulier du texte. Dans ce cas, la structure ne devrait plus être considérée comme irrégulière, puisqu’elle serait prévue par la texture (→3.1.2.1 b). 3.4.1.3
Enchaînement des énoncés phrastiques
Devant un segment qui contient plusieurs verbes conjugués à un mode personnel, il n’est pas toujours facile de décider si l’on a affaire à une seule ou de plusieurs phrases. Les phénomènes de subordination (au sens traditionnel), abordés plus loin (→3.4.4.5 et →3.4.6.4), sont généralement en dehors du problème.80 Les phénomènes de «coordination» interfèrent bien plus au niveau qui nous occupe.81 La séparation d’énoncés 78 «L’exposé est un récit [. . .], soit de type historique, relatant par exemple les origines et les
débuts d’une abbaye, ou exposant les origines et les motivations d’une donation, soit de type judiciaire, racontant les raisons d’être d’un procès ou les différentes étapes déjà effectuées.» (Guyotjeannin et al. 1993, 79). 79 Voir Mazziotta 2007b. 80 On admet généralement que la subordination implique une hiérarchisation; il n’y a alors qu’une seule phrase. 81 Ces phénomènes jouent à tous les niveaux d’intégration syntaxique supérieurs au mot. Nous les approfondirons après avoir détaillé l’organisation de ces environnements argumental et
82
qui paraissent coordonnés par et est expliqué en premier lieu (→a). D’autres cas difficiles sont abordés ensuite: les constructions paratactiques (→b) et les incidentes (→c), sans toutefois les détailler car l’exposé de leur traitement mobilise de nombreuses notions qu’il faudra définir exactement. a. Le mot et et la «coordination» des énoncés. Les cas d’énoncés phrastiques discutés ci-dessus ne sont cependant pas les plus fréquents; on pourrait même dire qu’ils représentent une vision des choses tellement simplifiée qu’elle ne correspond absolument pas à la réalité. En effet, la plupart du temps, les chartes enchaînent des segments qui commencent (ou sont précédés, suivant le point de vue) par le mot et, que les grammairiens classent parmi les «conjonctions de coordination». Cette citation de Gérard Moignet (1988, 330–331) permet d’entrer dans le problème: «Et, qui peut coordonner les phrases entre elles, peut aussi figurer en tête d’une phrase sans constituer une coordination syntaxique [331] avec l’énoncé précédent, ni appeler une phrase suivante coordonnée. Il traduit alors un mouvement affectif, un enchaînement vif [. . . ].»
Les exemples que Gérard Moignet donne du dernier emploi ne posent pas de problème car le et qu’ils contiennent figurent en tête d’un énoncé qui se caractérise par un changement d’énonciateur; par exemple, (cf. 1988, 331): «[. . .] Et il respont que nenil. Non? fet ele; et ge le vos dirai en tel maniere que ja ne vos mentirai de mot» (Mort Artu, 77, 13).
L’énonciateur de l’incise fet ele (le narrateur) n’est pas le même que celui de et ge le vos dirai. . . (un des personnages). Malheureusement, les choses sont loin d’être toujours aussi claires. Si l’on essaye de relever toutes les valeurs que peuvent avoir ces occurrences initiales de et, on obtient rapidement une liste longue, abrégée ici (cf. Ménard 1994, §194 et 196):82 «a) «Et» reliant des principales ou des indépendantes. 194. [. . .] 1. [La conjonction et] s’emploie avec valeur temporelle ou consécutive au sens de ‘et alors, et ensuite, et donc’. [. . .] 2. Elle marque une addition insistante, avec la valeur argumentative de ‘et qui plus est, et de surcroît’. [. . .] 3. Elle introduit une opposition au sens de ‘et pourtant, mais’. [. . .] c) «Et» initial de phrase [. . .] 196. [. . .] 1. Et n’est pas rare, notamment dans les textes en prose, pour indiquer un enchaînement temporel, amorcer un nouvel épisode, ou bien servir de transition en ouvrant une digression ou en revenant au sujet. Certains écrivains abusent parfois de cet et initial de phrase. [. . . ] 2. Chez les bons écrivains, et est une attaque de phrase chargée de vivacité qui introduit des propos au style direct ou qui détache de manière expressive l’intervention d’un nouveau personnage dans le récit.»
immédiat (→3.4.7.2), mais il n’est pas possible de travailler sur la proposition sans régler préalablement le problème à ce niveau, en raison de la fréquence importante du phénomène. 82 Les passages élidés contiennent une partie de la numérotation.
83
On pourrait se demander si les valeurs accordées à et ne sont pas extrapolées du rapport qui unirait les énoncés entre lesquels il se trouve même s’il n’était pas présente. Par ailleurs, les emplois du type relevé par Philippe Ménard au §196, 1 correspondent à la diversité des emplois dans les chartes, c’est-à-dire à une sorte de catégorie «fourretout».83 Et ne ferait dès lors qu’expliciter une limite, et non une valeur. Cette «coordination» des énoncés est extrêmement fréquente. Le texte qui suit, choisi pour sa briéveté, est représentatif de la forme que prennent habituellement les textes (les et impliqués sont soulignés): «Je, Ermesens, contesse de Lucemborg, faz savoir a touz ceaus qui ces lettres [2] verront que de sis_cent mars de ligois, que messires Robers, par la grace de [3] Deu eveskes de Liege, dovoit a moi et a mon fil Hanri, a il fait bon [4] paement et entier, et nos en tenons a paié, et en aquittons touz nos [5] pleges. En tesmongnage de ce, li doing je mes lettres saelees de mon sael, [6] que furent faites le jor del Assumption Nostre Damme, quant li miliares coroit par [7] m et cc et xl trois ans. » (Document 1243–08–15).
Prenons position: tout d’abord, en suivant un principe de simplicité, il nous a paru raisonnable de considérer qu’il n’y a jamais de coordination syntaxique de deux énoncés. La construction Je, Ermesens, contesse de Lucemborg, faz savoir a touz ceaus qui ces lettres [2] verront que [. . .] (Document 1243–08–15) citée ci-dessus est très courante. Aucune marque grammaticale ne permet de se prononcer quant à l’éventuelle coordination de toutes les propositions introduites par et dans la suite du texte, qui seraient dans ce cas toutes des subordonnées. L’ambiguïté ne peut être levée et il paraît tout aussi difficile de trancher dans un sens ou dans l’autre. Pour simplifier l’analyse, il nous a paru intéressant de considérer qu’il s’agissait de principales. Dans cette optique, l’analyse de la charte Document 1243–08–15 se fait comme suit (la double barre sépare les énoncés): «Je, Ermesens, contesse de Lucemborg, faz savoir a touz ceaus qui ces lettres [2] verront que de sis_cent mars de ligois, que messires Robers, par la grace de [3] Deu eveskes de Liege, dovoit a moi et a mon fil Hanri, a il fait bon [4] paement et entier, || et nos en tenons a paié, || et en aquittons touz nos [5] pleges. || En tesmongnage de ce, li doing je mes lettres saelees de mon sael, [6] que furent faites le jor del Assumption Nostre Damme, quant li miliares coroit par [7] m et cc et xl trois ans.» (Document 1243–08–15).
Compte tenu de cela, et sachant que l’ancien français est une langue dans laquelle une phrase est correcte sans qu’aucun constituant autre que la flexion verbale n’exprime le «sujet» (voir p. ex. Ménard 1994, §55), nous avons séparé en deux phrases ce segment (la séparation est marquée par deux barres verticales): «Et por ce [12] ke ce soit ferme et stable, avo_nos a ce letres pendut nostre saeal. || Et avons priet mom le veke ke ihl i_metit le sin.» (Document 1236–05, 11). «[. . .] se ihl vendre le voloit ne sez hoirs aprés, li_glise l’aurat devhant tioz achators. || Et si en_donroit tant com ele varoit [9] solon ce ke un_vent terres en ce-lui pais.» (Document 1236–05, 8). 83 On pourrait faire les mêmes remarques au sujet de la liste fournie par Claude Buridant, que
ce soit dans son étude sur les rapports de et et la ponctuation (Buridant 1980) ou dans sa grammaire (Buridant 2000, §449–451).
84
énoncé @unité linguistique complète @transmet un message @suit une stratégie énonciative énoncé phrastique (= phrase) @fondé sur un verbe à un mode personnel
énoncé non phrastique @non fondé sur un verbe à un mode personnel
F IG . 3.16 – Types d’énoncés en fonction de leur structure morphosyntaxique
On y voit clairement que la présence ou non du sujet84 n’a rien à voir avec la division en énoncés. Il se peut néanmoins qu’un indice grammatical s’oppose de manière péremptoire à ce type de découpage, comme le mode du verbe – ce qui n’arrive pratiquement que pour les subordonnées, (→3.4.4.5 et →3.4.6.4). Ainsi, on conviendra qu’il n’est pas judicieux de séparer les subordonnées que li fiez fust si petis [. . .] et point de terre n’en tenist dans la phrase: «et s’ilh truvent par [9] verté que li fiez fust si petis qu’il ne fust hmiie honoirs le conte qu’ilh le tenist del [10] veske u point de terre n’en tenist, li veskes li doit amender [. . .]» (Document 1236–12–15, 8).
Le mode de leur verbe «principal» indique leur dépendance par rapport à la prédication principale. Pour éviter toute incohérence, les rapports sémantiques qui justifieraient la subordination ont été ignorés. Pareillement, le rapport unissant certains compléments «circonstanciels» à deux principales coordonnées n’est pas lié à des marques grammaticales (→3.4.7.4 a). b. Parataxe. La parataxe (au sens traditionnel) est une subordination qui n’est pas exprimée par une marque segmentale. Néanmoins, l’enchâssement de la structure et les informations véhiculées par la valence du lexème verbal aident toujours à déceler une subordination. On ne rencontre ces parataxes qu’en syntaxe immédiate (→3.4.6.4 c). c. Incidentes. Les discussions terminologiques autour du terme incidente85 obligent à en préciser l’acception: un énoncé complet enchâssé dans un autre sans qu’aucune marque segmentale n’exprime de rapport de dépendance. Contrairement aux structures paratactiques, les incidentes sont des énoncés qui pourraient être autonomes, et non des propositions (→3.4.4.5 b). 3.4.1.4
Synthèse de la segmentation du texte en énoncés
Dans cette première étape de l’analyse, nous avons été amené à distinguer deux types d’énoncés, suivant qu’ils obéissent aux règles de construction des phrases ou non (figure 3.16). Même si la base de l’analyse repose sur des choix pratiques, au terme de l’exposé, nous pouvons formuler des règles de découpage qui s’appliquent facile84 Voir →3.4.2.2 ci-dessous pour une définition du terme. 85 Pour la distinguer notamment de l’incise; voir les différentes options recueillies par Marc
Wilmet (2003, §693).
85
ment de manière systématique. L’analyse prend appui sur la définition de la phrase et sur les deux principes empiriques suivants: 1/ chaque verbe «principal» implique la présence d’une phrase; 2/ la coordination de phrases n’existe pas. Ces principes sont posés comme préalables à tout le reste de l’analyse; nous n’en changerons plus dans la suite de l’exposé. Toutes les structures laissées inanalysées par cette étape du découpage, qui correspondent à des séquences particulières prévues par le type de texte (protocole, seing notarial), sont des énoncés non phrastiques. D’un point de vue morphosyntaxique, les deux types d’énoncés sont profondément différents. Nous les étudierons donc dans des sections séparées: nous verrons d’abord comment la phrase est construite (→3.4.2 et s.) et de quoi se composent ses constituants immédiats avant de nous pencher plus brièvement sur les énoncés non phrastiques (→3.4.5). 3.4.2
Subdivision de la phrase et structure argumentale
De notre point de vue, l’expression du procès par un verbe conjugué à un mode personnel est la condition d’existence de la phrase-énoncé et en constitue la part irréductible. Nous pensons qu’il est possible d’envisager la description du reste des constituants de même niveau d’intégration syntaxique en caractérisant le rapport qui les unit à ce verbe. Nous nommerons ainsi arguments les constituants immédiats de la phrase lorsque nous les considérons au travers de ce rapport avec le «verbe principal», auquel nous donnerons le nom de prédicat (que nous désignons par le sigle P0).86 Cette conception est similaire à celle de Lucien Tesnière, où le verbe est vu comme le «nœud» par excellence, le centre vers lequel convergent toutes les relations de la phrase (→3.2.1). La présence d’un prédicat et de ses arguments (point de vue syntaxique), exprimant ensemble un procès, ses participants et son cadre (point de vue sémantique) à l’intérieur d’une structure syntaxique, est la condition pour qu’on puisse parler de proposition. Celle-ci est donc une construction centrée sur un prédicat, un constituant de nature verbale, capable d’exprimer de manière grammaticalisée les catégories de temps, mode et aspect (→3.3.3.1). Partant, la phrase n’est donc qu’une proposition qui fonctionne comme un énoncé. Après avoir montré comment, d’un point de vue général, le prédicat organise les relations argumentales (→3.4.2.1), on verra comment employer cette propriété générale pour classer les arguments des propositions rencontrées dans les chartes (→3.4.2.2 à →3.4.2.4). Les différents types de relation que le classement des constituants a mobilisés seront abordés en guise de synthèse de ces principes de description (→3.4.2.5). 3.4.2.1
Relations argumentales: généralités
Dans un premier temps, nous aborderons les relations entre les arguments et le prédicat de la proposition qui constitue la phrase. Ces relations grammaticales expriment des relations sémantiques d’une manière conventionnelle (→a). Cette convention qui, pour un lexème verbal donné, lie une certaine organisation sémantique des partici86 Voir la note 96, p. 89, sur le choix de ces termes.
86
pants à une certaine forme d’expression morphosyntaxique (domaine des marques, →b) permet de dire que les relations sémantiques constituent un premier indice de l’organisation purement morphosyntaxique (→c). a. Le schéma argumental comme représentation grammaticale de phénomènes. La langue offre à ses locuteurs la possibilité de communiquer à propos du monde qui les entoure: il existe une relation entre les points de vue morphosyntaxique et sémanticoréférentiel. Cette constatation se résume ainsi: «La phrase exprimant un certain ‹état des choses›, [l]es relations grammaticales expriment, et reflètent dans une certaine mesure, les relations perçues entre les choses ou les êtres participant à cet état des choses.» (Lazard 1994, X).
Il existe une cohérence entre les deux organisations. D’une part, certains marqueurs expriment les relations sémantiques qui unissent le procès (entendu ici au sens le plus général87 ) et les participants; d’autre part, le prédicat – une forme morphologiquement spécifique, puisqu’il s’agit d’un verbe – exprime le procès. Or, nous avons déjà constaté (en fin de →3.2.3.1) que la flexion nominale (déclinaison) véhiculait des informations dont la teneur ne pouvait être décrite sans mettre en relation les unités en présence. Ainsi, les marqueurs morphologiques permettent d’interpréter correctement un énoncé comme: «La afaita Werris devant diz a sangor Arnult devant nomet ii verges (Document 1267–10–29, 6).
[7]
et demie d’aluez»
pour peu qu’on connaisse les conventions qui unissent la structuration grammaticale au sens.88 Bien sûr, ces relations ne sont pas naturelles: «Si les relations syntaxiques au sein de la phrase ne sont pas sans rapport avec les relations perçues dans le monde réel, il s’en faut de beaucoup pour qu’elles en soient le reflet pur et simple. Elles font partie du réseau complexe que constitue la structure grammaticale de chaque langue [. . .]» (Lazard 1994, X).
Pour cette raison, il paraît beaucoup plus rigoureux de définir les arguments en fonction de leur forme d’expression – spécifique au système de la langue – et non de leur contenu.89 b. Classement morphosyntaxique des actants et notion d’orientation. Gilbert Lazard définit d’un point de vue général les différents types d’arguments. Il se sert pour cela de critères purement morphosyntaxiques et aboutit à un classement fin. Il distingue en effet une série d’arguments, qu’il nomme actants, liés au prédicat par des contraintes formelles (1994, 68–80): l’actant obligatoire,90 pour lequel la contrainte est la plus forte et dont la présence est la condition nécessaire à toute prédication; les actants à 87 Nous reprenons la position de Claude Hagège (1999, 46, note 8): «Ce terme recouvre donc
ici, par convention, la totalité des situations, y compris celles qu’on pourrait juger trop peu dynamiques pour être appelées des procès.» 88 Ce que Robert-Léon Wagner souligne au début de ses conclusions sur les limites d’une grammaire de l’ancien français (1974, 55). 89 Voir les problèmes exposés dans Lazard 1994, 64–68 et dans Creissels 1995, 203–210. 90 Généralement unique d’après l’auteur.
87
la fois requis et régis, dont le verbe requiert la présence et impose la forme (p. ex., verbes nécessitant un objet «indirect» introduit par de); les actants seulement régis, dont la présence n’est pas nécessaire, mais dont la forme est fixée par le verbe (du type à sa dulcinée dans penser à sa dulcinée); et enfin les adjets,91 requis, mais non régis (donc, de forme libre) et en outre cumulables. Il y a donc des marques morphologiques (flexion) et segmentales (adpositions) qui permettent d’évaluer la distance syntaxique des actants par rapport au verbe. Ces contraintes de marquage s’ajoutent à la contrainte de présence, qui ne suffit pas pour aboutir à un classement compréhensif des arguments.92 Outre ces actants, Gilbert Lazard parle de circonstants, «qui n’ont d’autre lien avec le prédicat verbal que celui sans lequel ils ne feraient pas partie de la phrase» (1994, 81). Ces arguments ont comme particularité d’être de forme libre par rapport au prédicat et d’être suppressibles sans nuire à la grammaticalité de la phrase. Comme nous travaillons sur l’ancienne langue, nous ne pouvons caractériser les arguments en fonction du fait qu’ils sont requis ou non par le prédicat (→3.1.3.3). Néanmoins, puisque la taxinomie proposée par Gilbert Lazard est fondée sur la comparaison de nombreuses langues dans une optique de linguistique générale, il n’y a pas de raison qu’elle ne trouve pas un écho dans le fonctionnement de l’ancien français. Nous ne transposerons pas les concepts définis par Gilbert Lazard dans notre système de notation, mais nous emploierons son classement comme hypothèse de travail. Si l’on essaye de mettre explicitement en relation les contraintes formelles (point de vue morphosyntaxique) et les participants et circonstances qu’elles expriment (point de vue sémantico-référentiel), on constate assez vite que la connaissance du verbe et de son sens donne une idée précise de la manière dont les informations sémantiques sont véhiculées par une forme d’expression spécifique. Ainsi, en français, pour les verbes pouvant avoir deux actants, en phrase active biactancielle, l’actant obligatoire exprime l’agent, alors que l’autre actant exprime le patient. Cette association est nommée orientation par Alain Lemaréchal (1989, 102): «Pour un verbe appartenant à une sous-classe donnée et à une voix donnée, des rôles précis dans la situation (agent, patient, destinataire, causateur) sont associés aux différents actants: en français, un verbe transitif, donc au moins bivalent, à l’actif a un premier actant agent et un second actant patient: Bernard renverse Alfred. L’‹orientation› d’un verbe est cette caractéristique qui associe aux différents participants en rapport avec lui à la fois un rang dans la hiérarchie [c’est-à-dire une fonction syntaxique spécifique] et un rôle dans la situation, sachant que cette association est caractéristique de la sous-classe et de la voix de la forme verbale. Dès qu’un verbe est bivalent, trivalent, etc., une forme verbale appartenant à ce verbe associe des rôles précis à la fois aux premier, second, tiers actant [. . .].»
L’auteur poursuit en disant que le prédicat des propositions biactancielles a une «orientation primaire» vers l’agent et une «orientation secondaire» vers le patient. L’orientation est gérée par le système de la langue, qui pose une série de contraintes sur les différents actants. Ces contraintes spécifient les relations unissant les arguments au prédicat. 91 Terme que Gilbert Lazard emprunte à Jack Feuillet 1988, 147; voir Lazard 1994, 84. 92 C’est pourtant l’option que suit Claude Hagège dans La structure des langues (1999, 37), en
ne posant que la distinction entre arguments nucléaires (requis) ou non.
88
L’orientation associe ainsi, dans le cadre défini par le verbe, une correspondance entre les rôles sémantiques et les marques, excluant donc les circonstants. Alain Lemaréchal étend la notion à toutes les «parties du discours» (entendues chez lui du point de vue de la sémantique de la syntaxe). Voici l’analyse qu’il propose pour les noms en français moderne: «On peut définir une orientation primaire des nominaux par le seul jeu des propositions nominales, avec ou sans copule, et des procédures d’apposition ou autres constructions épithétiques [. . .] – – – – – –
ce médecin est chef de clinique ce livre est un cadeau ce médecin, un chef de clinique un médecin chef de clinique ce livre, un cadeau un livre-cadeau
Dans tous ces exemples, les nominaux, substantivés ou non,93 sont coorientés. Il y a coorientation entre médecin et chef de clinique, livre et cadeau, aussi bien dans ce médecin est chef de clinique ou ce livre est un cadeau (proposition nominale), que dans ce médecin[,] un chef de clinique, un médecin chef de clinique, ce livre[,] un cadeau ou un livre-cadeau (apposition). En règle générale, l’orientation primaire d’un nominal se [110] définit comme une désignation de cet objet.» (Lemaréchal 1989, 109–110).
Dans ce cadre étendu, la notion d’orientation revêt une valeur plus sémantique. De l’orientation des nominaux, nous retiendrons surtout la notion de coorientation, qui se définit comme l’orientation commune de plusieurs constituants vers la désignation d’un même objet.94 c. La sémantique comme indice des relations syntaxiques. On ne peut élaborer toute la description syntaxique sur la base de critères sémantiques. Cependant, l’existence de la correspondance entre la forme et le rôle autorise à faire usage de la sémantique pour isoler les arguments, c’est-à-dire segmenter la phrase en arguments. Pour l’ancien français, il n’y a de toute façon pas le choix (→3.1.3.1). La relation qui existe entre un participant et le procès est, dans une certaine mesure, transposable sur le plan syntaxique.95 C’est le sens que nous donnons ici à argument et prédicat:96 . Ainsi, le prédicat implique une série de relations minimales (figure 3.17). En guise de première évaluation de la structure syntaxique, on peut simplement affirmer que chaque argument «fonctionne» avec le prédicat, qu’il y a entre eux une relation syntaxique minimale (→3.2.1.2). L’analyse révélera peut-être si cette relation est spécifiée (sur le principe de la spécification, →3.2.2.2). «La afaita Werris [. . .] a sangor Arnult devant nomet ii verges (Document 1267–10–29, 6).
[7]
et demie d’aluez»
93 Voir Lemaréchal 1989, 44–54, où l’auteur expose ses vues sur la distinction entre les noms
et les substantifs. 94 Voir également Lemaréchal 1997, 128–129. 95 En présence de structures complexes, avec plusieurs prédicats hiérarchisés, il est parfois
insuffisant de se servir de la sémantique, ne fût-ce que pour détecter la relation minimale; voir le cas des infinitives (→3.4.4.6). 96 Et c’est pour cette raison que le choix des termes semble défendable: il y a une valeur logique sous-jacente à l’organisation des constituants syntaxiques les uns par rapport aux autres.
89
relation argument. . . argument. . .
relation
argument. . .
prédicat
relation
F IG . 3.17 – Relations sémantiques marquant des relations syntaxiques constituant immédiat de la phrase @constituant immédiat @compris dans la phrase prédicat @verbe conjugué à un mode personnel @dénote un procès
argument @dénote un participant ou le cadre du procès
F IG . 3.18 – Principaux constituants immédiats de la phrase
Si afaita exprime le procès et Werris l’agent, il y a de fortes chances pour que la relation sémantique qui les unit soit rendue par une relation syntaxique. Par ailleurs, d’un point de vue morphosyntaxique, la coocurrence d’éléments nominaux et verbaux dans la même structure indique également qu’il y a relation. Au niveau argumental, le concept de constituant immédiat97 est donc subdivisé comme indiqué dans la figure 3.18. La qualification ultérieure des relations qui lient prédicat et arguments ne relève que du plan morphosyntaxique. Les unités qui transportent le sens sont organisées d’un point de vue strictement interne au système de la langue. Ce n’est qu’une fois cette relation repérée qu’on cherchera à déterminer quelles marques morphosyntaxiques la spécifient. 3.4.2.2
Actants et marques morphologiques
Nous venons de voir que, d’un point de vue général, les types d’arguments se distinguaient les uns des autres en fonction des contraintes morphosyntaxiques auxquelles ils sont soumis. Nous définirons ici une première classe d’arguments, auxquels nous donnerons le nom d’actants. La contrainte qui définit ces actants est d’avoir une des formes du «pronom personnel de la troisième personne» ou de commuter avec l’une d’elles. Cette analyse est inspirée de ce que Gilbert Lazard expose à propos de l’emploi du pronom en français moderne. Il considère: 1/ que les pronoms personnels gravitant autour du verbe sont des «indices actanciels» (que nous comprenons comme des marques grammaticalisées de fonctions au niveau argumental); 2/ que la «corrélation 97 Défini ci-dessus, voir →3.2.1.
90
avec des indices actanciels intra- ou paraverbaux» est un critère «de premier ordre» pour la définition des actants (Lazard 1994, 68). Voici son analyse: «Le français, lui, a quatre séries [d’indices actanciels],98 , dont trois sont illustrées par (8a et b). (8a) Nobel a légué ses biens à l’Académie suédoise (8b) Il les lui a légués Dans (8b), la première série est représentée par le morphème de la 3e personne du singulier dans le verbe (a) et le ‹pronom conjoint› [72] il; la deuxième série l’est par le ‹pronom› les et la marque de pluriel dans le participe (légués); la troisième l’est par le «pronom» lui. Dans (8a), la fonction actancielle de chacun des termes nominaux se laisse identifier par la série d’indices actanciels avec laquelle ils sont en corrélation: Nobel est en coréférence avec le morphème verbal de la 3e personne du singulier et en distribution complémentaire avec il (1re série); ses biens est en distribution complémentaire avec les (2e série); à l’Académie suédoise est en distribution complémentaire avec lui (3e série).» (Lazard 1994, 71–72).
Or, le paradigme de ce pronom n’a que peu varié depuis l’ancien français. Il est possible que l’analyse proposée par Gilbert Lazard convienne à cet état de langue. Tentons de le montrer progressivement. Nous verrons en premier lieu que le pronom personnel de la troisième personne associe un rôle spécifique à chacune des formes de son paradigme (→a), ce qui peut être employé pour définir les relations syntaxiques liant ce pronom au prédicat (→b). Nous étendrons ensuite ces conclusions aux constituants qui commutent avec ces formes pronominales (→c), avant d’aborder des cas particuliers (→d et →e). a. Formes du pronom et rôles sémantiques. L’ancien français est déjà une langue en grande partie analytique, et la déclinaison y exprime un nombre relativement restreint de relations. De plus, le foisonnement des paradigmes limite son efficacité. Toutefois, le pronom «personnel de la troisième personne» (il ou elle) offre encore un potentiel flexionnel riche et apte à exprimer un certain nombre de rôles de manière univoque. Les grammairiens s’accordent pour reconnaître trois formes au masculin singulier: il, le, li, qui sont les formes «de base» du pronom.99 Les formes le et li alternent avec une forme dite «forte» (lui), en fonction de contraintes séquentielles par rapport au prédicat100 ou aux «prépositions». Comment l’ancien français met-il en relation ces formes de base avec les rôles sémantiques joués par les participants? La forme il correspond généralement à l’agent de la phrase active bi– ou triactancielle; de même, on la retrouve comme actant de la phrase uniactantielle: «nos avons fait homages [3] a no signeur Robert [. . .] des fiez de Natoie, ensi cum [4] il est» (Document 1242–05–02, 2). « il recevra et prendra les fruis et les rentes et tenra toutes les seigno-[7]-ries entierement, ensi com il les a tenues tous jors» (Document 1264–04, 6). 98 Note dans le texte: «Je laisse ici de côté y et en qui remplissent des fonctions diverses,
actancielles ou non [. . .].» 99 Les formes dites «réfléchies» du pronom ne sont pas utiles à l’argumentation qui suit; elles
ne seront pas prises en considération ici. 100 Voir le premier chapitre de la thèse de Povl Skårup (1975), dans lequel il explique que la
distinction entre les formes «fortes» et «faibles» du pronom personnel n’est pas liée à l’accentuation, mais à la place qu’il occupe par rapport au prédicat.
91
«la denat ilh [. . .] a frere [6] Libier de Frelus [. . .] vesture de quatre bonirs [. . .]» (Document 1263–07–19, 5).
La forme le correspond au patient de la phrase active bi– ou triactancielle: «se ihl vendre le voloit ne sez hoirs aprés, li_glise l’aurat devhant tioz achators» (Document 1236–05, 8). «damoiselle Sybille le reportat sus la meismes a oelz de la mai-[8]-son de Robermont» (Document 1260–05–14, 7).
La forme li exprime le bénéficiaire de la phrase triactancielle: «et pais li fu commandee sor ce par le jugement des homes, et plainement li fu afaitiez ciz fiz» (Document 1266–06–13, 13). «[. . .] nos lettres overtes ke nos li avons doneis» (Document 1252–03–01a, 21)
Au vu des phrases observées, chaque forme du pronom est associée à un rôle sémantique particulier.101 b. Du rôle sémantique à la fonction syntaxique. Puisque les correspondances entre une série casuelle et un rôle sémantique particulier sont stables, et qu’à une forme donnée est assigné un rôle sémantique, on peut catégoriser du point de vue morphosyntaxique la relation que les occurrences relevées pour chacune de ces trois formes entretient avec le prédicat qui exprime ce procès. Il s’agit donc d’arguments du prédicat de forme contrainte. Si on les numérote de manière arbitraire: 1. il (correspondant à l’agent de la phrase active); 2. le (patient de la phrase active); 3. li (bénéficiaire de la phrase active). Ces trois arguments jouent la fonction syntaxique d’actant par rapport au prédicat. Par ailleurs, les catégories de nombre et de personne véhiculées par la forme 1 se retrouvent également exprimées dans le prédicat; le même contenu est donc exprimé à deux endroits de l’énoncé. D’un point de vue sémantique, ce phénomène d’accord peut être vu comme la marque d’une relation particulière entre les unités qui le contractent. Le transfert de catégories correspond à l’expression d’une relation sémantique stable. L’orientation primaire du verbe se fait ainsi simultanément vers la forme 1 et luimême: les formes du premier type sont coorientées par rapport au prédicat. Le terme de combinaison102 qualifiera la relation entre le sujet et le prédicat, à cause de cette coorientation. Plus précisément, sur le plan des marques, cette coorientation concerne exclusivement les morphèmes de la personne et du nombre, et non le prédicat dans son ensemble. Par contre, sur le plan des relations, elle implique les mots entiers. Il nous paraît cohérent de dire que la numérotation proposée ci-dessus n’est pas arbitraire pour ce qui concerne l’actant 1, puisqu’on le distingue des autres actants 101 On constate du reste que l’ancien français est une langue «accusative»: la forme de l’actant
qui exprime l’agent de la phrase active biactancielle est la même que celle de l’actant unique de la phrase uniactantielle (en suivant Lazard 1994, 30s. et 1999, 122s.). 102 Le sens est ici différent de celui que lui prête Louis Hjelmslev, voir →3.2.1.
92
[le]
relation R2
[P0]
F IG . 3.19 – Représentation de R2
[il]
relation S1
[P0]
F IG . 3.20 – Représentation de S1 actant @a une forme de la série il, le, li sujet @accord avec P0
actant 1 (S1) @forme il
régime @non-accord avec P0
actant 2 (R2) @forme le
actant 3 (R3) @forme li
F IG . 3.21 – Types d’actants en fonction de leur forme
régis, en vertu de sa relation privilégiée avec le prédicat: il est plus proche de ce dernier que ne le sont les deux autres. L’appellation de sujet (désormais S1), que nous reprenons à la grammaire traditionnelle, sera réservée à cet actant; les deux autres seront dits régimes, (désormais respectivement R2 et R3). Par extension, on pourra dire qu’un S1 entretient une relation S1 avec le prédicat et qu’il est, dans ce cadre, de fonction S1. Il semble qu’il n’y a aucun inconvénient à procéder de la sorte, puisqu’on peut classer les constituants en fonction des relations syntaxiques entretenues. Pour le (de fonction R2), par exemple, on a pu préciser la relation en annotant la flèche, comme dans le schéma 3.19, où la flèche indique la dépendance – les arguments nécessitent la présence du prédicat.103 On peut dire la même chose pour R3 et classer ainsi ces arguments en fonction de leur forme. La nature particulière de S1 nécessite une représentation qui exprime également la combinaison (par une double ligne), comme nous l’utilisons dans la figure 3.20. Tout cela se résume dans l’arbre conceptuel de la figure 3.21. La relation qui existe entre un argument pronominal et le prédicat est donc spécifiée par des moyens synthétiques (marques morphologiques). c. Commutations: principe général. Ce premier bilan est très utile pour caractériser les constituants autres que les pronoms. D’un point de vue général, David Creissels (1995, 211) affirme en effet: «[p]armi les propriétés non immédiatement apparentes permettant de caractériser les contrastes entre constituants nominaux en fonction d’arguments d’un même prédicat,104 il est souvent utile de prendre en considération la relation entre les constituants nominaux et les morphèmes désignés ici comme indices pronominaux.»
103 Voir cependant les cas d’énoncés non phrastiques, sous →3.4.5. 104 On peut donner aux termes le même sens que celui exposé ici-même.
93
La relation dont il est question est d’ordre paradigmatique: les actants se définissent morphosyntaxiquement par la forme du pronom avec laquelle ils commutent,105 S1: «cel meime droit ke [10] mes sires et mes peres devant dis lor at quitteit et doneit en almoine [. . .]» (Document 1268–03–10, 9); R2: «reportarent [. . .] l’yretage deseur nomeit tot entierement» (Document 1268–03–10, 5); R3: «nos avons donet Warnier le bolengier c’on dist de Rumezees une mason [. . .]» (Document 1252–03–01b, 3).
Dans ces conditions, les segments nominaux qui commutent avec un pronom de fonction S1 sont également S1, et similairement pour R2 et R3. De ce fait, la faiblesse de certains paradigmes eu égard à l’expression des relations sémantiques (comme c’est le cas du féminin, où la déclinaison n’existe plus pour un grand nombre de noms) n’est pas déterminante: même s’il manque à certains noms la forme fléchie qui spécifierait exactement la relation, c’est le potentiel commutatoire du constituant en contexte qui importe. Par ailleurs, la coorientation entre le sujet et le prédicat semble stable, à en juger par les phénomènes d’accord observés.106 d. Commutations: cas de l’«attribut du sujet». Le primat de l’axe paradigmatique dans cette analyse – le seul dont on puisse avoir une vision complète – pousse à aller jusqu’au bout du raisonnement. Nous dirons que la fonction R2 convient également à la plupart des constituants qu’on dit traditionnellement «attributs du sujet», où S1 et R2 qualifient le même référent, posant une équivalence ou une caractérisation,107 c’est-à-dire qu’ils sont orientés vers le même objet, ce qu’Alain Lemaréchal (1997, 128–129) nomme également coorientation.108 La commutation n’est pas attestée dans le corpus, mais la continuité semble fermement assurée entre les formes plus anciennes et le français moderne, où la commutation est possible (attestations tirées des ressources du site internet Laboratoire de français ancien): «Mes c’il ert pruz jeo l’ameroie. Allas, qe doel, il ne l’est mie!» (Ipomédon, 93). « ‹[. . .] il sanble mialz tornoieor que marcheant ne changeor. Il est chevaliers, ce me sanble.› Et les dameiseles ansanble 105 Nous négligeons complètement les contraintes de position modifiées par la substitution du
pronom au syntagme nominal. Ces contraintes sont en effet différentes pour le nom et le pronom (cf. Marchello-Nizia 1995, 107s.). 106 Voir néanmoins les problèmes que pose le phénomène de coordination (→3.4.7.2). 107 Voir cependant p. 99, où sont abordés les «attributs» qui ne sont pas équatifs ou caractérisants. 108 Voir →3.4.2.1 b. En réalité, l’auteur considère que les traditionnels «attributs du sujet» sont «transférés en verbes au moyen de la copule» (Lemaréchal 1989, 123) et sont ainsi orientés vers le participant exprimé par S1 (Alain Lemaréchal parle d’«agent», terme qu’on pourrait juger inadéquat, parce qu’il suppose un contrôle du procès, absent de la relation entre le sujet et la copule). Précisons, même si cette conception n’est pas mobilisée dans ce travail, que la propriété principale du substantif en matière d’orientation est d’être auto-orienté, c’est-à-dire orienté vers l’objet qu’il désigne (Lemaréchal 1989, 109–110).
94
[x]
relation S1
[P0]
relation R2
relation attributive
y
F IG . 3.22 – Représentation de la relation attributive impliquant S1 et R2 li dïent: ‹Bele dolce amie, s’il le sanble, ne l’est il mie; [. . .]›» (Cgraal, 380a.5015).
Nous admettons donc le statut de R2 pour: « xv verges de terre sor bonir ki est alus» (Document 1269–02–23, 4).
Et nous posons, par extension, ce statut pour les constituants du même type, qui apparaissent dans l’environnement d’un verbe dénotant un état ou un changement d’état: «li autre, ki vive [10] demorat, tenrat tote sa vie ceste tenore» (Document 1264–11–29, 9).
Nous parlerons dès lors d’une relation attributive (ou attribution) entre un R2 et un S1 coorientés. Cette relation lie S1 et R2 par le biais de l’emploi d’un prédicat dont le schéma actanciel et la valeur sémantique sont compatibles avec cette coorientation (estre, demorer dans les exemples qui précèdent109 ). La relation attributive ne s’envisage pas sans un sujet et un prédicat. Les attestations tirées de Laboratoire de français ancien ci-dessus montrent bien que R2 n’a pas la même fonction syntaxique que S1 par rapport au prédicat. R2 et S1 sont donc unis par une relation médiate, représentée dans la figure 3.22 par un trait discontinu. e. Commutations: distinction entre R2 et R3. D’autre part, la distinction entre R2 et R3 nécessite un commentaire. En effet, seule une série limitée de noms110 offrent des séries de trois formes. Pratiquement, si l’on examine l’entourage du verbe doner, on constate que le statut de R3 du mot lor ci-dessous est déterminé morphologiquement (un R2 aurait certainement eu la forme les): «Et je cel meime droit [. . .] lor (Document 1268–08–02a, 9).
[11]
quitte ausi et lor done en almoine se nul droit i ai»
Dès lors, les syntagmes soulignés ci-dessous sont tous deux des R3, en dépit de la différence formelle qui les oppose (présence ou non d’une «préposition»), puisqu’ils commutent avec un pronom R3: «nos avons donet Warnier le bolengier c’on dist de Rumezees une mason [4] en hiretage lui et ses oirs» (Document 1252–03–01b, 3). «li abbesse [4] et li covens de_la maison de Robermont deleiz Liege ont doneit a trecens a Ja-[5]-kemin le Rotial et a dame Evelette, sa femme, une curt et une maison [. . .]» (Document 1260–02–21b, 3).
109 Ce qu’on pourrait envisager en termes de translation si le terrain exploré le permettait
(→3.3.2), cf. note 108. 110 Les pronoms, cf. p. 74.
95
actant @commute avec il, le ou li sujet @accord avec P0
actant 1 (S1) @commute avec il
régime @non-accord avec P0
R2 @commute avec le
R3 @commute avec li
F IG . 3.23 – Types d’actants en fonction de leur potentiel commutatoire
C’est en premier chef la forme du pronom avec laquelle ils commutent qui distingue R3 de R2. Néanmoins, cela n’exclut pas la possibilité d’une variation libre entre la présence et l’absence de l’adverbe a au début de l’argument, comme on le voit cidessus.111 Le schéma 3.21 (p. 93) doit être revu, en soulignant que c’est le potentiel paradigmatique qui permet de reconnaître les actants: nous le faisons dans la figure 3.23. De notre point de vue, les relations actancielles sont des relations spécifiées par des moyens morphologiques. Soit ces marques sont «en présence», c’est le cas du pronom de la troisième personne; soit ces marques sont «en absence», et ne peuvent être appréhendées que si l’on a conscience des commutations possibles. 3.4.2.3
Circonstants
Le modèle exposé dans la section précédente ne suffit pas à classer tous les arguments. Si l’on fait commuter les constituants immédiats de cette phrase (excepté le prédicat) avec les pronoms, l’opération échoue pour deux constituants immédiats de la phrase: «La afaitarent elles a [5] frere Libier de Frelus, a owez de la maison de la Vas Benoiete delés Liege, delle ordene de [6] Citeaz, xvii verges de terre». (Document 1263–07–20, 4)
Ces constituants soulignés sont ainsi le reliquat de l’analyse, puisqu’ils ne commutent avec aucune forme du pronom. Si l’on désirait les faire commuter, l’opération ne réussirait qu’avec un adverbe: la commuterait avec i et a owez. . . avec si. Pour cette raison, ces constituants n’entrent pas dans les classes S1, R2 et R3 qui viennent d’être définies. Il est cependant indubitable que ces constituants ont un sens qui ne se conçoit qu’en relation avec celui dénoté par le prédicat (ici, afaitarent) ou à l’ensemble de la phrase qu’il fonde. Cette relation sémantique suppose une relation syntaxique, et à cet égard, ces constituants sont également des arguments du prédicat. Pour marquer la différence avec S1, R2 et R3, qu’on a groupés sous le terme d’actant, on parlera de circonstants (désormais C5). On obtient ainsi la hiérarchie présentée dans la figure 3.24.112
111 Ce fait relève de la construction des arguments et on verra ci-dessous comment interpréter la
présence de ce a (→3.4.4.2). 112 Ce schéma sera revu (→3.4.2.4).
96
argument @en relation avec P0 actant @commute avec il, le ou li
circonstant @ne commute pas avec il, le, li
F IG . 3.24 – Types d’arguments en fonction de leur potentiel commutatoire
Vue de cette manière, la spécification se fait ici de manière négative, ce qui a pour conséquence de regrouper dans la même classe les arguments non-actants dont la forme est indépendante du choix lexical du prédicat ou de la diathèse et ceux dont la forme est associée à un rôle spécifique compte tenu de la diathèse. Par exemple, le complément dit «d’agent» est classé dans les circonstants.113 Voyons à présent s’il est possible de distinguer plusieurs catégories de circonstants. a. Expression du «cadre» du procès. On perçoit intuitivement que les circonstants peuvent être classés en sous-groupes, mais aucune marque morphosyntaxique ne permet de procéder à ce classement: on ne peut se fier qu’à la manière dont ces constituants interfèrent sémantiquement avec le reste du procès et de ses participants. De ce fait, certains des circonstants en question interagissent avec la phrase-énoncé de manière interne au procès, en posant un cadre spatio-temporel, logique, final, consécutif, etc. La seule différence sémantique ne suffirait cependant pas à caractériser les circonstants par rapport aux actants. C’est pourquoi le classement sémantique se fait obligatoirement à la suite du classement syntaxique, de manière à profiter du gardefou que constitue la grammaire le plus longtemps possible. Ainsi, le bénéficiaire peut être exprimé par un actant ou un circonstant:114 R3: «li abbesse [4] et li covens de_la maison de Robermont deleiz Liege ont doneit a trecens a Ja-[5]-kemin le Rotial et a dame Eveltte, sa femme, une curt et une maison [. . .]» (Document 1260–02–21b, 3); circonstant: «Les queiz set boniere de terre et les dous curs [10] Houduins devant dis reportat sus en la main del maior par devant eas a oés de_la maison de [11] Robermont devant dite» (Document 1260–05–30a, 9); circonstant: «nos en donames don et vesture par devant les homes de_le Chiese Deu [13] a frere Henri de Robermont, a oés de_la maison devant dite» (Document 1260–05–14, 12).
La coexistence de R3 et du circonstant dans le dernier exemple ne laisse aucun doute au sujet de l’analyse de ce dernier. 113 Il est possible d’envisager les choses autrement. On peut considérer que la relation est spé-
cifiée par des marques beaucoup plus précises et contraignantes que les autres circonstants: non seulement la diathèse, mais également les adverbes de, par (seuls ou combinés), ainsi que l’impossibilité de commuter avec un adverbe. Elle est par ailleurs liée à une certaine classe de verbe. 114 Cette analyse n’est pas celle de Denis Creissels (1995, 245–247), qui affirme que la distinction entre R3 et les circonstants n’est pas assurée, de même, dit-il, que la distinction des «attributs». Le test de commutation nous paraît pourtant sans appel: R3 commute avec le pronom li (et en fr. mod. lui), ce qui n’est pas le cas des circonstants.
97
circonstant @ne commute pas avec il, le, li C5 @exprime le cadre du procès
C6 @lie l’énoncé au précédent
F IG . 3.25 – Types de circonstants
Par contre, cette approche sémantique permet de distinguer ces circonstants qui expriment le cadre du procès et certains participants (désormais C5), d’autres constituants qui ont plutôt pour rôle d’organiser les énoncés les uns par rapport aux autres. b. Expression de l’organisation des énoncés. Au point de vue du sens qu’ils véhiculent, certains circonstants agissent effectivement à un autre niveau: ils se comprennent plutôt par rapport à l’énoncé entier, en mettant en relation ce dernier avec celui qui précède et construisant ainsi ce qu’on appelle la cohésion du texte.115 Cette analyse convient au fameux et initial de phrase (→3.4.1.3) et à tous les adverbes commutant avec lui (ne, ou, ains, car), mais également à l’adverbe si. «[Des dispositions sont prises. . .] Et par-mi ceste pais at quite clamé li glise mon saingnor Oston totes convenances k’ilh a eu a lui de ci a ore; ne ne li doit emcombrer de [19] son achat de Lovierval ne de le vowerie; ains li doit aidier en bone foi , sain le sin doner» (Document 1244–01–19, 18). «[À la fin d’une charte] Et por ce que ce soit fermement tenut, li veskes et li cuens i ont pendut lors sayaus» (Document 1236–12–15, 12). «nos avons changiet a le maizon del Va_Benoite et frere [5] Warnier [. . .] [6] dois boniers de terre et un jornal [. . .] et-contre atre terre [. . .]; s’en gisent de ces dois bonier desor nommés v jornal entre Ans et Hanbru [. . .] » (Document 1260–10–02, 4).
Pour les distinguer des C5 et pour indiquer leur distance plus grande par rapport au prédicat, ces circonstants ont le sigle C6 (figure 3.25). Ne disposant que de critères sémantiques pour distinguer C5 et C6, nous reconnaissons la fragilité de cette séparation. 3.4.2.4
Cas «intermédiaires»
Aux actants et circonstants s’ajoute un troisième type d’argument, qui pose un problème de description. Certains participants au procès ont une forme qui semble liée au lexème verbal employé comme prédicat, mais ne commutent pas avec un pronom. Dans ce cas, l’absence de marque segmentale nous laisse un peu désarmé pour traiter le problème. Il y a tout lieu de croire – mais le fait mériterait d’être vérifié – que la forme de ces arguments est limitée à des schémas très spécifiques qui semblent dépendre du lexème verbal. Par exemple, le verbe defalir est toujours attesté avec un argument introduit par de, comme dans l’extrait suivant: 115 Voir l’exposé détaillé des procédés de cohésion dans Halliday 1985, ch. 9.
98
argument @en relation avec P0 actant @commute avec il, le ou li
non-actant @ne commute pas avec il, le, li
A4 @forme dépendante du lexème de rôle P0
circonstant @forme indépendante du lexème de rôle P0
F IG . 3.26 – Types d’arguments «se watiers u sei hoir auchun an [6] defaloient de_paiement de ces iiii muis, de cens et de la rente, si ke dit est, Johans poroit alar a ces l’endemain sens demener» (Document 1271–12–09, 5).
Certaines séries de verbes au sémantisme proche acceptent également des compléments relativement figés. Par exemple, les terres transmises à une institution religieuse par simple don, qu’on appelle aumones, peuvent être lassiees, werpies116 ou donees: «i bonier de quartal terre [. . .] (Document 1276–02–24, 9).
[10]
ke Thomas Batas desour dis avoit lassiés en amoine»
«et werpit por Dieu et en amoine» (Document 1284–05–11, 6). «Et je [. . .] donai en amoene, [. . .] al abbeit et a covent del Vaus Saint Lambert desor dis [. . .] tel alué ki astoit en ma maen» (Document 1270–11–26, 21).
La distinction entre ce type d’argument et ceux qui posent un cadre spatiotemporel paraît parfois bien mince et ne saurait être posée catégoriquement. Il semble que ces arguments servent en particulier à marquer un complément proche du prédicat, alors que la position R2 est déjà occupée par un autre argument (il y a en quelque sorte saturation d’une des cases prévues par le schéma argumental) ou que la fonction R2 est incompatible avec le lexème qui est prédicat (comme aler ou venir). Il est difficile de trouver dans la tradition un terme adéquat pour désigner ces arguments de type intermédiaire. Nous emploierons simplement le sigle A4 pour les désigner, soulignant le fait qu’ils ne sont pas soumis aux mêmes contraintes de forme que les actants, mais sont moins libres que les circonstants par rapport à l’information stockée dans le lexème qui a fonction de prédicat. Le numéro 4 est destiné à refléter cette position intermédiaire. On doit ainsi ajouter une branche au schéma 3.24 de la page 97 en intercalant le concept opératoire de non-actant dans la hiérarchie (figure 3.26). La conceptualisation est moins péremptoire qu’il n’y paraît: on pourrait également envisager un schéma mettant en évidence le caractère qui regroupe les actants aux A4 et les oppose aux circonstants (leur dépendance par rapport au lexème de rôle P0). L’arbre ci-dessus est préférable parce que les commutations avec les pronoms sont des moyens d’accès plus rigoureux à la distinction des relations syntaxiques. En suivant ce principe, les traditionnels «attributs» de S1 qui ne sont pas coréfé116 C’est-à-dire ‘déguerpies’.
99
rents à ce dernier et qui ne commutent pas avec un pronom doivent également être décrits comme des A4. Ils dénotent généralement une situation, un contexte ou un possesseur. Par exemple: « canones ki seront en_la vilhe» (Document 1236–05, 6). « El nom de Deu soit» (Document 1265–07–04, 1). « Sachent tuit cilh ki sunt et ki a_venir sont ke [. . .]» (Document 1268–03–10, 2). « le huge ki fu se pere» (Document 1272–03, 31).
où l’on constate bien qu’aucune commutation avec il, le ou li n’est possible. En comparaison, les traditionnels «attributs du complément direct» peuvent être définis comme mettant en coréférence R2 et A4. «Do quelh testament ju enlis et fais foumains [. . .] sangnor Thirri de Dynant, [. . .] dame Annés [. . .]» (Document 1289–01–12, 31).
Il est remarquable que, du point de vue sémantique, lorsque R2 et A4 sont coexistants, il est très souvent possible d’envisager qu’ils expriment tous deux une désignation du même objet.117 Ainsi, d’un point de vue sémantique, le procès exprimé par la phrase citée fait des patients (sangnor Thirri. . .), exécuteurs testamentaires (foumains) du locuteur (ju). De même, dans «sires Giles et sa mere reconoisent a le glise et claiment quitte le quarte part de tote la dime de Nodués [. . .]» (Document 1236–05, 4).
le nom quite exprime des propriétés de la réalité désignée par le quarte part de la dime de Nodués. La transformation traditionnelle qui fait de l’«attribut du complément d’objet direct» un «attribut du sujet» est possible.118 Puisque le corpus contient, «[. . .] li vi mars de cens, les queis j’ai lassiés en me testament sor ma maison de_le Fosse [. . .] soient quittes et paisueles [7] a Johan [. . .]» (Document 1283–02–13a, 6).
il n’est pas déraisonnable de postuler qu’on peut former: *Giles et sa mere claiment que le quarte part. . . est quite
ce qui rend plausible l’analyse parallèle à celle de l’«attribut» de S1 (figure 3.27). Même si elles rentrent dans ce moule, les structures de ce type impliquant des infinitifs 117 À première vue, certaines constructions semblent s’opposer à cette analyse: «[. . .] ai priet
l’official de Liege qu’ilh pende le seal de l’officialité de Liege por [14] mi a ches presens letres» (Document 1271–12–03b, 13); si on analyse l’official de Liege comme un R2 (ce qu’on fait intuitivement en tant que locuteur du français moderne), l’hypothèse de la coorientation ne tient pas. L’observation du corpus révèle qu’il s’agit en fait d’un R3: «[. . .] et se prie et requier ausi a manbor [. . .] qu’il donent [. . .] lettres de recognisance [. . .]» (Document 1283–02–13b, 18). La spécification par a n’est pas attestée pour R2. 118 Dans les termes de notre modèle, nous disons que cette transformation transpose respectivement R2 et A4 en S1 et R2 attributif d’un P0 copule.
100
[x]
A4
[P0]
R2
relation attributive
y
F IG . 3.27 – Relation attributive impliquant R2 et A4
nécessitent un commentaire et seront abordées de manière plus détaillée ci-dessous (→3.4.4.6). 3.4.2.5
Synthèse des relations argumentales
Nous ferons suivre le tableau des constituants immédiats de la phrase (→a) avant de le généraliser à la proposition (→b). Ensuite, nous dresserons un premier inventaire des conventions de schématisation des relations rencontrées (→c). a. Taxinomie des constituants immédiats de la phrase. Nous considérons que tout constituant immédiat de la phrase est forcément soit prédicat, soit argument, c’est-àdire que toutes les relations sont organisées autour du prédicat. Ainsi, aucune relation de niveau argumental n’existe en l’absence du prédicat. Le classement proposé distingue les arguments et les hiérarchise en fonction de la «distance» qui les sépare du prédicat.119 Les arborescences conceptuelles présentées dans les paragraphes ci-dessus se regroupent en un seul schéma, où la distance par rapport au prédicat augmente au fur et à mesure qu’on se déplace vers la droite de l’arbre (voir la figure page 102). b. Notion de proposition. À ce stade du découpage, le fait que le prédicat exprime ou non des catégories personnelles (aux modes dits «personnels»: indicatif et subjonctif) n’a pas d’incidence sur la définition obtenue. D’ailleurs, et cela nous a servi de base pour découper le texte en énoncés (→3.4.1), le verbe se caractérise par son potentiel à assumer la fonction de prédicat et imprimer à la proposition entière une structure syntaxique particulière. Quelle que soit la désinence que prenne le verbe, il conditionne le même environnement syntaxique (changements de diathèse mis à part). À l’exception de S1, tous les arguments se comportent de la même manière par rapport au prédicat, qu’il soit conjugué à un mode personnel ou non. Nous avons donc tout intérêt à adopter une terminologie qui mette en évidence cette persistance tout en permettant de parler de la désinence du verbe. Nous distinguerons simplement les propositions personnelles, participiales et infinitives, réservant le nom de phrase aux propositions personnelles employées comme énoncés (→3.4.1.2). Dans un souci de cohérence, comme nous avons refusé le statut de verbe aux déverbaux comme paiable (→3.3.4), nous n’analysons pas le syntagme dont il est le «centre» comme une proposition.120 c. Relations fondamentales: classement et schématisation. Comme précisé en jetant les bases du modèle d’élaboration de concepts (→1.1), la sélection des propriétés à 119 Même si tous les arguments d’un certain type ne sont pas forcément équivalents de ce point
de vue; par exemple, parmi les C5, le complément d’agent peut être considéré comme plus proche du prédicat que les autres, puisqu’il est lié à la diathèse (→3.4.2.3). 120 Du reste, il semblerait que les déverbaux de ce type bloquent les possibilités de commutation des «arguments» (on ne peut plus à proprement parler les qualifier comme tels) avec un pronom.
101
102
S1 @commute avec il
sujet @accord avec P0
R3 @commute avec li
C5 (→3.4.2.3 a) @cadre le procès
F IG . 3.28 – Types de constituants immédiats de la phrase (classement complet)
R2 @commute avec le
C6 (→3.4.2.3 b) @cadre l’énoncé
circonstant (→3.4.2.3) @forme indépendante de P0
non-actant @ne commute pas avec il, le, li
A4 (→3.4.2.4) @forme dépendante de P0
argument (→3.4.2) @lien syntaxique à P0
régime @non-accord avec P0
actant (→3.4.2.2) @commute avec il, le ou li
prédicat = P0 (→3.4.2) @exprime la temporalité de la phrase
constituant immédiat de la phrase @intégré à la phrase
relation @dépendance ou cooccurrence @les termes sont des constituants relation vers P0 @P0 est sélectionné combinaison @coorientation de l’argument et P0
relation entre arguments @aucun terme n’est P0
complémentation @non-coorientation
attribution @coorientation
F IG . 3.29 – Représentation des relations syntaxiques impliquant des arguments
[P0]
[x]
F IG . 3.30 – Représentation des relations argumentales simples
[P0]
[x]
F IG . 3.31 – Représentation de la dépendance
abstraire en caractères faite durant le raisonnement dépend du descripteur, mais aussi du point de vue adopté durant l’analyse. Il serait possible de construire un autre arbre, qui mette en évidence d’autres oppositions caractéristiques. Il n’est pas ici question de proposer un classement parallèle à celui qui vient d’être synthétisé, mais plutôt de souligner une opposition importante qui sera utile ultérieurement et qui ne resterait que sous-jacente si l’on se contentait de l’arbre de la page 102. Tout d’abord, nous avons fondé la distinction entre deux classes d’actants principales sur la base du comportement qu’ils ont par rapport à l’accord avec le prédicat. Le sujet s’accorde de manière directe avec le prédicat, ce qui n’est pas le cas des régimes – l’accord d’un R2 en relation attributive avec un sujet est indirect (voir p. 94). La relation qui unit le sujet au prédicat a été nommée combinaison (voir p. 92). En ancien français – de même qu’en français moderne et dans toutes les langues romanes –, cette relation est tout à fait particulière et s’oppose à toutes les autres relations que les arguments peuvent entretenir avec le prédicat. Nous reprendrons le terme généralement reçu pour désigner ces «autres relations» et nous dirons qu’il s’agit de relations de complémentation, et que ces arguments (R2, R3, A4, C5 et C6) sont les compléments du prédicat. Le concept de relation se subdivise comme dans la figure 3.29. Les relations peuvent être représentées à l’aide d’un petit nombre de principes de schématisation. Pour indiquer une relation sans précision supplémentaire, on procède comme dans la figure 3.30. Pour montrer que la relation implique une hiérarchisation des constituants, nous utilisons une flèche, dirigée vers le constituant dont dépend l’autre constituant; par exemple, le prédicat (figure 3.31). Pour indiquer une combinaison, nous faisons usage d’une double ligne, comme dans la figure 3.32 – le cas échéant, la flèche indique la hiérarchie121 . Enfin, la relation peut être caractérisée en 121 On verra plus loin (→3.4.6.1 a) des cas où la hiérarchisation ne doit pas être faite.
103
[x]
[P0]
F IG . 3.32 – Représentation de la combinaison avec dépendance
[P0]
R2
[x]
F IG . 3.33 – Convention d’annotation des relations
[x]
S1
[P0]
y
R2
attribution
F IG . 3.34 – Représentation de la relation attributive
indiquant son type sur la ligne qui la représente; par exemple, c’est la relation R2 qui est représentée dans la figure 3.33. Toutes les relations présentées ci-dessus ont deux particularités: 1/ elles sont directes; 2/ elles impliquent toujours le prédicat. Si une relation est médiate (elle ne porte pas sur le prédicat, mais a besoin de sa présence pour s’établir), elle est représentée par un trait discontinu (figure 3.34). 3.4.3
Construction du prédicat
Le prédicat, tout comme les arguments (→3.4.4), est parfois une unité complexe dont il faut analyser la structure. Il sera ici question des temps «composés» et de la position adoptée à leur égard. 3.4.3.1
Problème des temps «composés»
Traditionnellement, les grammairiens de l’ancien français opposent les formes verbales «simples» aux formes verbales «composées», construites à l’aide des verbes estre ou avoir (qui servent d’«auxiliaires») et du lexème verbal fléchi au participe passé (l’auxilié). Sous certaines conditions, les catégories verbales doivent donc être exprimées par des moyens analytiques. De la même manière, la diathèse passive, qui consiste en un changement d’orientation (voir p. 87), est également formée à l’aide de l’auxiliaire estre. Les exemples abondent: «nos avons donet Warnier [. . .] une mason» (Document 1252–03–01b, 3). «[. . .] Johans [. . .] ki astoit venuz a ses jors aprés la mort [3] de son pere, vient par devant moi [. . .]» (Document 1270–11–26, 2). «[. . .] ensi com ilh est contenut plus esclairiement en faites.» (Document 1265–05a, 42).
[43]
lettres nostre frere ki de ce sunt
La question qui se pose est celle du statut à accorder à l’auxilié: est-il un argument de l’auxiliaire (lequel est assimilé au prédicat dans ce cas) et possède-t-il son propre schéma argumental? ou est-il au contraire indissociable de l’auxiliaire (les deux 104
argument
h
[P0 (auxiliaire)]
[P0 (auxilié)]
i
F IG . 3.35 – Structure de P0 complexe (l’auxilié est argumental)
[P0 (auxiliaire)]
R2
h
[auxilié]
argument
i
F IG . 3.36 – Structure de P0 complexe (l’auxilié n’est pas argumental)
formes construisent ensemble le prédicat)? La hiérarchie serait soit celle représentée dans la figure 3.35, soit celle représentée dans la figure 3.36. 3.4.3.2
Position adoptée
Il est vrai que l’on rencontre des cas de coordination (→3.4.7.2) qui montrent bien que les auxiliés peuvent être multipliés sans qu’il y ait besoin de répéter l’auxiliaire. Ces auxiliés peuvent même avoir chacun leur schéma argumental propre, comme en témoignent: «La u li amone devant dite fut afaitié ma [17] damme l’abbeesse [. . .] et li conisance de iii bonirs d’alu devant dis faiete, furent hommes de Cize [18] Deus [. . .]» (Document 1265–04–15, 16). «la lettre ki faite en est et saieleie de saial de la citeil de Liege et del Jehan.» (Document 1273–12, 6).
[7]
hospitaal de San
Certaines coordinations mettent sur le même pied deux schémas différents: le premier avec un R2 attributif (voir p. 94), le second avec un auxilié: «tot li arrerage et tot li besten ki unt esté entr’eaus sunt quite et totes les males amors par-[15]-donees» (Document 1270–05–10, 14).
Cependant, du point de vue sémantique, forme auxiliée et auxiliaire fonctionnent de concert: la suppression de l’une ou l’autre des deux formes modifie radicalement les catégories aspectuelles et temporelles exprimées dans l’énoncé. Or, le prédicat est vu comme le siège exclusif de ces catégories. Parallèlement, du point de vue morphosyntaxique, le statut de la construction change si on retire l’auxiliaire, puisque la phrase se définit notamment par la présence d’un morphème personnel dans le lexème verbal. D’autre part, la commutation qu’on pourrait faire entre l’auxilié accompagné de ses arguments et une forme du pronom, si elle est envisageable, n’est pas attestée dans le corpus, mais on peut aisément construire: *Johans, [. . .] ki l’astoit, vient par devant moi.
On voit ici que les commutations opacifient complètement le sens du procès dénoté et l’orientation. Pareillement, les formes passives se caractérisent par une orientation primaire (vers S1) du prédicat vers le patient, mais cette orientation ne subsiste pas quand la phrase 105
«persones ki sont escrit el testament Godefroit» (Document 1274–05–31b, 8).
est transformée par commutation en: *persones ki le sont el testament Godefroit.
Sans toutefois rejeter formellement l’autre analyse possible – il faudrait une étude plus approfondie pour trancher –, il semble que ces raisons autorisent à considérer les «temps composés» comme des prédicats à forme complexe. 3.4.4
Construction des arguments
La notion de spécification synthétique sert à caractériser les relations simples entre les unités qui constituent les arguments (→3.4.4.1) de nature nominale. La spécification analytique segmentale (→3.4.4.2) et la spécification analytique séquentielle (→3.4.4.3) sont ensuite introduites pour traiter les cas complexes. Une fois ces mécanismes observés, l’analyse est étendue aux arguments de natures adverbiale (→3.4.4.4) et propositionnelle (→3.4.4.5 et →3.4.4.6). 3.4.4.1
Noms: spécification synthétique additionnelle
La spécification de la relation liant les arguments nominaux qui ne sont pas des pronoms au prédicat est détectée en utilisant la procédure commutative. Ce sont des marques synthétiques qui permettent aux pronoms de spécifier la relation sans l’aide d’autres mots. La déclinaison des autres noms constitue parfois une marque synthétique supplémentaire qui se superpose à la spécification que comporte le potentiel paradigmatique. Ainsi, dans:122 «le queil alué Wilheames [. . .] (Document 1270–09–29, 11).
[12]
kenut par devan les homes k’ilh en astoit bin vestis»
la fonction S1 est marquée par le fait que Wilheames commute avec il, mais également par une désinence spécifique (-s). La coordination perturbe parfois ces marques (→3.4.7.2) bien que dans l’ensemble, les formes restent stables. C’est le cas dans: «La afaitarent Wilheames et Agnés [. . .] et Werris [. . .], a maistre Amelé, doin de Saint Donis, en nom de maistre Conrar, maison, curs, terres, [7] preis, cens, chapons, bleis et bois [. . .]» (Document 1276–06–10a, 5).
où le marquage rend reconnaissables deux «cas sujets» S1 masculins singuliers (Wilheames et Werris), sans livrer aucune information à propos de Agnés. Toutefois, ces marques synthétiques ne sont apparemment pas primordiales. Il faudrait une étude approfondie pour l’affirmer avec certitude, mais la spécification analytique, par emploi de prépositions et figement de l’ordre des mots, paraît déjà jouer un rôle bien plus 122 Pour simplifier l’exposé, le constituant intéressant a été réduit à un seul mot (un nom propre).
Il est évident que dans les faits, les syntagmes sont beaucoup plus complexes, mais la construction de ces syntagmes est un fait de syntaxe immédiate (→3.4.6).
106
important dans les documents. En effet, une grande partie des mots n’ont déjà plus de déclinaison (notamment les féminins et les mots se terminant par -s). Par ailleurs, même pour le peu de noms pour lesquels la déclinaison est encore efficace, les grammaires de l’ancienne langue énumèrent une multitude d’emplois divers (voir p. ex. Ménard 1994, §3–4) du «cas régime». Ce dernier correspond donc à une forme nominale morphologiquement sous-spécifiée, c’est-à-dire une forme qui n’imprime pas une valeur sémantique précise à la relation qu’elle entretient avec d’autres constituants – ce qui est tout le contraire du «cas sujet». La langue autorise l’emploi de contraintes supplémentaires pour que ce cas serve à exprimer des rôles sémantiques précis; la marque est alors analytique et segmentale. Ce qui est certain, c’est que le marquage synthétique est possible parce qu’une relation particulière est contractée.123 3.4.4.2
Noms: spécification analytique segmentale
L’ancien français ne peut compter sur son système casuel pour exprimer de manière univoque toutes les relations sémantiques possibles entre le prédicat et ses arguments. Une partie de la nature syntaxique des relations est marquée par d’autres moyens que des moyens flexionnels. a. Relation R3. Rappelons l’exemple «nos avons donet Warnier [. . .] une mason» (Document 1252–03–01b, 3).
Si l’on ignore les contraintes d’ordre séquentiel (→3.4.4.3), la phrase est ambiguë: aucune marque ne distingue le bénéficiaire du patient. Néanmoins, nul ne penserait qu’un bâtiment puisse être le bénéficiaire de l’action dénotée par le prédicat. Mais ce cas n’est pas le plus fréquent. L’emploi d’un adverbe comme a124 permet souvent de lever l’ambiguïté. L’adverbe explicite la relation qui unit R3 au prédicat. Par exemple: «li abbesse [4] et li covens de_la maison de Robermont deleiz Liege ont doneit a trecens a Ja-[5]-kemin le Rotial et a dame Eveltte, sa femme, une curt et une maison [. . .]» (Document 1260–02–21b, 3).
Et pour l’exemple étudié: *nos avons donet a Warnier [. . .] une mason.
La présence ou non de l’adverbe a ne change rien à l’existence de la relation syntaxique, mais explicite ou clarifie le sens de cette dernière. L’adverbe en question peut être considéré comme un relateur, dont la valeur sémantique s’envisage par rapport au rôle sémantique que l’argument dont il est le constituant immédiat exprime, et donc au travers de la relation qui lie cet argument au prédicat. On définira relateur comme indiqué dans la figure 3.37. Cette marque de spécification s’oppose d’une part aux segments spécifiants synthétiques (flexion) par le fait qu’il est un mot, d’autre part aux constituants impliqués dans la relation qu’il spécifie par le fait qu’il ne contracte 123 Dans une perspective diachronique, il est clair que c’est la coexistence de marques faculta-
tives qui permet la variation et, partant, le changement. 124 Selon la définition morphologique de l’adverbe (→3.3.3.3).
107
relateur @mot @spécifiant une relation qu’il n’entretient pas directement F IG . 3.37 – Concept de relateur
pas directement cette relation. Quand une structure qui comprend un relateur voit sa relation avec une autre structure spécifiée par ce même relateur, nous dirons qu’elle est relatée. Par ailleurs, lorsqu’il est présent, le relateur a également la fonction de délimiteur: il se rencontre le plus souvent à l’extrême gauche du syntagme. Au point de vue de la réception, la présence de tels délimiteurs indique qu’on n’a plus affaire au même argument ou que la relation entre le constituant qui suit le relateur et ce qui le précède est d’un autre ordre (→3.4.6.3). Comme les relateurs sont le plus souvent employés avec des noms ou des verbes conjugués à un mode «nominal», on peut parler de marque catégorielle. Ainsi analysée, la différence qui existe entre R3 relaté et R3 non relaté implique que la construction où le relateur est absent n’est pas plus remarquable que celle où il est présent. En réalité, c’est plutôt l’inverse. Ce qui correspond exactement à ce qu’Alain Lemaréchal a fait remarquer en ce qui concerne l’emploi ou non de that pour introduire une «complétive» en anglais, et qu’il généralise comme suit (Lemaréchal 1997, 73): «[D]ans tous les cas où il y a, comme en anglais, variation (libre?) entre marque et absence de marque, on doit considérer la construction avec marque comme seconde par rapport à la construction sans marque, pour la simple raison que, s’il existe une construction sans marque qui soit interprétable et qui ne présente pas de changement profond de valeur par rapport à la construction avec marque, c’est qu’on peut se passer de la marque; il faut donc d’abord rendre compte de la construction sans marque, puisque ‹ça marche›, et expliquer ce qui lui permet de fonctionner efficacement, et ensuite seulement dégager ce que la marque segmentale ajoute, si elle ajoute quelque chose.»
Le a n’est ainsi qu’une marque supplémentaire, qui se superpose à l’information déjà contenue dans le lexème verbal – qui prévoit un actant R3. En conclusion, au moins trois marques se superposent: 1/ cas régime; 2/ orientation contenue dans les lexèmes (verbe et argument) et compatibilité des lexèmes; 3/ facultativement, le relateur a. Cette superposition permet une spécification progressive de la relation en R3. L’ajout de a est réservé à la relation R3, en contraste avec la relation R2, qui rejette cette marque.125 b. Relations C5. On trouve également des cas de C5 sans relateur, comme «Ce fut fait le lundi [. . .] a Enchastres [. . .]» (Document 1236–12–15, 13). «Ce fu fait l’an del Incarnation Nostre Saignor [. . .]» (Document 1265–05a, 49).
où l’absence et la présence de relateurs alternent parfois librement. Comparons notre dernier exemple à 125 Ce qui ne veut pas dire que tout argument autre que R3 la rejette: on trouve des A4 et des C5
relatés avec a.
108
«Che fut fait en l’an del Incarnation Nostre Saingnour Jhesu_Crist [. . .]» (Document 1263–03–31, 30).
À côté de ces alternances «libres», certains C5 ne sont jamais accompagnés de relateurs (le lundi ci-dessus), alors que d’autres le sont toujours. Mais très souvent, tous les C5 relevant d’un sémantisme particulier sont spécifiés par un relateur; par exemple: hypothèse: «Se uns hom dist lait a autre, v sous doit» (Document 1241–09, 4); but: «xl souz de ligeois qui sunt [11] assenees por faire l’anniversaire mun sangiur mun pere perpetuement» (Document 1273–12, 10).
Il serait difficile de démontrer que, par un mécanisme du genre de la translation.126 , les relateurs permettent aux constituants de contracter les fonctions argumentales en fonction du sémantisme exprimé. Les grammaires relèvent d’ailleurs de nombreux cas de figure où le syntagme au «cas régime» sans relateur a fonction de C5 exprimant le temps, mais aussi la manière, la condition, la concession ou la cause. Ainsi, Geneviève Joly (1998, 231–3) cite entre autres: manière: «Sire, fet li rois Baudemagus, salve vostre grace, il nel fera mie premiers» (Queste, 23, 11). concession: «se vos la damoisele ne poés desfendre encontre moi, l’emmenera mau gré vostre» (Trist., prose, 127, 18).
On pourrait se demander si ce n’est pas le figement, lié à certains lexèmes, qui autorise l’emploi d’un cas régime sans relateur, mais de là à dire que c’est la présence de ce dernier qui rend possibles certaines relations. . . on ne s’avancera pas. Ce qui est en revanche indubitable, c’est que les relateurs participent à la construction du sémantisme exprimé. Ils spécifient en effet une relation en se combinant à un constituant et précisent la relation qui unit ce dernier à un autre constituant de même niveau d’intégration. Le relateur ne fonctionne pas en autarcie. De plus, la spécification qu’il apporte est souvent liée à d’autres informations, en particulier à celles stockées dans le lexème verbal. Par exemple, on voit bien que la valeur de en dans les A4 suivants dépend du lexème:127 «[. . .] quant je m’en_dui aleir en Pulhe por la besongne de Sainte Eglise [. . . ]» (Document 1267–08–28, 2). «[. . .] freres Giles desor dis fut em_pais comandeis en che iii denirs» (Document 1285–07–04, 11).
3.4.4.3
Noms: spécification séquentielle
La spécification séquentielle est malheureusement un phénomène dont l’analyse est trop complexe pour que nous ayons pu en rendre compte de manière satisfaisante dans notre étude. Nous nous bornerons à mentionner sa présence. 126 Voir l’exposé succinct page 70. Voir en outre la note 156. 127 Plus le relateur est fréquent et «vide», plus sa charge spécificative dépend de l’environnement
– les cas de a et de sont les plus extrêmes.
109
La spécification par des moyens segmentaux (qu’ils soient synthétiques ou analytiques) est la plus facile à détecter. Elle n’est néanmoins pas le seul type de marque dont la langue dispose pour spécifier les relations. Revenons encore une fois à l’exemple «nos avons donet Warnier [. . .] une mason» (Document 1252–03–01b, 3).
et comparons-le à d’autres phrases triactancielles simples:128 «[. . .] je lai damme Anés, [3] me femme, ses humiers, tant com elle vivrat [. . .]» (Document 1289–01–12, 2). «La afaitat ilh frere Marsille [. . .] l’alut ke freres Wa-[8]-tirs [. . .] aportat a la maison de_le Vas Benoiete» (Document 1260–02–21a, 6).
Dans ces trois phrases, le constituant exprimant le patient est post-posé au constituant exprimant le bénéficiaire, de sorte que le R3 non relaté se trouve plus proche (en «surface») du prédicat que le R2. On peut donc considérer qu’une spécification séquentielle s’ajoute aux indices donnés par la sémantique du lexème verbal évoquée dans le paragraphe ci-dessus. Parmi les nombreux cas du corpus où le R3 non pronominal n’est pas accompagné d’un relateur, un seul place les constituants dans l’ordre inverse (le R3 est à nouveau souligné): «Et si lait xa l quatre deniers ki sont d’ekanges de_le maison Ottelet (dont Garsilhes li Bresseres doit xxii deniers et Gerars de Ty-[20]-loit doit ausi xxii deniers) Juten, le filhe Johan le Hongre» (Document 1247–06, 19).
Ainsi, bien que peu fréquente, la structure n’exploitant pas la spécification séquentielle (R3 devant R2) ne doit pas non plus être jugée plus remarquable que celle qui l’exploite. 3.4.4.4
Adverbes
D’après le classement en parties du discours, les adverbes ne peuvent comporter de marques morphologiques de catégories. Ils ignorent la flexion casuelle et donc tout phénomène d’accord. La nature morphologique des arguments conditionne les moyens mis en œuvre pour spécifier la fonction qui les relie au prédicat. Voici quelques exemples de C5 adverbiaux: « li maisons [22] de la Valz Benoiete devoiet demorer paisulement en son bon hiretage» (Document 1260–05–09, 21) «nos deviens enquerre droiturierement entre l’une parole et l’autre» (Document 1263–03–31, 7). «La afaitarent elles a 1263–07–20, 4).
[5]
frere Libier de Frelus, [. . .] xvii verges de terre» (Document
128 C’est-à-dire ne présentant pas de phénomènes de subordination ou de thématisation qui vien-
draient troubler leur structure.
110
En outre, nous avons restreint la fonction C6 à un inventaire restreint (et, ou, ne, etc.) de mots de nature adverbiale: «ains li doit aidier en bone foi» (Document 1244–01–19, 19). «Ne ne_le_porons [. . .] metre hors de no main» (Document 1263–05–27a, 4).
L’absence de flexion casuelle concorde avec le fait que l’adverbe ne commute jamais avec le pronom personnel et ne comporte aucune marque qui permettrait d’opposer S1 à R2 et R3. De ce fait, l’adverbe ressort de ces observations comme une partie du discours orientée et spécifiée en langue: une unité du lexique qui s’actualise dans une orientation liée aux fonctions C5 ou C6 et qui donne d’elle-même une spécification particulière au lien qui s’établit avec le prédicat. Les arguments de relation préspécifiée (spécification en langue, lexicale) s’opposent ainsi aux arguments de relation post-spécifiée (spécification en discours, grammaticale). Employés comme relateurs, nombre d’adverbes impliquent une spécification préexistante par rapport à la relation. Certes, cette spécification reste floue pour certains d’entre eux (a et de ont une charge spécificative très faible du fait de leur importante polysémie), qui ne sont efficaces qu’en cas de superposition de marques, mais la plupart dénotent des relations précises (devant, deriere, avant, aprés, por, contre, etc.). 3.4.4.5
Propositions avec prédicat personnel
La nature des constituants n’est pas limitée aux membres de la triade verbe, nom, adverbe: les cas fréquents de «complétives» et les rares «relatives sans antécédent» du corpus abondent dans ce sens. Certaines propositions où le prédicat est conjugué à un mode personnel sont attestées dans les fonctions argumentales. Reprenant le terme traditionnel, nous dirons que ces propositions sont subordonnées. La subordination place une proposition à prédicat personnel en position de dépendance par rapport à un autre constituant;129 au niveau argumental, ce constituant est le prédicat.130 La particularité de la proposition subordonnée est que son analyse se fait exactement de la même façon que celle de la phrase: le prédicat de la subordonnée organise de la même manière les arguments. Généralement, les subordonnées sont relatées à l’aide d’un adverbe ou d’un pronom (→a); plus rarement, il peut ne pas y avoir de relateur (→b). Nous n’aborderons pas les contraintes portant sur le mode du prédicat dans la subordonnée, lesquelles dépendent souvent du prédicat «principal» et pourraient à ce titre être également considérées comme des marques de subordination (voir le deuxième exemple ci-dessous).131 a. Présence d’un relateur. Les subordonnées sont le plus souvent introduites par un relateur: 129 En termes d’orientation, la subordonnée est orientée vers le procès qu’elle exprime,
cf. Lemaréchal 1989, 153–160. 130 Pour la subordination en syntaxe immédiate, →3.4.6.4. 131 Voir, d’un point de vue sémantique, l’excellent exposé de Gérard Moignet (1988, en particu-
lier sur les «complétives» 213–226).
111
S1: «Conute chose soit a_chascun et a_tos ke [3] nos avons donet Warnier le bolengier c’on dist de Rumezees, une mason [. . .]» (Document 1252–03–01b, 2); R2: «[. . .] je wel que cil a cui je laisse le spiaute pren-[13]-dent de tel an ki dont commencera» (Document 1272–03, 12); C5: «Se uns hom dist lait a autre, v sous doit.» (Document 1241–09, 4); C5: «Ce fust fait et donnei en l’an del Incarnation Nostre Seignor, quant li [15] milliaire corroit par mil dous cens sexante et onse [. . .]» (Document 1271–09–17, 14).
Les exemples de circonstants montrent bien que le relateur suffit parfois à lui seul à déterminer la nature du cadre posé: se exprime la condition, quand le temps. Ne généralisons cependant pas: on trouve des subordonnées C5 en que (très peu spécifiées).132 « [. . .] l’atre partie auroit pooir [12] del abatre et del destruire, ke ja n’en devroit requerre la partie ki i edefieroit.» (Document 1237–12, 11). « qu’ilh orent oi lire lor dit, ilh nos cargarent par [13] jugement [. . .] ke Facins n’avoiet rins a ce qu’il clamoiet encontre la maison [. . .]» (Document 1260–05–09, 11). « Et je tel fiez ki reporteis m’astoit [14] en amoene de Johan, le fiu Thomas devant dit, rendi entierement, ke je bien pou faere par droit et [15] par loi, [. . .] a dant Anthone de Termong [. . .]» (Document 1270–11–26, 13).
Il est très rare de rencontrer une subordonnée relatée par un pronom qui joue à elle seule un rôle argumental. Ce circonstant «thématique» en est la seule attestation dans notre corpus:133 «Ki tout menbre u ochiit home, [. . .] cors et avoirs est [7] a la volentei le signeur» (Document 1241–09, 6).
Néanmoins, l’emploi de la relative en fonction argumentale est bien attesté en ancien français, au «cas sujet» (extraits tirés de Moignet 1988, 156–157, nous soulignons): «Ki lui portat suef le fist nurrir.» (Alexis 32). «Or voi je bien qui vos a destorné a garir tant longuement[.]» (Tristan pr. 315, 2).
Mais aussi au «cas régime», que nous avons qualifié de sous-spécifié (extraits tirés de Moignet 1988, 159): «Artus sot que Frolles feisoit.» (Wace, Brut 9971). «Donc vos dirai je, dist Josephes, que vos feroiz.» (Queste 35, 3).
Il reste cependant extrêmement fréquent que la subordonnée relatée soit apposée à un nom ou un adverbe – il s’agit alors d’un fait de syntaxe immédiate (→3.4.6.4). 132 La plupart du temps, cependant, la subordonnée est apposée à un adverbe. Dans ce cas, la
relation contractée par la subordonnée est en syntaxe immédiate, voir p. 135. 133 Autres attestations en afr., voir Moignet 1988, 157.
112
Enfin, les relateurs qui spécifient la relation impliquant une subordonnée de la sorte se trouvent, dans l’immense majorité des cas, au début de la proposition en question.134 On observe donc un fonctionnement similaire à celui observé dans le cadre d’arguments nominaux (→3.4.4.2). b. Absence de relateur. En l’absence de relateur, nous estimerons – sauf si l’enchâssement ou le mode du prédicat s’y oppose – qu’il n’y a pas subordination, mais juxtaposition, et qu’on a affaire à deux phrases différentes. Il est assez exceptionnel qu’une proposition fonctionne comme un argument sans qu’aucun relateur ne l’accompagne. Nous reprendrons dans ce cas les termes traditionnels et distinguerons les incidentes des constructions paratactiques – ces dernières ne sont pas attestées en contexte argumental (→3.4.6.4 c). Les incidentes sont des propositions personnelles sans marque segmentale de subordination, mais dont l’intégration (enchâssement) trahit la position hiérarchique: elles ont fonction de C5. Parmi les incidentes, on distingue deux groupes principaux: celles qui utilisent le nom quel et celles qui utilisent la formule (c’)est a savoir/dire (voir les exemples analysés ci-dessous). Dans tous ces cas, il y a une dépendance discursive entre la principale et l’incidente. En dehors des marques intégratives, seules des raisons sémantiques ou discursives peuvent être alléguées pour asseoir la dépendance de la proposition en quel par rapport à la principale: si l’on néglige l’enchâssement, la proposition est une phrase à part entière. Généralement, le et quel sont apposés à un autre nom (→3.4.6.1 a). Il y a donc précision sémantique importante apportée par ce nom, qui contribue à renforcer l’autonomie de la proposition sur ce plan. «[. . .] nos veimes et oimes ke sires Godefrois [9] desor només avoit laisiés trois bonirs de alut, li qués alus gisoit a Musin, [10] a poveres begines del paroche de Sain Cristofle [. . .]» (Document 1270–06–06, 8).
Le corpus ne livre que deux attestations où ce n’est pas le cas: «Je weilh et ordene [. . .] que [5] li vi mars de cens, les queis j’ai lassiés en me testament sor ma maison de_le Fosse, [. . .] soient quittes et paisueles (Document 1283–02–13a, 3) Et se tient Jakemins devant dis [17] et damme Evelette, sa femme, delle maison de Robermont hiretablement une curt ki siet [18] desoz la ville de Robermont devers Jupilhe, la quele fut de_le parchon ki fut faite [. . .], par teilh condition ke [. . . ]» (Document 1260–02–21b, 16).
En ce qui concerne les incidentes contenant la formule figée (c’)est a savoir ou (c’)est a dire, par exemple, «[. . .] avons vendu az homes de religion (c’est a savoir: al abbeit et a covent de la maison de la Val [3] Saint Lambert, del ordene de Cysteaz, del esveschiet de Liege) la grosse et la menue dime de la ville et del terrois de Peres [. . .]» (Document 1265–05a, 2).
134 Il est exceptionnel que cela ne soit pas le cas. Cela n’arrive que pour quelques concessives,
qui sont par ailleurs difficiles à analyser et mériteraient une étude: «Et nos [. . .] avons au[14]-tresi en_covent [. . .] ken qu’ilh avenge de nos wendes, lor [15] stiut a warandir [. . .] » (Document 1259–01–16, 14). On dirait que le «pronom relatif» ken est rejeté devant le relateur qu – l’analyse qui consiste à faire de ce relateur un «pronom relatif» dont l’antécédent serait ken (Moignet 1988, 166) est ici rejetée.
113
on voit clairement comment ces incidentes s’insèrent dans la phrase.135 Les attestations d’autres types d’incidentes sont sporadiques, mais leur intégration rend l’analyse évidente: «Et se tient Jakemins devant dis [17] et damme Evelette, sa femme, delle maison de Robermont hiretablement une curt ki siet [18] desoz la ville de Robermont devers Jupilhe [. . .] (se moet li curs devant dite de la maison de [20] Robermont par desore nommee; s’en rent Jakemins et sei hoir chascun an a la maison de [21] Robermont par desore nommee cink solz de_ligois et dous capons) [. . .], par teilh condition ke [. . . ]» (Document 1260–02–21b, 16). « [. . .] me sires Libiers Butores prist le dit sor lui et si [14] le_dist en ce manire entre Sainte Marie et Saint Lambier a Liege (devant nos si ke devant les hommes de Chize Deu ): ke li en-[15]-fant de Corwaremme devant dit n’avoient droiet a l’alu devant nomé qu’ilh clamoient a la maison de_la Vas Benoiete (me [16] sires Libiers Butores demandat auz enfans de Corwaremme devant dis s’ilh nient clamoient a l’alu devant nomé; li enfant [17] de Corwaremme respondirent chascuns por li k’ilh nient n’avoient a l’alu devant nomé; chis dis et ces covenances devant [18] enscrites furent faietes et recordeez par_devant nos et mises en nos wardes et en nos retenances entre Sainte Marie et Saint [19] Lambier a Liege); et ke 136 li maisons de la Vas Benoiete devant dite devoiet demorer quitte et en paiz ens el alu devant nomé, [20] si k’en lor bon iretage» (Document 1264–09–07, 13). «Et li hyretages [16] ki devant est dis est teiz: trois boniers de terre, une quarte moins, ki gist sor le streie en la Mute_rue (en dois pieches), un jornal [17] de preit ki gist a le Herchonoir, [. . .] (et tot che muet del eveske), [21] et un jornal de terre ki muet de la maison et sa curt et sa maison.» (Document 1271–12–22, 15).
3.4.4.6
Propositions avec prédicat non personnel
Le seul cas à envisager est celui des propositions infinitives contractant une fonction argumentale – nous n’avons en effet pas trouvé de proposition participiale argumentale.137 Il est malaisé de décrire de manière cohérente toutes les structures où une proposition dont le prédicat est à l’infinitif est employée comme argument d’un prédicat de niveau d’intégration supérieur.138 Devant ce phénomène complexe, nous avons choisi la solution qui paraissait la plus raisonnable et la plus conforme au modèle. Une série de cas relevés sont relativement simples (→a), d’autres requièrent une discussion. La question essentielle étant de savoir à quel prédicat (l’infinitif ou le verbe qu’il complémente) se rapportent les arguments, nous analyserons d’une part les relations attributives (→b) et, d’autre part, la construction factitive et les verbes de perception (→c). a. Cas simples. Il y a tout d’abord une série de cas simples où l’infinitif constitue le prédicat d’une proposition infinitive qui peut être analysée comme le R2 du prédicat 135 Par contre, l’analyse de l’infinitif et du constituant qui le suit est nettement moins évidente
(→3.4.4.6). 136 Coordonné à la subordonnée débutant à la fin de la ligne 14. 137 Nous avons posé plus haut l’extension de la notion de proposition aux syntagmes dont le
centre est un participe (→3.4.2). 138 Le niveau d’intégration de l’infinitif n’est pas toujours évident à déterminer: est-il impliqué
dans une relation argumentale ou immédiate (→3.4.7.1)?
114
«principal»: même si l’infinitif, invariable, bloque toute possibilité d’accord et nous prive de cet indice pour évaluer l’orientation, la commutation avec le reste plausible. Dans certains cas, la proposition infinitive ne comporte aucun argument: «se il avenoit ke nobles [2] hom, nos chiers foiables Guis, cuens de Flandres, geust a ost [. . .], si com il puet faire» (Document 1263–05–27b, 1).
mais il est plus courant qu’elle comprenne un argument ou plus «s’autres [13] ke nos i clamoit droiture et voloit faire estal [. . .]» (Document 1237–12, 12). «l’eveskes doit envoier deus de ses hommes la u om nos froit tort» (Document 1242–05–02, 12).
où estal n’est pas R2 de voloit, ni deux de ses hommes. . . R2 de doit pour des raisons sémantiques. Cette analyse vaut pour tous les «semi-auxiliaires» (voloir, povoir, devoir). La construction factitive sans agent s’analyse pareillement: «je, Lowis Naveaz [. . .] et li autre homme de_le Cise Deu, faisons kenoiestre verité» (Document 1260–06–09, 1). «Nos faisons savoir [. . .] ke nos a damme Agnés Hubine de Hoy avons en doniers conteis rechies quarante set mars de lie-[4]-gois» (Document 1288–02a, 3).
verité et ke nos a damme. . . sont respectivement les régimes de kenoiestre et savoir. L’infinitive joue parfois le rôle de A4 ou de C5, mais elle est alors relatée. À nouveau, les constructions s’analysent facilement: A4139 : «cilh ki sont et ki a venir sont ke [. . .]» (Document 1265–07–04, 2); C5: «la maisons poroit aler a hyretage [. . .] sens deminer» (Document 1271–12–22, 10).
b. Relations attributives. Examinons à présent ce qui se passe quand, d’un point de vue sémantique, un constituant qui exprime un participant du procès dénoté par le prédicat à l’infinitif est également interprétable comme un participant du procès du prédicat principal. Ainsi, dans «Et ce prometons nos a_faire» (Document 1243–07–09, 16). «Nos faisons savoir a tous ke nos a damme Agnés Hubine de Hoy avons en donirs conteis rechies quarante set mars [4] de liegois [. . . ]» (Document 1288–02b, 3).
le ce du premier exemple est-il R2 de prometons ou de faire? La subordonnée du second exemple est-elle argument de faisons ou de savoir? En comparant la construction à «Et si est a savoir ke [. . . ] li dis et le taxations des deus de ces trois seroit tenus.» (Document 1263–05–27b, 12). 139 Le fait que le prédicat régissant l’infinitif soit lui-même le prédicat d’une subordonnée n’a pas
d’implication de ce point de vue. Voir →3.4.6.4 pour un développement sur les subordonnées en syntaxe immédiate.
115
[a savoir]
[est]
A4
S1
relation attributive
que. . .
F IG . 3.38 – Structure de a savoir est que. . .
[a savoir]
A4
faisons
R2
relation attributive
que. . .
F IG . 3.39 – Structure de a savoir faisons que. . .
où estre a savoir que. . . pose la coorientation (→3.4.2.1 b) entre a savoir et la subordonnée, on peut, en se souvenant de la construction de l’attribution entre R2 et A4140 , déduire que faire a savoir que. . . exprime la même relation sémantique entre les deux arguments (soit l’analyse donnée dans la figure 3.38). Similairement, on en déduit donc l’analyse donnée dans la figure 3.39. Cette hypothèse est confortée par la possibilité de coordonner (→3.4.7.2) l’infinitif relaté à un autre constituant qui s’analyse comme un A4 (→3.4.2.4): «ju [. . .] fai a_savoir et connissance [2] ke jen, a la rente et a l’amoine [. . .] meet Henri Polarde[. . .]» (Document 1273–12, 1).
L’argument connissance est coorienté par rapport au R2 (la subordonnée). c. Factitifs et verbes de perception. Les constructions factitives et l’emploi de verbes de perception comme prédicat permettent à la construction d’intégrer un argument supplémentaire, exprimant l’agent du procès dénoté par l’infinitif. Examinons trois extraits: «loerai et fera loer me femme [. . .] le pais ki est faite» (Document 1237–10–12, 4). «[. . .] ge ai priiet a mon [13] seignor l’evesque devant dit qu’il [. . .] me face [14] tenir toutes les covenances [. . .]» (Document 1264–04, 12). «si ke je oï tesmonghier [5] mon frere devant dit» (Document 1267–08–28, 4).
Dans le deuxième et le troisième exemples, le marquage casuel ne laisse aucun doute sur le statut des constituants: les formes me et mon sont limpides et la forme frere prend un -s au singulier partout où il est employé comme S1 dans le même texte. L’argument supplémentaire est donc un régime et non un sujet: voir un S1 dans cet argument serait incompatible avec le modèle. Deux questions subsistent cependant: de quel type de régime s’agit-il (R2 ou R3)? quel est le prédicat qu’il complémente? Pour la construction factitive, il n’y a pas d’attestation où cette fonction est remplie par un membre du paradigme il, le, li, mais l’argument est souvent précédé d’un relateur (spécification analytique): «Nos faisons savoir a tous ke nos [. . .] avons [. . .] rechies quarante set mars [. . .]» (Document 1288–02a, 3). 140 C’est-à-dire le traditionnel «attribut du complément d’objet direct», cf. la transformation
présentée p. 100.
116
me femme
R3
fera (1re pers. sg.)
R2
[loer. . . ]
F IG . 3.40 – Structure de fera loer me femme
R2 attribution
[ke. . .] [vos. . .]
faisons
R3
[a savoir. . .] A4
F IG . 3.41 – Structure de a savoir vos faisons ke. . .
mon frere
R2
[oï]
A4
relation attributive
tesmonghier. . .
F IG . 3.42 – Structure de oï mon frere tesmonghier
S’il s’agissait d’un R2, il faudrait admettre que ces cas seraient les seules attestations de R2 relatés dans le corpus.141 Il s’agit donc d’un R3. Or, le fait d’accepter ou non un régime dans son schéma argumental est une propriété liée au lexème verbal. Comme l’actant R3 est limité à une petite catégorie de verbes, alors que la transformation factitive ne l’est pas, il est plus économique et cohérent de considérer que ce R3 est régi par l’«auxiliaire factitif», et qu’il est prévu dans le schéma argumental de faire ainsi employé (schématiquement: voir figure 3.40). Dans certains cas, l’infinitif est relaté: «Nos vos faisons a_savoir ke nos avons vendut a maistre Conrar, chanone de Saint Donis en Liege, le nostre part [3] delle dime de Melen grosse et graile et menue [. . .]» (Document 1276–06–10b, 2).
L’analyse ne change pas, si ce n’est que l’infinitif doit être considéré comme un A4 et que la structure attributive exposée supra s’y combine (figure 3.41). Ce sont donc les informations stockées dans le verbe qui rendent possible l’interprétation des relations. Par contre, la situation des verbes de perception est toute différente. La seule attestation du corpus142 (citée ci-dessus) permet déjà de tirer des conclusions. Le lexème tesmonghier ne prévoit pas de place pour un régime dans son schéma argumental. En conséquence, l’argument est forcément R2 du verbe de perception. Nous conclurons schématiquement par la figure 3.42: R2 et A4 contractent une relation attributive, 141 Comme on l’a vu ci-dessus, R2 rejette le relateur (→3.4.4.2). 142 Mais le tour est fréquent en ancien français (cf. Ménard 1994, §165).
117
[me]
R2
[constraindre]
A4
[a tenir. . . ]
relation attributive F IG . 3.43 – Structure de me constraindre a tenir. . .
fondée sur le fait qu’ils sont des désignations de la même réalité (ils sont donc coorientés). Cette similarité sémantique se retrouve dans le lien qui unit le sujet et le prédicat (combinaison, →3.4.2.2 b). La relation attributive et la combinaison du sujet et du prédicat sont donc deux moyens morphosyntaxiques différents d’exprimer le même contenu sémantique.143 Il paraît cohérent d’expliquer de la même manière les régimes de prédicats qui sont déjà complémentés par un infinitif relaté (A4). On fera abstraction des semi-auxiliaires dans les attestations suivantes: «me puissent constraindre par lor force a te-[11]-nir ces covenances devant dites» (Document 1264–04, 10). «elle le poroit [9] destraindre a pair» (Document 1249–06–25, 8).
Malgré la proximité sémantique de la tournure factitive et de ces constructions, il n’est pas possible de soutenir que les régimes de me et le sont des R3 (figure 3.43). 3.4.4.7
Synthèse de la construction des arguments
Trois faits ressortent de manière particulièrement prégnante de ce qui précède. a. Importance de la sous-spécification. L’ancien français ne possédant qu’un système de déclinaison relativement pauvre, la spécification synthétique est souvent très lâche, et des moyens analytiques se superposent pour lever les ambiguïtés. En présence d’une forme ambiguë, nous parlons, comme le fait Alain Lemaréchal, de sous-spécification. La manière dont les relations argumentales sont spécifiées est assez claire. Le plus frappant est que l’omniprésence de la sous-spécification et la facultativité de certaines marques (→3.4.4.2) n’empêchent pas que les rôles des arguments soient exprimés sans ambiguïté. C’est un faisceau d’indices qui permet la compréhension. Le système donne une grande latitude et, d’un point de vue diachronique, prépare le changement. Les moyens mis en œuvre pour spécifier les relations peuvent être de niveau inférieur au mot (synthétiques, →3.4.4.1). Parallèlement, certaines spécifications sont faites par l’emploi de relateurs (mots indépendants). b. Délimitation des constituants. Quel que soit le moyen employé pour spécifier les relations, on constate qu’il joue également un rôle démarcatif: l’accord marque toutes les unités impliquées,144 les relateurs se rencontrent au début des structures qu’ils intègrent. Partant, il est tout à fait possible sans comprendre les structures, de les 143 Cela revient à dire que le traditionnel «sujet de la proposition infinitive» est une sorte
d’«apposition» à l’infinitif; cette position est celle que défend Marc Wilmet (2003, §642) pour le français moderne. 144 Le fait sera plus clair encore ci-dessous, quand il sera question de décrire les relations immédiates →3.4.6.1.
118
délimiter en se servant des segments dont on connaît au moins partiellement la valeur spécificative. c. Lien entre «natures» et «fonctions». Le système, souple, autorise les mots des classes du verbe et du nom à assumer toutes les fonctions argumentales (Décrites dans la section →3.4.2). Apparemment, l’adverbe est «par nature» limité à certaines fonctions (→3.4.4.4). Ces différentes fonctions peuvent également être contractées par des structures complexes: des propositions entières. Ces propositions, si elles sont personnelles, sont le plus souvent relatées; c’est-à-dire que la relation qu’elles contractent est généralement spécifiée (→3.4.4.5). Les moyens mis en œuvre pour spécifier les relations entretenues par ce genre de constituant sont généralement segmentaux et analytiques. 3.4.5
Construction des énoncés non phrastiques
Laissés en marge de l’analyse à cause de leur caractère exceptionnel, les énoncés non phrastiques se divisent en deux catégories: les structures qui expriment un procès et celles qui n’en expriment pas. 3.4.5.1
Structure exprimant un procès
L’analyse est différente suivant que le procès est exprimé par un verbe à l’infinitif ou au participe passé. a. Verbe à l’infinitif. Certains énoncés non phrastiques contiennent un verbe à l’infinitif: «Jakemes, li provost, Johans, li doïns, li archiakene et toz li capitelez de Sain Lamber de Liege, a toz ceaz ki verrunt ce letres, conoistre veriteit.» (Document 1236–05, 1). «Nos, suer Ode, par la Deu pacience humele abbeesse de la Valz Benoite delez Liege, del ordene de Ci-[2]-teaz, et trestoz li covens de cel liu meismes, a trestoz ceauz ki ces lettres veront, conoistre ve-[3]-riteit.» (Document 1259–01–16, 1) .
Dans ces exemples, les arguments comportent les mêmes marques que les arguments de prédicats personnels, si ce n’est qu’aucun constituant immédiat ne commute avec il. Néanmoins, les constituants Jakemes . . . et toz li capitelez de Sain Lamber de Liege et nos, suer Ode . . . et trestoz li covens. . . portent les marques morphologiques spécifiant habituellement S1. La structure avec un prédicat à l’infinitif est très proche de la structure proprement phrastique, mais il ne nous semble pas cohérent de la représenter de la même manière (schématiquement, voir figure 3.44). Le marquage du prétendu S1 correspond à celui du constituant qui exprime l’agent de la phrase active. Cependant, d’un point de vue sémantique, ce S1 n’est manifestement pas l’agent du procès de conoistre, qui ne serait pas attesté avec un bénéficiaire (exprimé par R3) ailleurs que dans ce type de contexte. Pour éviter les erreurs, mieux vaut partir de constructions exprimant un procès, mais ne comportant pas de verbe. «Henris, par le grase de Deu evekes de Liege, a_tos cias ki ces presens lettres veront, salut en Nostre Signeur.» (Document 1263–11, 1).
119
S1 [Jakemes. . .] [veriteit]
R2
[conoistre]
[a toz ceaz. . .]
R3 F IG . 3.44 – Structure rejetée de Jakemes. . . conoistre veriteit
[S1 Henris. . .]
R2 salut en Nostre Signeur
[R3 a tos cias. . .] F IG . 3.45 – Structure de Henri. . . salut en Nostre Signeur
«A totes justices seculees ki ces presenz letres verunt et oront, nos, Gerars, che-[2]-valiers de Berloz, Baduins, prevoz de Sain Gilhe, executor de testament jadis da_me_ [3] Jehanne, feme Johan d’Ohai, saluz et conisance de veritei.» (Document 1284–10–04, 1).
Sémantiquement, l’énoncé exprime les procès «connaître» et «saluer». Au point de vue morphosyntaxique, on remarquera: 1/ la spécification marquant l’agent de la phrase biactancielle (marque casuelle) reste présente; 2/ ces constructions sans prédicat verbal commutent parfois librement avec une phrase dont la structure est très ressemblante: «Michiez, par le Deu pascience abbés delle glise mon sainor sain Jakeme de Liege, delle [2] ordene saint Benoit, a tos ceaz ki ces letres veront fait conisance de verité.» (Document 1263–07–19, 1).
L’utilisation ou non du verbe faire ne change rien à l’emploi des marques casuelles: les relations restent spécifiées. Faute de mieux, et pour rendre compte de la proximité des structures, nous avons identifié les grands constituants de l’énoncé non phrastique à l’aide des mêmes étiquettes que celles qui ont servi pour désigner les arguments, mais ce ne sont plus les relations qui sont caractérisées (figure 3.45).145 La coordination (→3.4.7.2) de salut à une proposition infinitive, telle qu’attestée dans
145 Cela revient malheureusement à poser une sorte de «prédicat zéro».
120
[S1 Jakemes. . .] h
R2 [conoistre]
R2
[veriteit]
i
[R3 a toz ceaz. . .] F IG . 3.46 – Structure de Jakemes. . . conoistre veriteit
«A tos ceas qui ces presens letres veront, nos, li homme delle Cise Deu, salus et conoiestre verité.» (Document 1269–02–23, 1).
nous autorise à reporter l’analyse sur la structure comprenant un infinitif (figure 3.46). Il faudra néanmoins toujours garder à l’esprit que les relations décrites dans un cadre phrastique ne sont pas du même ordre que celles décrites dans un cadre non phrastique: en l’absence de prédicat, on ne peut plus parler d’arguments. b. Verbe au participe passé. Dans deux cas, le verbe n’est pas à l’infinitif, mais au participe passé: «Ce fait l’an del Incarnation [27] de Nostre Saingnor milh et cc quarante set, ens elle mois de junii» (Document 1247–06, 26). «Che fait et doneit en l’an de grasse milhe deus_cens quatre viens et set, en mois de fevrier» (Document 1288–02b).
Nous pensons que ce genre de construction est dû à une erreur du scribe et ne mérite pas ici une description approfondie. La deuxième des deux occurrences relevées se trouve dans un document dont nous possédons par ailleurs une deuxième expédition effectuée par la même main et ne présentant pas la même structure: «Che fut fait et doneit en l’an de grasse milhe dues cens quatre_vins et set, en mois de fevrier» (Document 1288–02a).
Si l’on se résigne à admettre que la seconde attestation est peu orthodoxe, il n’y aurait qu’un seul énoncé non phrastique exprimant un procès à l’aide d’un participe passé dans l’ensemble du corpus. 3.4.5.2
Structure n’exprimant pas un procès
Dans certains cas, l’énoncé non phrastique n’exprime aucun procès; c’est le cas pour les invocations du protocole initial et les signatures: «En non dou Pere, dou Fil et dou Saint Esperite, Amen.» (Document 1272–03, 1). «G. de Salud[illisible]» (Document 1289–01–12, 38).
121
[En nom du Pere. . .] [Amen. . .] F IG . 3.47 – Structure de En nom du Pere. . . Amen
Ici, l’analyse du premier niveau d’intégration doit se limiter à une simple segmentation (figure 3.47). 3.4.6
Relations immédiates
Les fonctions que les mots de la phrase-énoncé contractent ne sont pas toujours liées directement au prédicat (relation ou spécification de celle-ci). Certes, la condition nécessaire et suffisante pour pouvoir parler de phrase est la présence d’un prédicat et de ses arguments; de ce fait, si un constituant immédiat de la phrase autre que le prédicat est présent, il est forcément impliqué dans une des relations argumentales possibles avec ce dernier. Toutes les relations qui ne sont pas proprement argumentales sont forcément subordonnées à celles-ci. Elles sont donc contractées par des constituants qui ne jouent pas le rôle d’arguments, mais sont intégrées à une unité plus large. Toutefois, cela ne les empêche pas d’avoir une influence plus ou moins importante sur le rôle que le constituant intégrant peut jouer. Par exemple, dans «A toz ceaz ki cez letres veront et oront, li home de_le Chize Deu font conoistre verité» (Document 1267–10–29, 1).
il y a bien un prédicat (font), un sujet (li home. . .), un R2 (conoistre. . .) et un R3 (a toz ceaz. . .), mais décrire ces relations ne suffit pas à donner une analyse complète de la phrase: il y a une relation qui unit, dans R3, le a au reste de l’argument, de même que li et home sont organisés d’une certaine manière l’un par rapport à l’autre, etc. Par conséquent, les marqueurs ont des fonctions syntaxiques différentes:146 1/ au niveau de la syntaxe phrastique, ils expriment la relation entre l’argument et le prédicat; 2/ au niveau de la syntaxe immédiate, ils indiquent quels mots fonctionnent ensemble (démarcation des constituants). Pour décrire les relations immédiates, nous prendrons à nouveau appui sur la morphologie. Les constituants nominaux, qui comportent des marques morphologiques (→3.4.6.1 et →3.4.6.2) sont distincts de ceux qui n’en comportent pas (constituants adverbiaux, →3.4.6.3). Les propositions peuvent également contracter des rapports à ce niveau (→3.4.6.4 et →3.4.6.5). 3.4.6.1
Apposition et détermination
Du fait qu’ils sont porteurs de plus de marques, les constituants nominaux permettent de classer facilement les relations impliquées dans leur construction. Nous définirons d’abord la relation d’apposition, en transposant la notion de combinaison au niveau immédiat (→a). Nous aborderons ensuite la relation de détermination, qui place un constituant en situation de dépendance par rapport à la partie la plus «centrale» du syntagme (→b). 146 Voir la distinction entre les trois niveaux de la syntaxe selon Gilbert Lazard (→3.2.3).
122
h
[sires]
apposition
[Gerars]
i
S1
[aroit]
F IG . 3.48 – Structure de sires Gerars aroit. . .
a. Apposition. Le type de relation qui unit le sujet au prédicat aide à comprendre la manière dont s’organise le marquage des fonctions. Comme on l’a vu, la relation entre l’argument S1 et le prédicat est exprimée par des moyens flexionnels (→3.4.4.1). Or, les unités qui servent à former l’actant 1 sont également unies par un phénomène d’accord: elles partagent non seulement des marques de genre et de nombre semblables, mais aussi les marques de l’appartenance à la première série casuelle. En d’autres termes, la même marque exprime à la fois la cohésion du syntagme et la fonction que celui-ci contracte avec le prédicat. Le fait est limpide dans:147 «[. . . ] sires Gerars, par le poine et le travailh, aroit quatre mars de ligiois» (Document 1263–03–31, 17).
En plus du choix d’une forme correspondant au «cas sujet», la combinaison entre le sujet et le prédicat implique une contrainte d’accord entre les constituants du sujet. Cet accord interne à l’argument n’est pas le fait exclusif de S1: on observe un comportement similaire pour R2, R3 et C5:148 R2: «ilh ara receut le conte devant dit a home» (Document 1263–07–15, 8); R3: «nos avons donet Warnier le bolengier [. . .] une mason [4] en hiretage lui et ses oirs» (Document 1252–03–01b, 3); C5: «Ce fut fait le lundi [. . .] a Enchastres [. . .]» (Document 1236–12–15, 13).
Nous voyons une relation du même ordre entre sires et Gerars, le et comte, le et lundi qu’entre un sujet et un prédicat: une combinaison; à ceci près que la dépendance qui affecte le sujet ne se retrouve pas à ce niveau. Il y a coorientation entre chacun des constituants de ces arguments: à nouveau, d’un point de vue sémantique, ces mots dénotent des caractéristiques d’un même objet (→3.4.2.1 b). En ce qui concerne la hiérarchie des constituants et des relations, cette combinaison a une portée qui n’atteint pas le niveau des relations argumentales: la relation qui lie sires et Gerars est distincte de celle qui existe entre sires Gerars et aroit. Le terme d’apposition sera réservé à ces combinaisons qui ne lient pas le sujet et le prédicat (figure 3.48). D’autre part, l’indice morphologique d’apposition que constitue l’accord permet de déterminer parfois de manière très précise les bornes des arguments, c’est-à-dire l’endroit où ils commencent et celui où ils finissent. Cette observation contribue à relativiser l’intégrité de la démarche analytique (→3.4.1.1): il est bien clair qu’on a besoin de ces marques pour isoler les arguments. En syntaxe immédiate, l’accord est 147 Il est peu d’exemples aussi simples: le contexte ci-dessous livre en effet mes sires Gerars et
non sires Gerars. Le possessif est retranché parce qu’il implique un niveau supplémentaire de hiérarchie. Voir →3.4.7.3. 148 C6 n’est pas attesté sous forme nominale, et A4 nominal est toujours relaté. Par ailleurs, ces exemples présentent également une hiérarchisation des appositions, phénomène traité plus bas (→3.4.7.3).
123
combinaison @coorientation @cointégration S1 @syntaxe argumentale
apposition @syntaxe immédiate
F IG . 3.49 – Types de combinaisons
filhe
Dt
mon saingnor. . .
F IG . 3.50 – Structure de filhe mon saingnor. . .
un moyen relativement sûr d’évaluer que les constituants fonctionnent ensemble. Le classement des relations se précise (figure 3.49). b. Détermination. Néanmoins, toutes les unités à l’intérieur d’un argument ne sont pas forcément apposées; souvent, l’accord ne rassemble pas toutes les unités: «[. . .] damoiselle Sybille, filhe mon saingnor Leone [. . .], vint par devant [3] nos et par devant les hommes de le Chiese Deu» (Document 1260–02–03, 2). «[. . .] l’an-[5]-demain des aposteles saint Piere et saint Pol, vint par devant nos, entre Sainte [6] Marie et Saint Lambiert a Liege, sires Henris, fils Ernu Baise-aine, prestres et [7] vestis adont del auteit saint Lorent» (Document 1274–06–30, 4).
Dans le premier exemple, au niveau argumental, le constituant damoiselle Sybille, filhe mon saingnor Leone est le sujet de vint. Mais la forme de mon saingnor Leone ne correspond pas à elle seule à un sujet – on aurait certainement observé la forme *mes sires Leones dans ce cas. Cette rupture morphosyntaxique s’accompagne, sur le plan sémantique, d’une rupture référentielle: alors qu’entre les deux mots damoiselle et Sybille il n’y a pas de différence de référent (c’est de la même personne qu’on parle), filhe et Leone ne désignent pas la même personne. Nous concluons qu’un ensemble de mots qui n’est pas accordé avec le reste d’un syntagme dont la forme implique une fonction particulière (p. ex.: S1) est en situation de dépendance. Dans l’exemple, l’effacement du reste du syntagme aurait pour conséquence de changer la fonction de ce groupe par rapport au prédicat (et au surplus de produire un énoncé irrégulier149 ): **mon saingnor Leone [. . .] vint par devant Deu.
[3]
nos et par devant les hommes de le Chiese
Le constituant qui se trouve dans une telle position de rupture par rapport au syntagme est un déterminant (Dt). Il contracte une relation de détermination avec les autres membres syntaxiques de même niveau, qu’on nommera noyau. Ainsi, mon saingnor. . . détermine le mot filhe dans la figure 3.50.150 Les choses sont très claires dans le cadre d’un S1. Quant aux compléments (R2 en dehors de la relation attributive, R3, A4, C5), la rupture d’accord est parfois visible 149 Par rapport au système linguistique du texte, qui respecte la déclinaison. 150 Tout problème concernant la hiérarchie des appositions mis à part (→3.4.7.3).
124
en dehors de tout marquage de type casuel, simplement en se servant des marques du genre et du nombre: «[. . .] ches chozes sont [13] contenues plus plainement es letres le eveske devant dit ki de che sont faites.» (Document 1263–07–15, 12).
Cependant, la rupture n’est pas toujours directement perceptible, puisque ce sont les mêmes marques casuelles qui indiquent toutes ces fonctions autres que S1 (et R2 attributif) – le «cas régime».151 Ainsi, il n’y a toujours pas de différence de marquage casuel ou de marque de genre ou de nombre dans les constituants de «[le] testament Godefroit» (Document 1274–05–31b, 4).
et l’on ne peut tirer les mêmes conclusions que ci-dessus. Ces ambiguïtés sont impossibles à lever sans opérer de transformation: c’est à nouveau les connaissances lexicosémantiques qui permettent de dire que, si le R2 ou R3 qu’on cherche à évaluer était transposé en position de S1, les ruptures d’accord similaires à celles observées pour S1 seraient mises à jour. Nous reconstituons *Li testamens Godefroit est acomplis.
à partir de «Et por chu ke [24] men arme soit acuitee et chis testamens del tot acomplis, je mes en le main de mes foimains [. . .].» (Document 1289–01–12, 23).
pour aboutir aux mêmes conclusions. La spécification se fait ainsi de manière synthétique, non grâce à un marquage particulier, mais grâce à un contraste entre les marquages de constituants cointégrés. La détermination a parfois un pronom comme noyau: «[. . .] il [sont] tenut de faere cescun an troes anniversaeres : le signeur Asson, me pere, le damme Mahaut, me mere, et le Sapiente, me sereur [. . .].» (Document 1272–03, 11).
Le mécanisme de détermination est fondamentalement identique à celui de la complémentation dans le cadre actanciel. En conséquence, il nous semble intéressant d’envisager les relations entre les constituants qui ne sont pas argumentaux comme similaires à celles qui lient les arguments au prédicat. Nous nommerons sélection l’extension comprenant les relations de complémentation et de détermination – voir figure 3.51.152 Le point commun de la complémentation et de la détermination est qu’il s’agit de relations qui mettent un constituant en situation de dépendance par rapport à un autre. Ce modèle ne postule pas d’autre hiérarchie entre les constituants que celle qui oppose les combinaisons aux sélections: sauf phénomènes complexes de hiérarchie (→3.4.7.3 et →3.4.7.4), tous les déterminants sélectionnent en bloc tous les constituants apposés: 151 Dont on a souligné la «sous-spécification» (→3.4.4.2). 152 Le terme sélection vient de Louis Hjelmslev (→3.2.1).
125
sélection @non-coorientation @ou non-cointégration complémentation @syntaxe argumentale
détermination @syntaxe immédiate
F IG . 3.51 – Types de sélections
h
[le]
[decés]
i
Dt
h
[dame]
i Magon
F IG . 3.52 – Structure de le decés dame Magon possesseur
filhes
Dt
h
[a] mon sainor. . .
i
F IG . 3.53 – Structure de filhes a mon sainor. . . «le decés dame Magon [. . .]» (Document 1283–02–13b, 8).
est analysé comme indiqué dans la figure 3.52. Nous ne discuterons pas ici des problèmes spécifiques que posent l’analyse de l’«article» (considéré ici comme un nom).
3.4.6.2
Spécification de la détermination
Les exemples qui précèdent se caractérisent par l’absence de relateur: bien souvent, la rupture n’est marquée que par des moyens morphologiques. Pour exprimer la notion d’appartenance à une personne, la relation de détermination n’est marquée par aucun adverbe. De la même façon que pour la complémentation (→3.4.4.2), la langue a les moyens d’expliciter ou de spécifier la relation syntaxique entre un noyau et ses déterminants par l’emploi d’adverbes relateurs, lesquels peuvent simplement expliciter la relation déjà existante. Ainsi, les Dt avec ou sans relateurs sont en concurrence:153 «damoiselle Sybille, filhe mon saingnor Leone [. . .] vint par devant [3] nos et par devant les hommes de le Chiese Deu» (Document 1260–02–03, 2). «Mahot et Aielit, filhes a mon sainor Robiert de Corwaremme» (Document 1264–09–07, 3).
Soit, si on devait représenter schématiquement la deuxième structure, la figure 3.53. Ce schéma montre bien que le fonctionnement de la spécification est identique à celui qu’on rencontre pour R3 au niveau argumental (→3.4.4.2). 153 Cette concurrence est cependant limitée: «Le tour [sans préposition, c’est-à-dire, dans la ter-
minologie employée ici, sans relateur] a un emploi restreint en ancien français. Le déterminatif désigne presque toujours une personne [. . .]» (Moignet 1988, 92). L’auteur mentionne néanmoins quelques (rares) attestations qui font exception à cette règle.
126
En ce sens, l’analyse est assez proche de celle qu’Alain Lemaréchal (1989, 129– 138) propose du de de l’exemple tesniérien le livre d’Alfred. D’après lui, le relateur ne permet pas la relation entre livre et Alfred, mais en modifie la valeur. Étant donné le potentiel morphologique de l’ancien français, c’est la flexion qui permet ici la relation; le de ou le a s’y superpose. Dans certains cas, le relateur spécifie plus précisément la relation: «le venre-[18]-di aprés l’Ascention» (Document 1260–05–14, 17). «le judi devant la Magdalene» (Document 1263–07–19, 16).
Sémantiquement, les relateurs avant et après positionnent la circonstance exprimée par le déterminant par rapport à celle exprimée par le noyau, ici dans un contexte temporel. Il serait difficile d’affiner davantage le classement à l’aide de critères morphosyntaxiques.154 Malheureusement, arrêter le classement à ce stade mène à certains problèmes pour déterminer à quel niveau joue la sélection (→3.4.7.4). 3.4.6.3
Adverbes
Une grande partie des relateurs sont des adverbes.155 En plus de leur valeur spécificative, il faut rendre compte de leur insertion en syntaxe immédiate (→a). Par ailleurs, les relations que les adverbes non-relateurs entretiennent avec d’autres constituants réclament un peu d’attention pour être décrites correctement. En particulier, un nom peut être déterminé par un adverbe (→b) et les adverbes peuvent fonctionner ensemble, soit en se combinant ou se déterminant (→c), pour éventuellement former des relateurs complexes (→d). a. Relateurs. La fonction qui unit le relateur au reste du syntagme dont il spécifie la relation est différente de la spécification. En dehors de cette opposition, il ne paraît pas nécessaire de pousser plus loin l’analyse: l’important est de constater que le relateur fonctionne avec les termes nominaux, de la même façon qu’une désinence fléchit le mot (→3.1.2.2). Si l’on considère la hiérarchie des relations et des constituants, les 154 Alain Lemaréchal (1989, ch. 12) propose de limiter l’orientation primaire des noms en fr.
mod. aux déterminants introduits par de ou à, reléguant au second rang ceux qui sont relatés par d’autres adverbes. Nous n’adhérons pas à cette vision des choses: l’extrême variabilité de la charge spécificative des relateurs de et à nécessiterait une étude approfondie. Il n’est pas envisageable non plus de se servir du point de vue sémantique et de distinguer ici les «déterminants quantifiants» des «déterminants caractérisants» de l’analyse en constituants immédiats (Soutet 2001, 294–309), ni de poser un statut hiérarchique subordonné – ou même superordonné – à l’«article». Ce modèle postule que les déterminants gravitent autour du nom et le précisent sémantiquement: les caractérisants limitent l’ensemble des objets du monde auxquels le syntagme est applicable (p. ex.: rouge, dans fr. ballon rouge); les quantifiants dénombrent les objets dénotés (p. ex.: un, le, deux). Malheureusement, en voyant les choses ainsi, il est souvent difficile de justifier rigoureusement la position «centrale» du nom déterminé (pourquoi ballon ne limiterait-il pas l’ensemble des objets rouges?), en particulier en cas de «substantivisation d’adjectifs». 155 Voir cependant →3.4.6.4 a au sujet des pronoms relatifs.
127
spécification: BNF
[avons donet (P0)]
h
complémentation
[a]
[Warnier. . .]
i
F IG . 3.54 – Fonctions du relateur au niveau argumental possesseur
filhes
Dt
h
[a]
[mon sainor. . .]
i
F IG . 3.55 – Fonctions du relateur au niveau immédiat
relateurs font partie du constituant dont ils spécifient la relation, au même titre que les marques morphologiques de S1. Concrètement, dans l’exemple déjà abordé, *nos avons donet a Warnier [. . .] une mason.
la relation de complémentation lie a Warnier. . . au prédicat avons donet. Le groupe formé par le relateur et le constituant avec lequel il fonctionne forme un bloc, ce qui implique l’existence d’une relation entre ces constituants. De ce fait, il faudrait revoir les schémas pour noter explicitement le lien entre le relateur et le reste du syntagme (figures 3.54 et 3.55). Comme le montrent les schémas, la nature exacte de la relation entre le relateur et le reste du syntagme n’est pas précisée. Ainsi, la question: «Le relateur sélectionne-t-il le terme nominal ou est-ce au contraire ce dernier qui détermine le relateur?» restera sans réponse.156 b. Détermination d’un nom par un adverbe. La simple cooccurrence d’un adverbe qui ne soit pas un relateur dans un constituant contenant un nom constitue une rupture sur le plan morphologique. La continuité du marquage nominal est ainsi rompue par des marques intégratives et catégorielles. Par ailleurs, comme on va le voir, si le nom porte des marques spécificatives, ces dernières portent sur une relation contractée à un niveau supérieur. Par exemple, l’adverbe plus n’est pas un relateur, il ne spécifie pas la relation qui unit le constituant intégrant le nom qu’il détermine aux autres constituants de même niveau, mais apporte une précision sémantique. «Et por chu ki chis testamens soit plus fermes, ju, Bastiens, testamenteres devant dis, [35] l’ai fait saeler [. . .]» (Document 1267–08–28, 34). «Et en ai pris Philippe Tabart a home, [34] par teil devise ke ce n’est ke un sous homages de ces doze boniers ensemble [. . .]» (Document 1267–08–28, 33). 156 À première vue, c’est plutôt le relateur qui sélectionne le terme nominal, puisqu’il spécifie
la relation qui unit ce dernier à d’autres constituants de niveau supérieur. Néanmoins, dans la mesure où nous acceptons les théories de la translation – bien qu’on ne puisse y faire appel pour des raisons méthodologiques (→3.3.2) –, la présence du relateur pourrait être la condition sine qua non pour que certains mots assument certaines fonctions. Il est même des cas où le relateur peut être employé seul (sans «régime») (Lemaréchal 1989, 94–98); par exemple, devant en fr. mod.
128
[ci]
[devant]
F IG . 3.56 – Structure de ci devant
La forme de fermes résulte de la relation d’attribution qui lie plus fermes à chis testamens. De même, la forme homages est due à la relation d’attribution entre ce et sous homages. c. Relations entre adverbes. Le syntagme adverbial pose à nouveau problème du fait qu’il ne comporte pas de marques morphologiques. Que faire devant des constituants composés seulement d’adverbes? Comment décrire la relation qu’ils contractent? Soit les attestations suivantes: «sa partie des deniers ki ci devant sont nommeit» (Document 1244–01–19, 15). «la quele dette [. . .] aloit [. . .] trop damajousement» (Document 1260–02–03, 4).
Les adverbes groupés sont-ils apposés ou l’un détermine-t-il l’autre? En l’absence de repères morphosyntaxiques, seule la sémantique aide à y voir clair. Dans le premier des exemples ci-dessus, ci devant permet de comprendre en quoi consiste la coorientation dans le domaine adverbial. On a avancé que l’adverbe était une partie du discours comportant une spécification en langue (→3.4.4.4). Si tel est le cas, la valeur de la spécification de deux adverbes coorientés doit être au moins partiellement identique. Dans le cas de ci, la valeur véhiculée est celle d’une localisation spatiale (au sens propre ou figuré), alors que devant dénote une localisation spatio-temporelle. Dans ces conditions, l’apposition est envisageable (figure 3.56). On trouve également dans le corpus des attestations de ci ou devant isolés avec un sens similaire: «Et quant ci termines se-[11]-ra passés, totes le fermetés ki devant sunt dites cesseront» (Document 1249–06–25, 10). «Et par [13] ce ke les changes et les convenances ki ci sunt de-visees soient plus fermes et [14] mielz conutes, avons nos fait saeleir ceste lettre del sael les Povres [. . .]» (Document 1260–10–02, 12).
Par contre, si l’argument trop damajousement exprime le cadre du procès dénoté par aloit, nous ne pensons pas que les deux mots soient coorientés. On admettra que le sens du mot trop n’a pas changé de manière significative depuis l’ancien français: il faut le voir – sur le plan sémantique – comme un modificateur d’intensité; il est déjà peu probable qu’il manifeste la même spécification que damajousement. De plus, si l’on tente d’effacer les constituants, on constate que le sens de *la quele dette aloit trop – si tant est qu’une telle construction soit possible – s’écarte plus radicalement du sens du contexte cité que *la quele dete aloit damajousement ne s’en écarte: aler trop damajousement est une façon d’aler damajousement. La conclusion de cela est que si trop modifie le sens de la phrase, il le fait plus précisément en modifiant le sens du syntagme dans lequel il apparaît; par contre, damajousement ne modifie pas le sens de l’argument, mais le fonde. De ce fait, les deux adverbes ne peuvent être apposés. Cette relation de dépendance sur le plan sémantique implique que les relations entre 129
trop
damajousement
détermination
F IG . 3.57 – Structure de trop damajousement
par
détermination
[deseur]
F IG . 3.58 – Structure de par deseur avec détermination (hors contexte)
h
par
[desor]
i
les quatuose. . .
F IG . 3.59 – Structure de par deseur avec détermination (relateur)
par
h
i les quatuose. . .
[desor]
F IG . 3.60 – Structure de par deseur sans détermination (relateur)
h
par
[desor]
i
les quatuose. . .
F IG . 3.61 – Structure de par desor les quatuose. . .
les mots aient lieu à des niveaux d’intégration syntaxique différents: trop détermine damajousement de la même manière qu’un déterminant détermine un noyau nominal (figure 3.56). d. Relateurs complexes. Certains relateurs sont composés de plusieurs adverbes. Nous les nommerons relateurs complexes. «La reportat damoiselle Sy-[7]-bylle devant dite ens en la main del maior [. . .] douze boniere de terre errable et un jor-[9]-nal tierchal» (Document 1260–05–30b, 6). «li abbés et li covens de_la Vals Saint Lambert m’on paiet tout entiere-[3]-ment, [. . .] ce ke la grosse dime de Peres pooit plus valoir et [4] monter, par desor les quatuose vins mars ke je avoie ja receus» [. . .] (Document 1267–07–06, 2). «Sacent thuit ke l’an _de_ grase m cc lxx [. . .] vinrent par devant nos [. . .] Hen-[4]-ris li Hardis de Horion [. . .] et de sanior Ge-[6]-rare de Hemricurt [. . .]» (Document 1270–06–06, 2). «pooir avoit [6] de par l’abesse et le covent» (Document 1278–10–17, 5).
Il est assez difficile de proposer une analyse des relations internes à ces relateurs complexes. Par exemple, comme par deseur peut avoir seul la fonction C5, le raisonnement tenu ci-dessus (→c) mène au schéma 3.58. Faut-il garder cette analyse quand par deseur a une fonction de relateur (figure 3.59)? Dans ce cas, la même description convient-elle à ens en et à de par? Ou bien faut-il analyser un enchaînement de relateurs comme deux relateurs se succédant – ce qui implique une hiérarchisation du syntagme –, cf. figure 3.60. Sans une étude appropriée, il est plus prudent de décrire ces combinaisons comme des figements – à l’intérieur desquels les relations ne sont pas vraiment analysables (figure 3.61). 130
3.4.6.4
Propositions avec prédicat personnel
La subordination de propositions dont le prédicat est à un mode personnel n’est pas limitée à la construction des arguments, mais se retrouve également à tous les niveaux d’intégration inférieurs. Le mécanisme de marquage de la relation y est similaire à celui employé au niveau actanciel: un relateur exprime généralement la subordination: «A toz ceaz ki cez letres veront et oront, li home de_le Chize Deu font conoistre verité» (Document 1267–10–29, 1). «Et ilh recordarent tot en tel maniere ke chi desore est escrit.» (Document 1273–05–12, 15). «Et la ou che fut fait furent present [. . .]» (Document 1274–02–24, 15).
Dans l’état de langue étudié, l’emploi d’un relateur est quasi systématique, ce qui est compréhensible. Dans une langue où les changements d’orientation sont essentiellement marqués par la flexion nominale et les adverbes relateurs, les risques de confusion et d’ambiguïté pourraient être importants en l’absence de marque segmentale pour indiquer une relation entre une construction aussi longue et complexe que la proposition et le reste du syntagme qui l’englobe. La langue ne pouvant se servir de la morphologie pour indiquer la subordination, elle emploie des adverbes dédiés à cet usage. On a donc l’impression que du point de vue de la structure de la langue, l’emploi du relateur permet à la proposition d’assumer une fonction qu’elle ne pourrait contracter sans lui. Examinons les cas de «relatives» et «complétives» en relation avec un nom ou un adverbe. a. «Relatives» en relation avec un nom. Dans un contexte nominal, une subordonnée peut entrer en relation avec un nom et être relatée par un mot qui exprime une désignation de la même réalité que ce nom: «[. . .] ma damme Beatris, ki ja fut abbesse de la maison devant dite, en_prist don et vesture entre Sainte Marie et Saint Lam-[7]-bert [. . .]» (Document 1260–05–14, 6). «A toz ceaz ki cez letres veront et oront, li home de_le Chize Deu font conoistre verité.» (Document 1267–10–29, 1). «[. . .] Facins n’avoiet rins a ce qu’il clamoiet encontre la maison de (Document 1260–05–09, 18).
[14]
la Valz Benoite»
«Et de cest fiez Henris devant [10] diz retient un bonier, dont ilh demorat hom de fiez le saignor d’Astenoit.» (Document 1266–06–13, 9). «Item, je lai Bastien, mon anné filh, me grande maison de Sain Servais u ju [4] demoure [. . .]» (Document 1289–01–12, 3).
Tous ces cas appartiennent à la classe de ce que la grammaire traditionnelle désigne du nom de «relative» et sont très proches du français moderne. La relative entretient une relation particulière avec son antécédent. Le développement que fait Alain Lemaréchal (1997, ch. 5 et 6) à ce sujet est le suivant: d’après lui, les relatives sont des propositions que le relateur subordonne, mais aussi oriente vers l’antécédent. 131
[nom]
coorientation
h
[relateur]
proposition
i
F IG . 3.62 – Apposition d’une relative et d’un nom
[nom]
coorientation
h
[relateur]
[P0]
i
F IG . 3.63 – Apposition d’une relative et d’un nom: fonctions du relateur
L’antécédent et la relative sont, d’un point de vue sémantique, des désignations de la même réalité (cf. Lemaréchal 1997, 175); soit la figure 3.62. C’est à peu près ce que Gérard Moignet (1988, 155), qui estime que la relative est une «sorte de substantif de discours», a exprimé en ces termes: «L’être que désigne la proposition relative ainsi constituée est affecté dans une autre phrase, dite régissante,157 des fonctions grammaticales du substantif: sujet, objet, apposition, régime prépositionnel, régime absolu – ou de l’adjectif: épithète, apposition, quand il est référé à un substantif ou a un pronom, dit antécédent.»
Pour Alain Lemaréchal, tant l’antécédent que la relative sont orientés vers un participant. De même, un relateur adverbial supplémentaire orienterait la relative en conséquence; ainsi, dans fr. mod.158 hache avec laquelle Paul coupe les arbres
le nom hache et la relative seraient tous deux orientés vers l’instrument. Cette analyse ne convient que si l’on pose que le relateur nominal ne remplit pas de fonction à l’intérieur de la relative, mais ne fait que l’introduire et la spécifier. Nous préférons considérer que le nom qui joue le rôle de relateur est impliqué dans le schéma argumental du prédicat de la relative. La relation entre le relateur et le reste du syntagme est donc spécifiée (figure 3.63). Dans ce cas, autant il est aisé d’admettre qu’il y a bien coorientation entre la relative et l’antécédent, autant nous ne voyons pas comment le constituant formé par la relative (en ce compris le relateur) pourrait, en dehors de toute relation de sélection, être orienté vers autre chose que lui-même. Il y a semble-til une distinction à faire entre la fonction immédiate qui appose antécédent et relative et la fonction (éventuellement argumentale) que le constituant ainsi formé contracte. Si l’on reprend et que l’on développe le dernier exemple, on voit que le constituant en question (la hache avec laquelle Paul coupe les arbres) peut être orienté différemment:159 patient: Il a volé la hache avec laquelle Paul coupe les arbres. agent: La hache avec laquelle Paul coupe les arbres tranche bien. 157 Nous soulignons l’autonyme. 158 Pour simplifier, nous commençons l’exposé par un exemple en français moderne, qui ne
diffère pas de l’ancien français sur ce point. 159 L’«article», que l’auteur considère comme un «substantivant» du syntagme nominal
(Lemaréchal 1989, 46–54), pourrait être considéré comme coorienté.
132
instrument: Il s’est blessé avec la hache avec laquelle Paul coupe les arbres.
C’est une contrainte supplémentaire qui spécifie l’orientation au niveau argumental (marque séquentielle ou marque segmentale). L’ancien français fonctionnait déjà ainsi. Dans l’exemple qui suit, ki est la forme contrainte de S1, mais l’ensemble a toz ceaz ki cez letres veront et oront est R3: «A toz ceaz ki cez letres veront et oront, li home de_le Chize Deu font conoistre verité.» (Document 1267–10–29, 1).
La forme du relateur n’est donc pas liée au contexte intégrant, mais à la fonction qu’il a dans la subordonnée. Ce cas de coordination le montre particulièrement bien: «Alisandres [. . .] werpit le siene part de tot l’alu ki gist a Oire et sor cui li cens gist ke Jakemins d’Oire ki [7] fut lur lassat, lui et Gilet, son frere, en amoine.» (Document 1284–02–12, 5).
Dans le cadre des constituants propositionnels comportant ce type de relateur, la flexion nominale n’est ainsi d’aucun secours pour appréhender la coorientation par rapport à l’antécédent, purement sémantique.160 C’est cette coorientation qui est l’indice d’apposition de la subordonnée au nom. Puisque la spécification du relateur prend effet à l’intérieur de la subordonnée, la présence d’un adverbe spécificateur joue à un niveau syntaxique inférieur à la subordination; dans l’extrait suivant, par permet d’exprimer la cause du procès de la subordonnée: «[. . .] me sires Facins, se peres, n’en fist onkes chose par quen ilh dewiste estre deserités.» (Document 1276–07–22, 5).
Les relateurs adverbiaux se comportent de manière identique et leur orientation propre peut différer de l’orientation de la subordonnée considérée dans son ensemble: «Et de cest fiez Henris devant [10] diz retient un bonier, dont ilh demorat hom de fiez le saignor d’Astenoit.» (Document 1266–06–13, 9). «Item, je lai Bastien, mon anné filh, me grande maison de Sain Servais u ju [4] demoure [. . .]» (Document 1289–01–12, 3).
On voit bien que dont et ou jouent à la fois un rôle extérieur et intérieur à la proposition, mais la charge spécificative du relateur prend tout son effet dans la subordonnée et non dans la relation qui unit celle-ci au constituant en apposition. Quant aux parataxes, elles sont quasi inexistantes en contexte nominal: on ne relève que ces deux extraits:
160 Et de ce point de vue, on peut s’échiner à distinguer «relatives appositives» et «relatives
descriptives», mais force est de constater qu’elles sont construites de manière absolument identique, et que quel que soit le cas de envisagé, il y a toujours une forme de coréférence entre le nom et la subordonnée de même niveau: les deux constituants désignent le même objet.
133
[nom]
coorientation
h
[relateur]
proposition
i
F IG . 3.64 – Apposition d’une complétive et d’un nom «Me sires Godefroiez Valee [. . .] avoit vendut et afaietiet iii bonirs de terre d’alu [. . .] dés a_tens li_siges fut devant Aiez.» (Document 1265–04–15, 15). «Et de quele161 oire li gliese desour ditte [27] en soit en don et en vesture et lour aient quitteit, li quatre bonier d’aluz desour dis revenront quitte et paisule a devant [28] dit Baduin.» (Document 1278–04–06, 26).
Ces attestations sont bien moins précieuses que celles qui montrent que les sélections peuvent fonctionner sans relateur. On constatera simplement que ces propositions paratactiques sont toujours intégrées à un constituant C5. b. «Complétives» en relation avec un nom. Une subordonnée peut être apposée à un nom sans que le relateur ne joue de rôle à l’intérieur de la proposition. Dans ce cas, on parle traditionnellement de «complétives». Par exemple «por ce que ce soit fermement tenut, li veskes et li cuens i ont pendut lors sayaus.» (Document 1236–12–15, 12).
La structure est également celle représentée dans la figure 3.64, mais, contrairement à ce qui se passe pour les relatives, le relateur ne contracte ici aucune fonction à l’intérieur de la proposition.162 c. «Relatives» en relation avec un adverbe non relateur. La relation entre la subordonnée et un adverbe de même niveau se présente de façon similaire à celle qui unit une «relative» à un nom. Cette fois, la différence notable entre le contexte nominal et le contexte adverbial n’implique qu’une restriction au niveau des coréférences possibles et l’impossibilité d’employer un relateur nominal. «La ou totes ces choses desoir_escrites furent faites, furent homes de le (Document 1274–05–31b, 23).
[24]
Cise Deu.»
L’orientation de l’adverbe ou, codée en langue, ne joue pas au niveau de la relation que la subordonnée entretient avec la, mais à l’intérieur de la subordonnée introduite. Par contre, le fait que la et ou soient «préorientés» entraîne forcément que les orientations de la subordonnée, de son apposé, du relateur et du constituant qu’ils forment soient identiques (→3.4.6.3 c). La parataxe est également très rare, «[. . .] par ensi se riens faut a mes muebles por paier les lasses de-seur dittes, je weilh que on retrence [53] a_l’avenant de cescune lasse que je ai fait en denirs» (Document 1283–02–13b, 52). 161 Nous ne considérons pas quel comme un relateur: cela compliquerait inutilement l’analyse
de la construction la plus fréquente de quele eure que. . . 162 Il serait envisageable de poser qu’il n’y a pas de différence entre ce relateur et le que «pronom
relatif». On pourrait, suivant notre modèle, considérer le que comme un argument du prédicat de la subordonnée. Il aurait alors fonction de C5 ou de C6, avec une valeur sémantique qui serait très limitée. Nous n’avons pas encore pu tester cette vision des choses sur le corpus.
134
but
avons pendu
C5
h
por
que ceste chose. . . . . .
i
F IG . 3.65 – Structure de avons pendu. . . por que. . .
mais notons qu’un document fait systématiquement suivre la de la subordonnée (sans relateur): «[. . .] je voilh ke li iretages demoraist la ilh le voroit laisier [. . .]» (Document 1289–01–12, 10). «[. . .] je voilh ke mei foimains doisent quatre mars de ligois la ilh veront et troveront par bons clers ke men arme soit miés acuiteie [. . .]» (Document 1289–01–12, 26). «[. . .] je lais un march, le quelh me dame et li foimain donront en aournement d’atés, la ilh veront k’ilh serat miés enploiés.» (Document 1289–01–12, 26).
La particularité reste trop peu attestée pour qu’on en tire des conclusions intéressantes. Comme pour les propositions apposées à un nom, ces cas sont limités à des C5. d. «Complétives» en relation avec un adverbe non relateur. Le schéma est le suivant: adverbe et subordonnée sont également coorientés. On fera simplement remarquer que l’adverbe sert en quelque sorte de classificateur à la complétive (cf. Lemaréchal 1997, 152): «Et [13] li commandons ens em_pais si ke drois et loys porte.» (Document 1278–12–03, 12).
e. «Complétives» et «relatives» en relation avec un adverbe relateur. La plupart du temps, le rôle des subordonnées est spécifié indirectement: un relateur porte sur un ensemble formé par le nom ce et une proposition apposée; par exemple: «Et por ce que ce soit fermement tenut, li veskes et li cuens i ont pendut lors sayaus.» (Document 1236–12–15, 12).
Dans ce cas, on ne peut pas vraiment dire que la relation contractée par la subordonnée soit spécifiée: c’est la fonction du constituant ce que. . . qui est spécifiée. Par contre, il arrive qu’un relateur précède directement une subordonnée «complétive»:163 «Et por que ceste [15] chose soit plus ferme, nos avons pendu a cest present escrit nos saias propres en tesmonghage de [16] verité.» (Document 1287–10, 14). «Ne ne_le_porons, [5] nos [. . .], metre hors de no main ne desevreir, por quoi nos [. . .] ne tengnons [6] a perpetuité ces chozes des eveskes de Liege.» (Document 1263–05–27a, 4).
Dans ce cas, puisque que ne joue aucun rôle dans la complétive, nous considérons que le relateur spécifie forcément la relation qui implique la subordonnée (figure 3.65).
163 On remarque que le mot ce, qui impose un environnement nominal, est absent.
135
[P0]
h
[nom]
S1
participe (P0)
i autre argument
F IG . 3.66 – Structure rejetée de la relation entre nom et participe coorientés
[P0]
h
[nom]
h participe (P0)
ii autre argument
F IG . 3.67 – Structure de la relation entre nom et participe coorientés
3.4.6.5
Propositions avec prédicat non personnel
a. Propositions participiales. Les propositions participiales – pour rappel, nous nommons ainsi les propositions dont le prédicat est conjugué au participe passé ou au participe présent (→3.4.2.5 b) –, qui entrent en relation avec des constituants nominaux de même niveau sont coorientées par rapport à ce dernier: le prédicat de la proposition et le terme nominal expriment une propriété de l’objet dénoté. Le marquage morphologique (accord en cas, genre, nombre) est en accord avec la coorientation: «Et nos, Giles de Lageri, doiens devant nomeiz, avons pendut a cest present [7] escrit nostre saieal.» (Document 1271–12–03, 6). «la mai-[8]-son de Robermont devant dite» (Document 1260–05–14, 7). «vi mars [4] de cens [. . .] bien assis a estimation de preus-dommes» (Document 1283–02–13a, 3).
La question principale que soulève l’analyse des participiales est celle de la relation qui unit le nom coorienté à P0 au schéma argumental de la proposition. Les propositions dont le prédicat est à un mode personnel comprennent un sujet non obligatoire combiné à ce prédicat. Somme toute, la relation observée ici est fort ressemblante. Dès lors, pourquoi ne pas dire que le nom constitue un sujet? L’analyse pourrait donc être celle de la figure 3.66. Mais il s’agit d’un fait de syntaxe immédiate, parce que la relation de dépendance n’est pas la même: à notre avis, la présence d’un prédicat conjugué à un mode personnel est la condition fondatrice de la phrase (→3.4.1.2), alors que l’effacement d’un participe apposé à un nom ne change rien au rôle argumental que ce dernier peut jouer; par exemple, si on enlève devant nomeiz du premier extrait ci-dessus: *Et nos, Giles de Lageri, doiens, avons pendut a cest present escrit nostre saieal.
Par ailleurs, le nom apposé au participe ne commute pas avec il, alors que tous les autres arguments conservent leurs propriétés paradigmatiques. On préfèrera donc l’analyse présentée dans la figure 3.67. Les marques segmentales de cas correspondent d’ailleurs à la fonction du nom apposé dans la phrase, et non à son rôle par rapport au participe. «Et nos, li home [13] de la Chise Deu, ouwe la veritee et le testament bin regardeet, en feimes don et ve-[14]-sture par le consel de mut de prodomes ki la astoent a sanior Anthone devant dit en [15] nome del amoine de-sor nomee.» (Document 1270–06–06, 12).
136
relation @dépendance ou coocurrence @implique deux constituants combinaison @coorientation @cointégration S1 @contexte argumental
sélection @non-coorientation @ou non-cointégration
apposition @contexte immédiat
complémentation @contexte argumental
détermination @contexte immédiat
F IG . 3.68 – Types de relations
b. Propositions infinitives. L’infinitif est compatible avec la fonction de déterminant (il est alors relaté). «Et les xxiiii sols de [10] cens a_paier a termines [. . .] werpirent cilh Lambers Vennisons et se femme» (Document 1255–05–21, 9).
[11]
«[. . .] me_sires Wilheames devant dis avoit [6] pooir et mandement special de prendre vestures de tos les yretages [. . .]» (Document 1274–05–31b, 5).
Cette relation ne pose absolument aucun problème, même s’il n’est pas toujours évident de la distinguer d’une relation attributive (de niveau argumental). Cette distinction fera l’objet d’une section ultérieure (→3.4.7.1 b). 3.4.6.6
Synthèse des relations immédiates
Le parallélisme des fonctionnements des niveaux argumental et immédiat est clair. Tout d’abord, on retrouve le même type de relations (figure 3.68). Ce sont les mêmes marques qui sont employées aux deux niveaux pour exprimer les spécifications: les moyens casuels et les relateurs. Et du point de vue de leur nature, les constituants impliqués sont les mêmes. La seule différence, qui fonde la disjonction des niveaux argumental et immédiat, est qu’à ce dernier niveau, il n’y a que très rarement un prédicat central. En conséquence, une structure de niveau immédiat ne peut pas constituer un énoncé phrastique et est forcément dépendante, à moins que certaines conventions externes, liées au type de texte ou à la situation, ne lui permettent de jouer le rôle d’énoncé (→3.4.1.2 b). Chacun de ces phénomènes mériterait une monographie. On se limitera ici à quelques observations générales et à l’exposé des choix qui ont dû être faits. 3.4.7
Problèmes généraux
Tout d’abord, il est fréquemment problématique de déterminer avec exactitude à quel niveau de syntaxe se situent les relations observées: jouent-elles au niveau argumental ou au niveau immédiat (→3.4.7.1)? Une fois le niveau déterminé, il peut subsister des hésitations quant à la hiérarchie des structures les plus complexes. La coordination accroît le nombre de constituants de même fonction (→3.4.7.2). D’autre part, plusieurs 137
combinaisons et sélections peuvent être présentes sans qu’il soit toujours possible de déterminer exactement quels constituants elles impliquent précisément (→3.4.7.3 et →3.4.7.4). Enfin, les quelques apparitions de structures en mention et d’énoncés en latin se placent naturellement en dehors du système qui a été présenté ci-dessus (→3.4.7.6). 3.4.7.1
Relations argumentales ou relations immédiates?
Compléments et déterminants agissent de manière similaire, si ce n’est que les premiers sélectionnent un prédicat, mais non les autres. Cette propriété commune complique la description (a). Les cas les plus particuliers: l’intégration des infinitifs (b) et les phénomènes de thématisation (c) méritent un commentaire approprié. a. Généralités. Il est assez fréquent que les déterminants prennent une forme très proche des C5, mais qu’il soit impossible de les interpréter comme tels, parce qu’ils sont visiblement intégrés en syntaxe immédiate: «ilh ont enluis [3] quatre hommes: le prevost de Tret, mon saingor Henemant d’Otoncur, de par le Conte, [4] mon saingor Gilion de Barbenchon et maistre Lambert de Halos, de par le veske [. . .]» (Document 1236–12–15, 2).
Puisque quatre hommes et le prevost de Tret. . . de par le veske sont en relation d’apposition et constituent ensemble un R2, il n’est pas possible d’accorder un statut de C5 aux constituants commençant par de par. . . . Nous expliquons ainsi les constructions impliquant la formule d’une part. . . d’autre part: en fonction de l’intégration syntaxique, on analysera d’une part et d’autre part comme des C5 ou comme des Dt: C5: «Conute choise soit a tos ke l’an de grasce m cc quatre_vins [3] et on, le semedi devant le Chandeloir, vinrent par devant nos [. . .] Jehans, li fis le maoir de Horpale, d’une part, et me sires Jehans [5] c’on_dist delle Savenire [. . . ], d’atre part.» (Document 1282–02–01, 2); Dt: «[. . .] le pais ki est faite entre mon signor le veske de Liege, d’une part, et Waleran, mon [3] frere, d’atre, [. . .] sue_je tenes a faire garder [. . .]» (Document 1237–09–16, 2).
L’intégration du constituant entre. . . d’atre comme C5 empêche de considérer d’une part et d’atre comme des C5. Parfois, le niveau d’intégration ne peut être repéré qu’à l’aide de la sémantique: «Et la afaitat Gedefrois desor dis a frere Gilon de [7] Hambrut desoir nomeit et a_owés delle maison delle Va Benoite trois denirs [8] ligois de cens par an» (Document 1285–07–04, 6).
Dans le contexte, afaitier est une action ponctuelle et unique, et ne peut être compris comme itératif. Si le prédicat exprime un procès unique, un C5 présupposant une répétition (comme par an) lui est forcément incompatible. Une grande quantité de cas ne peuvent être analysés de la même manière. Il est souvent possible d’interpréter le constituant dont on cherche à définir la relation comme un Dt ou un complément de type C5: «Et avuec ces choses devant dites avons nos repris en fiez et en homage [6] de li et del eglise de Liege le dieme de Tohongne et de Wirice» (Document 1243–07–09, 5).
138
[nom]
[P0]
h
[relateur]
[infinitif]
i
F IG . 3.69 – Relation médiate entre un nom et un infinitif relaté
[P0]
h
[nom]
h
[relateur]
[infinitif]
i i
F IG . 3.70 – Structure de la détermination d’un nom par un infinitif relaté
Le constituant souligné sélectionne-t-il fiez et homage ou bien avons repris? En règle générale, on doit poser un choix arbitraire. Pour simplifier l’analyse, nous dirons que dans tous les cas ambigus (ou pour lesquels nous doutons), le constituant est un C5. C’est-à-dire qu’il est placé au niveau d’intégration le plus élevé possible dans l’arbre syntaxique. Ne perdons pas de vue que ce choix ne fait pas que déterminer le niveau d’intégration de la structure: il implique aussi un changement de statut des relations syntaxiques qui unissent les constituants. Comme indiqué plus haut.164 , si un argument entretient une relation avec un autre argument, cette relation «passe par le prédicat»: elle est médiate . b. Infinitifs. La description des schémas argumentaux impliquant un infinitif méritait déjà un exposé détaillé (→3.4.4.6). À un niveau d’analyse supérieur, déterminer si le rôle d’un infinitif doit se mesurer au niveau argumental ou immédiat ne se fait pas sans hésitation. En ancien français, en effet, la séquence nom + adverbe relateur + verbe à l’infinitif
(où le nom exprime le patient du procès de l’infinitif) est très fréquente. Prenons-en quelques exemples pour servir de cadre à la réflexion: «[. . .] Henris [2] del Aitre reconut par devant nos en justice ke la_maison del Vauz Saint Lambert at aquis a_li x stiers d’avaine hyretable-[3]-ment, a paier le jor de_la feste saint Remi [. . .]» (Document 1270–03–24, 1). «Et ce doze doniers doit_ons a le chachie [12] a refaire chascun an.» (Document 1252–03–01a, 11). «Et je [. . .] li rendi cest [6] fiez a_tenir de mi [. . .].» (Document 1270–11–26, 5). «Ceste pais et ceste assens at cre-[11]-anteit l’une partie et l’atre a tenir et a guarder.» (Document 1236–05, 10).
Comment modéliser les relations? L’hésitation porte sur le choix entre la structure qui place l’infinitif au niveau du prédicat (figure 3.69) et celle qui le place en syntaxe immédiate (figure 3.70). En d’autres termes, la relation entre le nom et l’infinitif passet-elle par le prédicat (relation d’attribution) ou l’infinitif détermine-t-il le nom? Tout d’abord, la question ne se pose que si aucun relateur ne s’intercale entre le prédicat principal et le nom. S’il y en a un, l’analyse est assez simple: le nom est déterminé par l’infinitif relaté, 164 Voir p. 94.
139
Des siez jornaz. . .
C5
[doit]
[le moitié. . .]
R2
F IG . 3.71 – Interprétation argumentale de des siez jornaz. . . doit le moitié. . .
paier
R2
h
[le moitié ]
D
h
[del trechens]
D
Des siez jornaz. . .
ii
F IG . 3.72 – Interprétation immédiate de des siez jornaz. . . doit le moitié. . . «Et ce doze doniers doit_ons a le chachie [12] a refaire chascun an.» (Document 1252–03–01a, 11).
Quand la question se pose, c’est le sens qui apporte une réponse: si, dans le cadre du procès exprimé par l’infinitif, le nom joue un rôle sans que le sens du prédicat principal ne conditionne l’existence de ce rôle, nous préférons placer l’infinitif dans la sphère du nom. L’infinitif relaté exprime une propriété du nom: «[. . .] Henris [2] del Aitre reconut par devant nos en justice ke la_maison del Vauz Saint Lambert at aquis a_li x stiers d’avaine hyretable-[3]-ment, a paier le jor de_la feste saint Remi [. . .]» (Document 1270–03–24, 1).
Le sens du prédicat at aquis n’implique pas que les «dix setiers» dont il est question soient «à paier». Par contre, si le prédicat régissant conditionne le rôle, nous préférons l’analyse argumentale: «Et je [. . .] li rendi cest [6] fiez a_tenir de mi [. . .].» (Document 1270–11–26, 5). «Ceste pais et ceste assens at cre-[11]-anteit l’une partie et l’atre a tenir et a guarder.» (Document 1236–05, 10).
On constate que, dans le premier extrait, le procès exprimé par rendi change le statut du «fief»: il devient «à tenir» de quelqu’un. c. Thématisations. Il arrive fréquemment que la structure énonciative disloque la séquence pour mettre en évidence un constituant, qui a alors la fonction énonciative de thème. Par exemple: «Des queis siez jornaz de terre desour dis nostre maisons doit paier le moitié del [14] trechens [. . .]» (Document 1280–05–04, 13). «Do quelh testament ju enlis et fais foumains [. . .] sangnor Thirri de Dynant, [. . .] dame Annés [. . .].» (Document 1289–01–12, 31).
Il y a deux manières d’analyser le résultat de cette transformation, suivant qu’on considère que la thématisation transforme le lien entre le constituant thématisé et le prédicat (figure 3.71) ou non, ce qui implique un phénomène de discontinuité (figure 3.72). Le problème vient du fait que d’un point de vue sémantique, on a l’impression que des siez jornaz. . . est une propriété de la réalité trechens et constitue en outre le cadre du procès et de l’énonciation. L’état actuel du modèle ne permet pas de prendre en 140
relation i Jakes. . . li grant eglise li maires. . . de Liege
h
S1
faisons
S1
R2 [savoir ke. . .]
F IG . 3.73 – Structure de Jakes. . ., li maire. . . de Liege faisons savoir ke. . .
compte ces hiérarchies multiples et il faut poser un choix. Bien que cette décision ne soit pas pleinement satisfaisante, la structure a été intégrée au niveau le plus élevé possible. 3.4.7.2
Coordination
Une série d’adverbes peuvent servir à augmenter le nombre de constituants impliqués dans une relation sans changer cette dernière. C’est le cas de et et ou.165 Par exemple: «por ce que ce soit fermement tenut, li veskes et li cuens i ont pendut lors sayaus.» (Document 1236–12–15, 12).
Cette construction étant traditionnellement nommée coordination, ce terme servira provisoirement à désigner la relation qui existe entre les constituants ainsi reliés par et ou ou, lesquels assument ainsi la fonction de coordonnant (ou Co). On compare traditionnellement la coordination à la «juxtaposition» (pas de Co). La construction sans Co est effectivement attestée; et c’est d’elle qu’on partira. Ainsi, par exemple, «Jakes, par la graze de Deu prevoz, Jehans, li doiens, li archediakene et toz li chapitres [2] de la grant eglise, li maires, li eschevin, li jureit et toz communs de la citeit de Lie-[3]-ge, faisons savoir [. . .] ke [. . .]» (Document 1237–12, 1).
s’analyse comme dans la figure 3.73. Cette «juxtaposition» peut être décrite en termes d’orientation. On voit ici que les deux S1 désignent des groupes de personnes différents. Pris séparément, les S1 en question sont les cibles de l’orientation primaire du prédicat. Cependant, on ne peut pas dire qu’ils soient des désignations de la même réalité. Il y a en outre une relation floue (minimale) entre les constituants juxtaposés. En cas de coordination, nous analysons le coordonnant comme une marque segmentale supplémentaire, qui spécifie la relation entre les constituants (ou les groupes de constituants) coordonnés:166 165 Les lexèmes ains, donc et mais ont généralement la fonction de C6 (→3.4.2.3 b). 166 Le nos initial a été retiré de l’attestation qui suit pour simplifier l’exposé.
141
relation addition h
[Ermensens. . . marchisse d’Arlon] [et] [Henri. . . marchis d’Arlon] S1
i
S1
faisons R2
[conissiance ke. . .] F IG . 3.74 – Structure de Ermensens. . . et Henri. . . (coordonnant spécifiant) «[. . .] Ermensens, contesse de Luceleborc et de La Roche et marchisse d’Arlon, et Henris, ses fils, quens de Lucele-[2]-borc et marchis d’Arlons, faisons conissiance [. . .] ke [. . . ]» (Document 1242–05–02, 1).
La relation qui existe entre Ermensens. . . et Henris. . . est spécifiée par et comme étant additive. Si la conjonction avait été ou, la relation aurait été spécifiée comme disjonctive (figure 3.74). Comme on le voit, de la même manière que pour les relations de complémentation et de détermination, la présence d’un adverbe vient spécifier une relation qui n’a pas besoin de lui pour s’établir. En conséquence, il n’est pas nécessaire d’avoir deux termes différents pour désigner la relation spécifiée ou non. Le terme coordination servira donc indifféremment. La coordination se retrouve à tous les niveaux d’intégration syntaxique. Son fonctionnement au niveau argumental ne diffère pas de son fonctionnement au niveau immédiat. a. Niveau argumental. Au niveau argumental, la coordination touche des P0, des S1, des R2, des R3, des A4 ou des C5. Elle semble incompatible avec C6, certainement en vertu du fait que les lexèmes employés en fonction de C6 sont les mêmes que ceux qui ont fonction de coordonnants. On se bornera à donner quelques exemples: P0: «A toz ceaz ki cez letres veront et oront, li home de_le Chize Deu font conoistre verité.» (Document 1267–10–29, 1); S1: «por ce que ce soit fermement tenut, li veskes et li cuens i ont pendut lors sayaus.» (Document 1236–12–15, 12); R2 attributif: «[Pour que les convenances] soient fermes et estables» (Document 1252–03–01a, 20); R3: «Le vivier a riwe de Hee loe li glize mon 1244–01–19, 7);
[8]
saingnor Oston et son hoir » (Document
P0 (auxilié): «nos, le chapitre, d’une part, et les citains, d’altre, sumes assenti et concordeit en teil ma-[6]-niere» (Document 1237–12, 5).
142
li glise
S1
[aura]
R2
[li deus]
F IG . 3.75 – Décomposition d’une coordination (1)
[li voweiz]
S1
[aura]
R2
[le tierce]
F IG . 3.76 – Décomposition d’une coordination (2)
relation
hh
i le glise [le deus] S1
addition h i i [et] [li voweiz] [le tierce] S1
R2
R2
[aura] F IG . 3.77 – Structure de aura li glise le deus et li voweiz le tierce
La coordination peut également lier des ensembles de constituants de niveau argumental, multipliant effectivement les schémas argumentaux autour d’un ou de plusieurs prédicats: «le viez fondement ki se joint [7] al mur del viez palais et s’estent juc al mur de la maison le prevost» (Document 1237–12, 6). «[. . .] nos, li chapitres et li communs de la citeit, communalment [. . .]» (Document 1237–12, 13).
[14]
seriens decontre et le defendriens
«[. . .] aura li glise le deus et li voweiz le tierce [. . .]» (Document 1244–01–19, 6).
Analysons le troisième exemple: la coordination implique à la fois les relations représentées dans la figure 3.75 et celles représentées dans la figure 3.76. En regroupant cela en un seul schéma, nous obtenons la figure 3.77. b. Niveau immédiat. Au niveau immédiat, la coordination est tout aussi courante. Elle permet à plusieurs constituants d’être apposés ensemble à un autre «Et nos, Ernus, Winans, et Colette [. . .] et nos maistres, Johans, archeprestes [34] de Liege devant nomeit, tesmongnhons ke nos avons pendu nos saeas [. . .]» (Document 1270–11–26, 33).
ou encore d’être déterminés simultanément par un seul déterminant: «Le tailhes, le mortemains, les messons et les batons des liu claime quittes li voweiz et ses hoirs» (Document 1244–01–19, 9). «li degreit portront iuc k’a la terre et li murs par derri-[9]-er les degreiz» (Document 1237–12, 8).
143
3.4.7.3
Hiérarchie des appositions
Comment se fier au seul critère morphologique pour séparer, à l’intérieur d’un syntagme où tous les mots sont coréférents, des groupes dont on perçoit néanmoins l’autonomie par rapport au reste du syntagme? L’exemple des titres accompagnant un nom de personne, qu’on rencontre fréquemment dans les documents, est particulièrement révélateur: «me sires Gerars» (Document 1263–03–31, 17). «mes sires Wilheames d’Awans» (Document 1268–03–10, 8).
On a l’impression que le titre forme une unité, alors que le nom de la personne en forme une autre. Pour s’en convaincre, il suffit d’observer qu’un phénomène de figement affecte le titre indépendamment du groupe coréférent. On trouve en outre des exemples qui attestent la détermination d’un seul des groupes par un syntagme non coréférent. Dans l’exemple qui suit, c’est filhe uniquement que détermine le syntagme Tyri de Jace: «damoiseelhe Lieiars, filhe saingnor Tyri de Jace» (Document 1247–06, 2).
Les mots damoiseelhe et Lieiars sont apposés à filhe, qui est déterminé par Tyri de Jace. Le potentiel syntaxique et sémantique (figé dans le lexique, mais aussi dans le rapport de ce mot avec le monde) de Lieiars ne permettrait pas que Tyri de Jace le détermine également. Ce qui légitime donc la subdivision du syntagme en syntagmes constituants, c’est que la détermination de chacun des groupes est possible sans qu’elle ne porte nécessairement sur les autres. Il est courant qu’un constituant ne détermine ainsi qu’une partie seulement d’un ensemble de mots coorientés. Qu’on repense à l’organisation des arguments autour du prédicat pour voir à quel point ce phénomène est général: ce n’est pas parce que R2 complémente le prédicat et que ce dernier est coorienté par rapport à S1 que R2 complémente S1. Tous les cas ne sont pas aussi transparents. Souvent, seul le référent peut aider à analyser la hiérarchie des appositions: «A tos cheaus ki ces lettres verront et oront, nos, Ustaces li Frans Hons de Holeingnule, Wilheames d’A-[2]-wans, chevalier, sires Henris de Nuvis et sires Gerars des Changes, escevien de Liege, salus et conissance de veriteit.» (Document 1263–03–31, 1).
Ce n’est que parce qu’on sait par ailleurs que Guillaume d’Awans n’est pas échevin de Liège (il est chevalier) qu’on peut dire que escevien de Liege est apposé exclusivement à sires Henris de Nuvis et sires Gerars des Changes. La plupart du temps, ce genre d’information nous fait défaut et il n’est pas possible de trancher. Ainsi, dans le même document, devant bon plege furent doneit de par mon saingnor Gerar de Hermees: sires Ustaces li Frans Hons de Holeingnule, li sires Wilhe-[11]-ames d’Awans, mes sires Wilheames de Waruez, chevalier [. . .] (Document 1263–03–31, 10).
144
ne connaissant pas tous les personnages se portant garants, on admet qu’il sont tous trois chevaliers, mais le système morphosyntaxique ne s’oppose pas à ce que seuls les deux derniers le soient. 3.4.7.4
Portée des sélections
Résoudre la question du niveau d’intégration (→3.4.7.1) des sélections ne suffit pas à écarter toute ambiguïté. Le problème de la hiérarchie des appositions en contexte immédiat touche en effet également les sélections, que ce soit au niveau immédiat (déterminations) ou argumental (complémentations). a. Complémentations. Le problème a déjà été évoqué quand on a abordé la segmentation du texte en énoncés: il arrive souvent que deux phrases soient reliées par et, que nous avons posé comme un C6 et non un Co (→3.4.2.3 b et →3.4.7.2), et certains constituants sont des C5 exprimant les circonstances des procès exprimés dans les deux phrases (ou parfois plus): «Et [. . .] [26] s’ilh avenoit qu’ilh la volsist sus rendre, Jakemins doit venir a la maison de Robermont [27] et lor doit sus rendre. Et li maisonz li doit rendre al enwart de proudomes ce [28] qu’ilh aurat la curt devant dite enmiedree puis l’ore qu’ilh la prist.» (Document 1260–02–21b, 25).
Le statut périphérique des C5 et leur potentiel de connexion avec n’importe quel verbe167 autorise l’analyse à cantonner ce complément à la première des deux phrases ou aux deux en même temps sans que la structure décrite ne soit profondément modifiée. Comme il n’est pas toujours possible de prouver que l’une des hiérarchies possible est meilleure que l’autre, C5 a été relié systématiquement à la phrase qui en était, d’un point de vue séquentiel, la plus proche. Un problème similaire se pose lorsqu’un C5 se trouve dans une phrase qui comporte une subordonnée (qu’elle soit de type argumental ou immédiat) et que sa position fait qu’il pourrait être complément de la principale, complément de la subordonnée, ou encore des deux en même temps: «le pais [. . .] sue_je tenes a faire garder en tel manniere ke, se [4] mes freres venoit encontre la pais u encontre akun puint de le pais, ke je le feroi amender [. . .]» (Document 1237–12, 2). «[. . .] nos devons envoier douz de nos homes la [. . .] por savoir se on li fasoit tort u non.» (Document 1243–07–09, 11).
À nouveau, on voit mal comment se prononcer avec toute la rigueur qu’on voudrait: dans le premier exemple, le C5 souligné pourrait aussi bien être complément de sue tenes que de faire ou garder; dans le second, il pourrait complémenter devons comme envoier. Or, d’un point de vue sémantique, on admettra sans problème que le cadre d’un procès soit projeté comme cadre de tout procès qui en dépendrait (ce qui est souvent exprimé par une subordination). Il est dès lors légitime de faire «remonter» la relation de complémentation le plus haut possible dans l’arbre, c’est-à-dire au niveau de la principale (figure 3.78). 167 À l’exception notable des C5 «compléments d’agents», cf. note 113.
145
S1 je. . . a faire. . .
[sue tenes]
A4
[en telle manire. . .]
C5 F IG . 3.78 – Interprétation des C5 de niveau ambigu
h
[on bonier]
[d’alu]
D
i
D
[de terre. . .]
F IG . 3.79 – Structure de on bonier d’alu de terre. . . (hiérarchie 1)
[on bonier]
D
h
[d’alu]
D
[de terre. . .]
i
F IG . 3.80 – Structure de on bonier d’alu de terre. . . (hiérarchie 2)
Par contre, il est parfois évident que le cadre du procès dénoté par le prédicat de la subordonnée n’est pas compatible avec celui de la principale. Dans ce cas, le sens s’oppose à la «remontée» du circonstant: «Jo, Jehans de Herierpont, faz savoir [. . .] ke je me sui obligiés enver le eglize mon segnor saint Lambert que, quinze jors aprés ço que ille me somonra, jo et Ide, ma femme, verons devant le ve_s_que, se nos ne [3] avons loial soigne de nos cors.» (Document 1237–10–12, 1). [2]
Il serait pragmatiquement absurde que la conditionnelle exprime le cadre du procès principal: l’obligation impliquée par ce dernier n’est pas soumise à la condition. b. Déterminations. Les faits examinés ici sont étroitement liés à la hiérarchisation des appositions et à la coordination, dont on vient d’avoir un aperçu. L’exemple suivant permet à lui seul d’exposer une bonne partie des choix que nous avons été forcé d’opérer: «on bonier d’alu de terre errile ki giest ens el terroir entre Lantins et Hambru [. . .]» (Document 1287–06–24, 6).
Tout d’abord, les deux déterminants relatés par de (d’alu et de terre errile) posent la question de leur hiérarchie réciproque. On a le choix entre les trois hiérarchies suivantes (en ignorant les relations des relateurs pour simplifier les schémas). Soit, schématiquement, la figure 3.79 ou la figure 3.80, ou encore la figure 3.81. La dernière hiérarchie – qui suppose le moins de niveaux – a été choisie à chaque fois que le doute était présent, pour les mêmes raisons que dans le cadre de la complémentation. Bien entendu, certaines structures s’opposent à cette analyse. Par exemple, les
146
D [de terre. . .] [on bonier] [d’alu]
D F IG . 3.81 – Structure de on bonier d’alu de terre. . . (structure plate)
filhe
D
h Tyri
D
[de Jace]
i
F IG . 3.82 – Structure de filhe Tyri de Jace
noms de personnes à fonction de déterminant et comprenant un déterminant présentent assurément une hiérarchie complexe: «filhe [. . .] Tyri de Jace» (Document 1247–06, 2).
est structuré comme dans la 3.82. 3.4.7.5
Structures discontinues
Il arrive que l’unité d’un constituant ne soit pas rendue explicite par la contiguïté de ses constituants immédiats. L’unité peut alors être indiquée par d’autres marques. La discontinuité d’une structure correspond à une discordance entre son contenu et la manière dont il est exprimé. Il s’agit d’un phénomène de surface.168 a. Niveau argumental. Pour S1, il est fréquent que le pronom ce permette la discontinuité: «c’est a_savoir : sires Jehans de Restees, doiens de Saint Piere de Liege, et sires Jakemes, sires de Clermont, [4] chevaliers» (Document 1278–08–01, 3).
«ce est nos grez et volanz ke le douz muis de spiate ke dame Jehane [5] desor dite at laisiet [. . .] om en face don et vesture [8] a frere Loren» [. . . ] (Document 1284–10–04, 4).
R2 est souvent discontinu lorsqu’il consiste en une proposition infinitive. «[. . .] le parties desor_nomees le devoient tenir [. . . ]» (Document 1263–03–31, 9).
b. Niveau immédiat. Le plus souvent, il s’agit de constructions «détachées»: «Je weilh et ordene ke [. . .]169 Johans, mes freres, u Lambon, ses fils, weilent et puissent assenner vi mars [4] de cens hiretablement, bien assis a estimation de preus-dommes, a manbors de l’amoine de Povres de la citeit de_Liege» (Document 1283–02–13a, 3). 168 Peut-être faut-il interpréter la discontinuité comme une sous-spécification au point de vue
séquentiel. 169 Dans ce contexte, la subordonnée est en fait hypothétique.
147
«bon plege furent doneit de par mon saingnor Gerar de Hermees: sires Ustaces li Frans Hons de Holeingnule, li sires Wilhe-[11]-ames d’Awans, mes sires Wilheames de Waruez, chevalier [. . .]» (Document 1263–03–31, 10).
Pour chacun de ces exemples, les segments soulignés font partie du même constituant, qui commute avec une des formes du pronom. 3.4.7.6
Hors système
On doit considérer comme hors système les constituants qui sont, par un mécanisme linguistique général, employés en mention, ainsi que les constructions rédigées en latin. a. Autonymes. Les emplois en mention sont très limités. Nous nous bornons à relever: « La subscripton de Clarin nos aprovons» (Document 1272–07–08, 18). «le pais ki est faite entre le glize et mon [5] segnor Ernol, de que il est fais escris qui ensi encommence : Jo, Ernos» (Document 1237–10–12, 4).
Peut-être faut-il rapprocher la deuxième partie du S1 dans la construction c’est a savoir de ces constituants en mention. Il ne s’agirait pas à proprement parler d’emploi autonymique, mais d’une forme de blocage de la structure morphosyntaxique. Cela expliquerait que la spécification du constituant ne soit pas toujours en accord avec sa fonction de S1. Par exemple, il peut être relaté «et ces vi muis assenat ilh a_prendre [. . .]; c’est a savoir: a une pieche de terre [12] ki gist en Favetus, dont ilh est v jornaz, pou plus u pou moins, et sor le cortilh la repiecie [. . .]» (Document 1271–08–16, 10).
ou, au contraire, être sous-spécifié «[. . .] a_savoir sont: Renel li Forberes de Spees, Gyles de 1283–02–21, 8).
[9]
Graz [etc.]» (Document
voire empêcher l’accord du prédicat: «[. . .] a_savoir est : Martin de Rens, Us-[10]-sur de Sain Lambier [etc.]» (Document 1276–06–10b, 9).
b. Latin. Le latin ne se rencontre pratiquement que dans des contextes particuliers correspondant aux endroits de la structure du texte qui permettent l’actualisation d’énoncés non phrastiques (→3.4.1.2 b): comme invocation initiale ou comme signature, «In nomine Patris et Filii et Spiritus Sancti, Amen.» (Document 1247–06, 1). «Magister Alardus Pilés per homines.» (Document 1285–07–21, 15).
Ces énoncés ne sont pas non plus construits autour d’un prédicat. On s’est refusé à en faire plus qu’une analyse en surface, limitée à une simple hiérarchisation de relations minimales. Le système latin est suffisamment différent du système français pour nécessiter une analyse qui lui serait propre. 148
Nous avons par ailleurs relevé un seul emprunt direct au vocabulaire de la liturgie. «Che fut fait l’an del In-[19]-carnation Nostre Sangnor Jeshu Crist milh dous cens uitante et ouut, le semedi aprés Inuocauit me» (Document 1289–03–05, 20).
3.5
Conclusions
Avant de nous lancer dans l’analyse des rapports entre les relations dégagées et la ponctuation, faisons un bilan. a. Nécessité du recours à la linguistique générale. Par une démarche positive, nous avons tenté de produire le modèle qui puisse servir à annoter les matériaux pour les interroger. Les grammaires de l’ancienne langue, si excellentes qu’elles soient, se sont révélées inadéquates à ce genre d’entreprise. Pour atteindre cet objectif, nous avons dû faire usage de concepts et de procédures d’analyse généraux: ce n’est que grâce aux progrès de la linguistique générale que le corpus a pu être analysé. Ce sont les résultats de la comparaison de nombreuses langues vivantes qui ont servi à analyser une langue dont il ne subsiste aucun locuteur; on a ainsi essayé d’éviter autant que possible l’ethnocentrisme et l’anachronisme si préjudiciables en linguistique synchronique. Nous espérons que l’enrichissement sera réciproque et que ce travail permettra de dégager des faits qui dépassent la langue étudiée. b. Souplesse du modèle. Les voies ouvertes par Alain Lemaréchal au travers du concept de la «relation minimale» permettent de procéder en deux temps: tout d’abord en repérant les relations, ensuite en analysant les spécifications. La souplesse de la procédure descriptive réside dans le fait que, si nécessaire, il est possible de se passer de l’étape de la recherche des marques spécificatives. Pour une langue qui n’est plus parlée, l’intérêt est de taille: loin de contraindre l’analyse, le modèle autorise le doute et le flottement. On pourrait même aller plus loin: fondé sur la relation minimale, par essence sous-spécifiée, le modèle s’appuie sur le flou. c. Importance de la terminologie. Dans cette démarche, on ne soulignera jamais assez l’importance de la terminologie. Nous avons voulu préserver autant que possible l’héritage traditionnel, en n’innovant que là où il était impératif de le faire. Cet héritage, il a fallu néanmoins le dompter, le soumettre à des définitions qu’on aura essayé de rendre les plus strictes possibles. Texte, mot, énoncé, phrase, syntaxe, morphologie, relation, nom, verbe, etc. sont autant de mots auxquels le lecteur est habitué, mais qui ont reçu ici une acception délimitée. Les termes ne sont pas d’un grand secours si on ne prend pas la peine de les cadrer. . . Ils sont même dangereux. Bien sûr, le refus de la «néologite» a pour effet pervers que le lecteur pourrait ne pas se rendre immédiatement compte que les termes employés ne le sont pas exactement dans leur acception traditionnelle. d. Description de l’ancien français. Le mécanisme de description a mis en évidence la similarité des structures et des relations contractées par les constituants à chacun des deux niveaux qui ont occupé la majeure partie de la section →3.4 du chapitre: combinaison (sans dépendance) et sélection apparaissent dès lors comme omniprésentes. Il en ressort principalement que la souplesse de l’ancien français est à envisager en termes de sous-spécification dans les relations de sélection. Dans beaucoup de cas, les 149
relateurs sont facultatifs, l’ordre des mots semble libre. Mais on voit déjà intuitivement que cette souplesse est limitée: certaines structures sont plus figées, plus contraintes (par exemple, la place relative des régimes). Maintenant que les relations ont reçu cette première description, il est peut-être temps de faire ressortir le rôle des relateurs et le potentiel translatif de ces derniers, de mettre en relation les parties du discours avec les fonctions. . . e. Un modèle inabouti? Au bout du compte, le modèle reste perfectible: on pourrait pousser plus loin l’analyse des marques mobilisées par les circonstants; par exemple, on pourrait analyser mieux le complément d’«agent», ou les phénomènes de figement, etc. Il y a encore beaucoup de choses à faire, et c’est un modèle incomplet et provisoire qui a été patiemment appliqué au corpus. Mais le corpus annoté peut déjà servir de terrain de travail pour étudier la ponctuation. Par ailleurs, il est le meilleur outil dont on dispose pour améliorer le modèle. Les dépouillements systématiques et exhaustifs qu’il permet rendent possibles les études qui mèneraient à une correction approfondie.
150
4
Méthode d’analyse statistique
Les chapitres précédents ont permis de construire une idée précise de ce que nous entendons par ponctuation (chapitre →2, en particulier →2.3) et par syntaxe (chapitre →3, en particulier →3.2). Les différents constituants et structures syntaxiques sont à présent définis à l’aide d’une sélection de caractéristiques morphosyntaxiques, de même qu’est délimité le champ exact de la ponctuation (au sens restreint (→2.3.1.2). Ces préalables donnent la possibilité d’étudier des relations entre les unités de ces deux domaines, que nous débutons dès le chapitre →5. Les résultats de cette étude mettent à jour le fonctionnement de la ponctuation au sens restreint. Avant de commencer l’analyse concrète des données, nous exposerons les options méthodologiques choisies: ce qui nous a mené à employer des outils statistiques, les implications de ce choix sur le traitement des données, les résultats qu’on peut attendre de ce traitement. La grande majorité de la production scientifique en linguistique romane – en particulier les études sur les états anciens des langues gallo-romanes – n’a pas recours aux méthodes statistiques pour traiter les problématiques qui lui sont spécifiques. C’est la raison pour laquelle nous avons trouvé préférable de faire un exposé détaillé justifiant l’emploi de ces méthodes et leurs fondements. Cela fera l’objet de la section →4.1 ci-dessous. Nous rappellerons les principaux problèmes inhérents à notre problématique et évaluerons la manière dont les méthodes choisies peuvent être appliquées, sinon pour les résoudre totalement, du moins pour contourner partiellement certains d’entre eux (→4.2). Nous synthétiserons cette première section par un mode opératoire général, étape qui sera également l’occasion de préciser sous quelle forme les résultats apparaîtront dans les chapitres ultérieurs (→4.3).
4.1
Introduction aux principes de statistiques employés
Les notions d’individu, de variable, de distribution statistique et de test d’hypothèse sont introduites dans cette section.1 Le lecteur qui est déjà familier avec ces notions peut sans dommage passer les paragraphes qui suivent et reprendre la lecture au point
1
Tous les calculs et graphiques de ce chapitre ont été réalisés à l’aide du langage et environnement de programmation libre R (R Development Core Team 2005).
151
→4.2, p. 158. Nous nous limiterons à présenter les concepts fondamentaux;2 d’autres techniques plus particulières seront expliquées au moment où nous en ferons usage.3 4.1.1
Individus et variables
Toute étude statistique se doit, après avoir posé clairement la question qui la motive, de définir avec précision la population qui constituera son champ d’investigation. D’un point de vue général, elle correspond tout simplement à «l’ensemble des événements (scores des étudiants, revenus des personnes, vitesses de course de rats, etc.) qui [. . .] intéressent [le chercheur].» (Howell 1998, 2).
Une population est donc un ensemble d’unités distinctes, appelées individus dans la terminologie statistique. Comme il n’est pas toujours possible d’observer l’ensemble d’une population, il faut parfois en extraire un échantillon, c’est-à-dire un certain nombre d’individus, dont l’effectif est noté n. La sélection de cet échantillon peut se révéler délicate, surtout si elle n’est pas faite aléatoirement (Howell 1998, 2–3). Par exemple, l’ensemble des chartes originales écrites à Liège avant 1292 constitue un ensemble fini de documents dont nous ne connaissons pas l’effectif. Cet ensemble peut être considéré comme la population que nous voulons étudier, chaque charte constituant un individu distinct de cette population. Les chartes retenues pour notre étude ne sont dès lors qu’un échantillon d’effectif n = 148 de la population à décrire. Le choix de ces documents a été contraint par des restrictions pratiques et n’est donc pas complètement aléatoire. Comme nous l’avons précisé lorsque nous avons parlé de la constitution du corpus (→0.2), la manière dont s’est élaborée la collection a d’inévitables conséquences sur l’homogénéité des données (→4.2). Un individu se caractérise par un ensemble de variables, auxquelles sont assignées des valeurs: «Une fois abordées la sélection des sujets et leur répartition dans des groupes de traitement, il est temps de considérer les données qui en résulteront. [. . .] Une variable est une propriété d’un objet ou événement qui peut prendre différentes valeurs. Ainsi, la couleur des cheveux est une variable parce qu’il s’agit de la propriété d’un objet (les cheveux) et qu’elle peut prendre différentes valeurs (cheveux bruns, blonds, roux, gris, etc.). [. . .] [C]haque élément de la population prend une valeur pour chaque variable. Nous pouvons encore distinguer les variables discrètes, comme le sexe ou la classe de lycée, qui ne prennent qu’un nombre limité de valeurs, et les variables continues, comme l’âge [. . .], qui peuvent prendre, au moins en théorie, n’importe quelle valeur entre les points inférieur et [4] supérieur de l’échelle.» (Howell 1998, 3–4).
2
3
Les détails de ces concepts pourront être lus dans le manuel de David Howell (1998): Méthodes statistiques en sciences humaines nous y ferons souvent référence, en mentionnant les pages précises où le lecteur pourra trouver les développements qui servent de base à notre exposé. Le classique Initiation aux méthodes de la statistique linguistique de Charles Muller (1973) est toujours très utile. Le premier chapitre du livre de Michael Oakes (1998) est également riche. Par exemple, le test dit du χ2 (p. 177s.).
152
Lorsqu’une variable est discrète, les différentes valeurs qu’elle peut prendre correspondent à autant de modalités, mutuellement exclusives, de cette variable. Les données catégorielles sont discrètes sans être numériques. Par exemple, chaque charte peut être définie par le nombre de mots qu’elle comporte (variable quantitative discrète), ou par l’institution dans les fonds de laquelle le document a été conservé (donnée catégorielle), variable dont les modalités sont: Couvent du Val-Benoît à Liège, Cathédrale Saint-Lambert à Liège, Couvent de Robermont, etc. La sélection des variables jugées utiles pour définir les individus peut être intuitive, fondée sur un programme d’étude ou encore sur les résultats d’analyses antérieures. Nous ferons bien entendu appel aux acquis découlant des chapitres →2 et →3 pour choisir ces variables et déterminer leurs valeurs. Ensemble, la sélection précise des individus et des variables, suivie de la définition de ceux-là par celles-ci, traduit les données dans une forme susceptible d’être soumise à une description statistique. 4.1.2
Distribution et représentations graphiques
L’examen individuel d’une variable quantitative montre généralement que cette dernière a un certain nombre de valeurs, chacune des valeurs apparaissant un certain nombre de fois. L’ensemble des fréquences d’occurrence des différentes valeurs dans un échantillon donné constitue la distribution de la variable observée. 4.1.2.1
Données
Raisonnons à partir d’un exemple, où les individus sont les 148 chartes de notre échantillon, décrites chacune par une variable: le rapport entre le nombre de R24 et le nombre de constituants immédiats de la phrase. Nous avons alors à notre disposition un ensemble de 148 valeurs variant entre 0 et 1; les voici par ordre croissant: 0.043 0.049 0.059 0.065 0.066 0.069 0.071 0.073 0.074 0.076 0.082 0.083 0.085 0.085 0.086 0.086 0.087 0.087 0.088 0.088 0.089 0.089 0.092 0.095 0.099 0.100 0.100 0.100 0.100 0.100 0.101 0.103 0.103 0.103 0.104 0.104 0.105 0.106 0.106 0.107 0.108 0.109 0.109 0.109 0.109 0.111 0.111 0.111 0.111 0.111 0.113 0.114 0.114 0.115 0.117 0.117 0.118 0.119 0.119 0.119 0.120 0.120 0.120 0.120 0.121 0.122 0.122 0.122 0.123 0.123 0.125 0.125 0.125 0.127 0.128 0.128 0.128 0.129 0.129 0.130 0.131 0.131 0.132 0.132 0.132 0.132 0.133 0.133 0.133 0.134 0.136 0.136 0.137 0.138 0.138 0.138 0.138 0.138 0.140 0.140 0.140 0.141 0.141 0.143 0.143 0.143 0.143 0.143 0.145 0.146 0.147 0.148 0.148 0.149 0.149 0.149 0.150 0.150 0.150 0.152 0.156 0.157 0.157 0.158 0.160 0.167 0.167 0.167 0.167 0.168 0.169 0.171 0.172 0.174 0.179 0.184 0.186 0.186 0.190 0.191 0.192 0.194 0.200 0.200 0.206 0.209 0.212 0.222 (min. = 0.043, max. = 0.22, moyenne = 0.13)
Théoriquement, chacune des valeurs pourrait apparaître entre 1 et 148 fois, mais en pratique, elle est relevée entre 1 et 5 fois. Cependant, citer ainsi toutes les valeurs de la distribution n’est pas particulièrement utile. L’une des premières tâches des statistiques est de fournir, à l’aide d’autres chiffres ou de graphiques, le meilleur résumé 4
Par exemple, le constituant nos ſaıas propres dans «noſ auons pendu a ceſt preſent eſcrít nos ſaıas propres» (Document 1287–10, 15). Voir →3.4.2.2.
153
Fréquence
80 60 40 20 0 0.00
0.05
0.10
0.15
0.20
0.25
Densité
F IG . 4.1 – Histogramme des R2 par phrase, par charte 10 8 6 4 2 0 0.00
0.05
0.10
0.15
0.20
0.25
F IG . 4.2 – Estimateur de densité des R2 par phrases, par charte
possible de ces données. Par exemple, la moyenne et l’histogramme sont des résumés de données connus de tous. 4.1.2.2
Histogramme
Représenter les valeurs sur un histogramme n’aurait pas grand sens si les fréquences n’étaient pas regroupées d’une manière ou d’une autre; par exemple, l’histogramme des fréquences de la figure 4.1 groupe les valeurs en classes, lesquelles sont reportées sur l’axe des abscisses. Ici, cinq classes de valeurs sont définies: les valeurs allant de 0 à 0.05, de 0.05 à 0.10, etc. L’axe des ordonnées indique quant à lui le nombre de documents concernés. Ainsi, pour plus de 80 documents sur 148, entre 10 et 15% des constituants immédiats de la phrase ont la fonction R2. 4.1.2.3
Courbe de densité
Pour simuler la distribution de la population dont est tiré l’échantillon, on utilise fréquemment un estimateur de densité. Celui-ci est figuré par une courbe, dont la forme suit approximativement le dénivelé de l’histogramme, mais en gomme les angles (figure 4.2). Le graphique est construit en évaluant les valeurs de y (nombre de R2 par charte) pour chaque valeur de x (ratio de présence de ces R2 par rapport aux autres constituants de même niveau) si un échantillon aux dimensions tendant vers l’infini était disponible. La densité (axe des ordonnées) doit être considérée comme la «valeur attendue de la courbe pour chaque valeur de x» (Howell 1998, 133). La courbe de densité d’une distribution évalue ainsi la probabilité des différentes valeurs de x. La totalité de la surface inférieure à la courbe représente la somme des probabilités pour toutes ces valeurs, soit 100%. L’approximation de la distribution de la population n’est pas tributaire d’une quelconque division des valeurs en classes, ce qui donne un
154
0.05
0.10
0.15
0.20
Proportion de marquage F IG . 4.3 – Boîte à moustache des R2 par phrase, par charte
aperçu plus net de la population sous-jacente.5 La courbe est d’ailleurs nettement plus douce que ne l’était l’histogramme. La distribution dessine une cloche dont la queue de gauche est approximativement égale à la queue de droite.6 La distribution est dite gaussienne ou normale (Howell 1998, ch. 3). Une distribution de ce type est adéquatement résumée par sa moyenne (x) et son écart-type (s). Ce dernier correspond à la racine carrée positive de la variance (s2 ).7 En l’occurrence, x = 0.13 et s = 0.035. Ces paramètres suffisent à dessiner la forme de la distribution. 4.1.2.4
Boîte à moustaches
Une autre manière utile de représenter les données est le graphique dit de la «boîte à moustaches» (figure 4.3).8 Celui-ci prend la forme d’une boîte grisée pourvue d’une ou de deux «moustaches» (ligne discontinue, ici horizontale, s’achevant par un trait perpendiculaire).9 La boîte montre comment l’essentiel des données se concentre autour de la médiane.10 (trait noir). Les moustaches représentent la dispersion des données Quant aux points extérieurs, il s’agit de valeurs adjacentes, qu’il faut considérer comme atypiques. L’orientation de la boîte n’a aucune signification particulière. 5 6
7
Par exemple, un histogramme comportant 50 classes, n’aurait pas présenté une forme particulière. Ceci anticipe sur la suite de l’exposé (→4.1.3), mais il est possible de se servir de tests spécifiques et de techniques de représentations pour appréhender la normalité des données. Nous ne nous étendrons pas sur le sujet. Nous indiquons au lecteur intéressé que le test de Shapiro-Wilks (Upton/Cook 2006, 388–389) sur l’échantillon ne permet pas de rejeter H0 (→4.1.3.1) et d’affirmer l’anormalité de la population. L’examen de la droite de Henry montre qu’on peut raisonnablement accepter la normalité. Voir annexe 4.1.2.3.shapiro.txt. Voir Howell 1998, 50–51. La variance est calculée en faisant la somme des écarts au carré de chaque valeur (où x représente chaque valeur et n la taille de l’échantillon): s2 =
P
(x − x)2 n−1
(4.1)
8
Voir Howell 1998, §2.10. Voir Howell 1998, 60–63. 10 Valeur de la distribution qui compte autant de valeurs qui lui sont inférieures que de valeurs qui lui sont supérieures; voir Howell 1998, 39.
9
155
Densité
10 8 6 4 2 0 0.00
0.05
0.10
0.15
0.20
0.25
F IG . 4.4 – Probabilité que R2 6 5%
4.1.3
Test d’hypothèse
Les propriétés des distributions servent, entre autres, à tester des hypothèses, c’est-àdire à inférer des informations à partir de la structure des données. Ces inférences sont fondées sur le concept fondamental d’hypothèse nulle (→4.1.3.1). Néanmoins, l’emploi de méthodes mathématiques pour étudier les données n’affranchit pas totalement le chercheur du recours à son propre jugement (→4.1.3.2). 4.1.3.1
Concept d’hypothèse nulle
Expliquons les principes du test d’hypothèse à partir de la distribution normale présentée ci-dessus11 (x = 0.13, s = 0.035). Imaginons la situation suivante: nous découvrons un nouveau document où laproportion de R2 constituants immédiats de la phrase est de 5%, ce qui est très faible. Nous voudrions savoir quelle est la probabilité pour ce nouveau document d’être tiré de la même population que l’échantillon déjà décrit. Il y a deux possibilités: soit le score est anormalement bas, et le document, de toute évidence, ne provient pas de la même population; soit le score n’est pas anormalement bas, et il n’y a pas de raison de considérer que le document vient d’une autre population. Dans cette dernière situation, la variation qui existe entre les deux échantillons ou populations comparés (dont, en l’occurrence, un échantillon d’un seul individu) est due au hasard. L’hypothèse selon laquelle la variation serait effectivement due au hasard est appelée situation d’indépendance. L’hypothèse nulle consiste à considérer cette indépendance comme correspondant à la réalité; on la note H0 . L’hypothèse opposée, qui consiste à dire qu’il existe une différence suffisamment importante pour qu’elle ne soit pas liée exclusivement à des causes aléatoires se nomme hypothèse alternative (notée H1 ). En règle générale, les tests donnent la probabilité que les écarts par rapport à H0 (appelés écarts à l’indépendance) soient en nombre significativement élevé. Nous avons vu que la courbe d’une distribution dessinait avec l’axe des abscisses une surface correspondant à une probabilité de 100%. N’importe quelle valeur située entre les valeurs extrêmes peut se trouver sous la courbe. La probabilité qu’une charte dont 5% des constituants immédiats de la phrase soient des R2 correspond à la surface de la courbe dont les valeurs de x sont comprises dans l’intervalle [0; 0.05] (figure 4.4). Le calcul de la probabilité est ici fait par ordinateur et est d’autant plus simple que la distribution en présence est normale et qu’on en connaît la moyenne et l’écart-type. 11 Nous n’aurons plus recours à ce test dans les pages qui suivent, mais il s’avère qu’il est le
plus simple à comprendre parmi les tests d’hypothèse et qu’il met facilement en évidence les principes du calcul des probabilités.
156
La probabilité calculée12 est de 1.2%. Cela signifie qu’il y a1.2% de chances qu’une charte provenant de lapopulation représentée par cette courbe contienne à peine 5% ou moins de R2 comme constituants immédiats de la phrase. Il n’est pas épistémologiquement valide de démontrer que H0 est vraie.13 Les tests statistiques ont beau calculer la probabilité de cette hypothèse, il sont tous orientés vers son rejet. Pour cette raison, les statisticiens sont divisés quant à la manière d’interpréter un résultat non significatif: pour certains on ne peut jamais rien conclure d’un pareil résultat; pour d’autres, il est préférable d’accepter H0 jusqu’à preuve du contraire (cf. Howell 1998, 106). Nous adopterons une position pragmatique à cet égard, en tenant compte des données et de la probabilité de H0 . L’intérêt du test se limite à indiquer qu’un phénomène qui n’est pas dû au hasard organise les données. Ces dernières constituent un monde fermé dans le cadre duquel les calculs sont effectués. En conséquence, le rejet ou non de H0 se fait sans tenir compte de la relation qui existe entre les variables étudiées et d’autres variables avec lesquelles elles pourraient être mises en relation. Par ailleurs, la comparaison des résultats avec des informations non formalisées, comme l’intuition ou la connaissance générale que le chercheur a des matériaux, fait partie de l’interprétation des résultats. 4.1.3.2
Jugement de l’utilisateur
À ce stade intervient le jugement de l’utilisateur: il peut décider que ce pourcentage est trop faible et affirmer qu’il rejette H0 et accepte en conséquence H1 . Dans ce cas, il a exactement 1.2% de chances de commettre une erreur dite de la première espèce ou erreur α.14 Dans cette erreur, il considèrera à tort que la nouvelle charte découverte fait partie d’une autre population que son échantillon de référence (148 documents). La liste des valeurs donnée au début de la section →4.1.2.1 montre qu’il est possible de se tromper de la sorte, la valeur la plus faible étant effectivement inférieure à 0.05. La tolérance de l’utilisateur à l’erreur α est décidée préalablement à l’analyse. Il est courant d’en fixer le seuil à 5%. L’erreur de la seconde espèce, ou erreur β consiste à ne pas rejeter H0 alors que H1 est vraie. On pourrait fixer le seuil α à 1%, à 1‰, ou plus bas encore: tout dépend du degré d’exigence de l’étude et des conséquences qu’il y a à commettre l’erreur α. En recherche médicale, un seuil trop élevé aurait des conséquences dramatiques; par contre, dans une étude de marketing, un seuil trop bas ne mènerait jamais à la moindre conclusion utile. Dans ce second cas, commettre l’erreur β pourrait être catastrophique. Les tests offrent donc des moyens rigoureux d’évaluer le risque qu’un utilisateur prend en rejetant l’hypothèse d’indépendance. Dans un contexte d’exploration comme le nôtre, le seuil général de 5% est classique et raisonnable. Pour chaque test effectué, la probabilité est dite significative quand elle est inférieure au seuil choisi. Par extension, les écarts à l’indépendance et les relations entre les variables seront alors dits significatifs également.
12 La fonction R employée pour ce faire est pnorm(). 13 «Tous les statisticiens s’accordent [. . .] sur un point: on ne peut jamais prétendre avoir
‹prouvé› l’hypothèse nulle.» (Howell 1998, 106). 14 Voir Howell 1998, §47.
157
4.2
Statistiques et validité des analyses
La problématique générale du travail a fixé d’emblée l’analyse des relations entre ponctuation et syntaxe comme objectif. La définition de cet objectif nous a guidé pas à pas, si bien que nous avons à présent à notre disposition une collection de données réparties en deux ensembles très différents: des structures syntaxiques et des marques de ponctuation. Toute information que nous livrent ces matériaux est évidemment intéressante, mais comment déterminer dans quelle mesure il est pertinent de lui consacrer une étude spécifique? L’étape suivante consiste ainsi à s’interroger: quelles questions voulons-nous poser aux matériaux rassemblés? Dans l’approche traditionnelle, on tend à vouloir tout expliquer, parfois sans s’assurer de la pertinence par rapport à la représentativité (numérique) des données manipulées. Or, le «bon sens» n’est d’aucun secours pour évaluer cette représentativité. Appliqués à une partie ou à l’ensemble du corpus pour en dégager les tendances générales, les tests statistiques s’affranchissent partiellement du jugement intuitif.15 Choisir d’employer les statistiques implique qu’on réfléchisse au préalable sur la manière dont ces outils s’accommodent de la nature des données, en particulier en ce qui concerne à leur complexité et leur homogénéité. Nous rappellerons donc les particularités du corpus (→4.2.1), avant de voir comment nous en avons tenu compte (→4.2.2 à →4.2.5). 4.2.1
Nature des données
Dès l’introduction (→0) nous avons souligné les principales pierres d’achoppement que le corpus met sur notre chemin: 1. Le corpus est hétérogène, aussi les observations qu’il permet de faire ne peuvent en aucun cas être généralisées: elles sont spécifiques à l’échantillon dont nous disposons; 2. les données sont nombreuses; 3. la constitution du corpus et le travail d’annotation sont en cours. À ces inconvénients, l’analyse détaillée de la morphosyntaxe et la théorisation du système graphique nous forcent à ajouter que: 3. les structures morphosyntaxiques sont complexes et récursives (chapitre →3); 4. les données sont réparties de manière disproportionnée: certaines constructions sont attestées deux ou trois fois, d’autres le sont un grand nombre de fois; 5. on ne peut échapper au délicat problème de la réduction des données. Tous ces problèmes sont plus ou moins bien gérés par des méthodes faisant appel aux dénombrements et aux statistiques. L’hétérogénéité des types discursifs, la complexité des structures et la répartition inégale des données, lorsqu’elles sont conjuguées à une grande quantité de matériaux, donnent une impression de désordre, si bien qu’il est parfois malaisé de savoir sur quoi 15 Nous verrons en effet que certains phénomènes périphériques, comme la ponctuation des
chiffres ou des noms de personne, ont été abordés sans que la pertinence de la question ne soit évaluée (→5.3.2.1 b).
158
se focaliser. Ce choix fera l’objet de notre premier développement, au point →4.2.2. Décider quelles questions méritent d’être posées constitue en effet l’étape initiale de la démarche, qui devra au bout du compte décrire le plus finement possible les informations découvertes. Toutefois, l’emploi de méthodes statistiques implique que les données soient décrites à l’aide d’une sélection limitée de variables (→4.2.3). On verra que toute sélection de variables est forcément réductrice par rapport au grand nombre d’informations potentiellement accessibles pour chaque individu. Le choix des questions et la sélection des variables sont donc synonymes de réduction de la richesse des matériaux. Pour accroître la finesse de la description, il nous faudra réintroduire une partie des informations négligées dans l’analyse. Cette démarche sera abordée sous →4.2.4. Enfin, l’enrichissement permanent du corpus et la possibilité d’étendre la problématique à d’autres corpus rend le contrôle de la qualité plus ardu que si l’échantillon était figé. Cet état dynamique a des implications à plusieurs niveaux, dont nous parlerons sous →4.2.5. 4.2.2
Pertinence des questions
Par le biais des tests d’hypothèse (→4.1.3.1), les statistiques classiques servent à déterminer s’il est raisonnable de penser qu’un phénomène n’est pas dû au hasard et s’il est éventuellement pertinent de chercher une cause à un phénomène. D’autre part, les méthodes numériques posent intrinsèquement des limites excluant les cas pour lesquels les informations disponibles ne suffisent pas à aller plus avant. Par exemple, nous verrons que dans le contexte défini par la phrase, les incidentes se distinguent du reste des constituants immédiats par la présence significativement plus fréquente d’un ponctogramme à l’initiale (→5.3.2.1). Cette observation, basée sur la pertinence statistique d’une affinité entre une construction et un marquage, répond à la question: «Le marquage initial des incidentes est-il spécifique par rapport à celui d’autres constituants également marqués à l’initiale?» avant qu’elle ne soit posée. . . Elle permet ensuite de s’interroger sur la différence qui existe entre ce marquage et celui des phrases (→6.1.4.1). À l’inverse, le lien entre la ponctuation initiale et les appositions à l’intérieur d’un constituant qui n’a pas une fonction argumentale n’est pas significatif (→5.3.2.7). Dans ce cas, vouloir expliquer ce lien serait peu utile, puisque rien ne prouve qu’il ne soit pas dû à des causes aléatoires. 4.2.3
Formalisation des données
La définition des individus à l’aide d’une série de variables est une étape fondamentale de l’analyse: pour manipuler les données, il importe qu’elles soient décrites de façon homogène. Cette définition mène obligatoirement à une réduction très importante. Par exemple, dans le cadre de la mise en évidence des tendances générales (chapitre →5) dans les relations entre la ponctuation et la syntaxe, on verra que nous avons ignoré purement et simplement la forme des ponctogrammes. De cette manière, l’analyse outillée est forcément plus grossière qu’une étude minutieuse des détails. La réduction est particulièrement importante lorsque les individus sont des unités linguistiques:
159
«[L]a méta-information, dans les cas de données textuelles, est particulièrement abondante. Chaque mot utilisé, même si c’est un mot grammatical [. . .] a droit à plusieurs lignes, ou plusieurs pages dans un dictionnaire encyclopédique.16 Les règles de grammaire constituent évidemment une méta-information fondamentale. [. . .] Le problème principal concerne la pertinence de ces différents niveaux de méta-information vis-à-vis du problème que l’on étudie.» (Lebart/Salem 1994, 21).
À cet égard, la définition des individus en vue d’un traitement statistique est une procédure assez proche de celle qui consistait, à un niveau plus abstrait, à discerner les caractères parmi les propriétés des objets, de manière à définir les concepts (chapitre →1). Chaque occurrence de construction est en rapport avec de nombreuses données d’ordres différents. Il serait effectivement possible d’intégrer d’innombrables variables au traitement, mais à l’exigence de pertinence s’ajoute celle de simplicité. Lorsqu’il est question de traiter des données syntaxiques, qui sont structurées suivant un modèle hiérarchique (chapitre →3), la récursivité multiplie virtuellement à l’infini les informations qu’il est possible d’intégrer à la description de chaque individu. S’agissant de décrire une proposition dont le prédicat est à l’infinitif, par exemple le constituant souligné dans: · en tıeſmong de ceſte [8] choſe · aj ıo faıt ceſ letreſ ſaíeler de mon˘ſaıel · lan del jncarnatıon jhesu crıst · mıl · et · cc · et · xxx · vj · [9] el moıs · de jvle (Document 1236–07, 7) ˘
il pourrait se révéler pertinent de créer une variable enregistrant si ce prédicat est également complémenté par un R2 qui lui est propre (ce qui est le cas ici). Si ce R2 est de nature propositionnelle, on pourrait continuer à relever les variables et ainsi de suite. Une telle pratique mènerait immanquablement à un relevé disproportionné et un grand nombre de modalités (les modalités «simples») seraient surreprésentées. Il faut donc sacrifier une partie de l’information et une partie de l’intérêt du corpus s’en trouve dès lors négligée. On pourrait juger sévèrement toute réduction des matériaux, arguant que l’élimination d’informations précieuses affaiblit les conclusions qu’on en tire. Le procédé est cependant obligatoire: sans lui, chaque individu serait défini par un très grand nombre de variables aux modalités extrêmement variées. La seule conclusion à laquelle l’analyse aboutirait alors est que chaque individu est l’unique représentant d’une classe particulière, dont on ne peut rien dire, faute d’effectif. . . Les statistiques n’étant réellement utilisables que si les effectifs sont suffisants, il faut se résoudre à limiter le nombre de variables et le nombre de modalités de chacune d’elles. Paradoxalement, le fait de négliger une partie de l’information permet de décrire plus efficacement les données. On évite de se perdre dans une myriade de variables complexes en sélectionnant d’emblée un petit nombre de variables simples. 4.2.4
Finesse de la description
La formalisation des données et la sélection des questions jugées pertinentes sont autant de facteurs qui diminuent la finesse de la description. 16 Sic.
160
Il nous a semblé essentiel de tenter de contrebalancer ce mouvement de réduction par deux démarches, correspondant aux deux moments où une partie de la richesse des données est laissée de côté: réintroduire les propriétés des individus qui n’ont pas été prises en compte pour effectuer des tests généraux; commenter les données insuffisantes. 4.2.4.1
Réintroduction des informations
La réintroduction d’informations supplémentaires dans le traitement statistique implique une nouvelle sélection de variables pour définir les individus. Ce choix, comme le premier, est basé sur la théorie préalable à l’analyse des relations, mais est lié aux résultats des premières analyses. Certains raffinements vont de soi et sont dans la continuité de la question posée. Ainsi, on verra que nous commencerons la description de la ponctuation des constituants en opposant simplement la présence à l’absence de ponctogramme de part et d’autre, sans prendre en considération la forme du marquage (→5.0). Par exemple, nous montrerons que les circonstants propositionnels ne figurant ni à l’initiale ni à la finale de la structure qui les contient ont tendance à être marqués à la finale (→5.3.3.3 d) et, concernant le contexte, →6.1.4.6). En d’autres termes, la présence d’un signe à l’endroit indiqué par le symbole ‹⊗› dans l’exemple qui suit est conforme à une habitude générale:17 «et le remanant [7] prent ıhl en fıez de la glıſe · en tel manıre ke ſe de luj´ defaloıt ſenz hoır de ſon corſ ⊗ ke la terre reuenroıt a hlei hglısei [. . .]» (Document 1236–05, 6).
La forme du ponctogramme est réintroduite dans l’analyse dans un second temps, une fois l’étude centrée sur des constructions particulières (chapitre →7). Pour l’exemple choisi, on verra que les circonstants marqués à la finale ont tendance à ’ attirer les signes ‹/›, ‹·› et ‹·/›, soit des ponctogrammes autres que ‹·› (→7.2.4.2). En l’occurrence: [7] prent ıhl en fıez de la glıſe · en tel manıre ke ſe de luj´ defaloıt ſenz hoır de «et le remanant ’ ſon corſ · ke la terre reuenroıt a hlei hglısei [. . .]» (Document 1236–05, 6).
D’autres enrichissements sont quant à eux liés à la connaissance que le chercheur a des données qu’il analyse. Ainsi, nous ne sélectionnerons pas d’emblée une variable enregistrant si les constituants sont coordonnés ou non. L’étude du rapport entre la coordination et la ponctuation viendra ensuite et se fondera sur les conclusions de la première approche.18
17 Les grands chevrons indiquent que le parchemin était endommagé à cet endroit et que nous
avons restitué le texte. 18 Voir →6.1.5 sur l’étude du marquage dans la coordination.
161
4.2.4.2
Commentaire des données insuffisantes
Pour les données écartées des tests faute d’effectifs, nous fournirons un simple commentaire. Ce dernier pourra éventuellement servir de base à une nouvelle étude lorsque les matériaux auront été suffisamment enrichis.19 De ce fait, ces simples commentaires peuvent jouer le rôle de tremplins, préfigurant de nouvelles études capables d’exploiter les données que notre étude a dû négliger. 4.2.5
Évolution du corpus et de la démarche d’analyse
L’évolution constante du corpus impose que les procédures de dépouillements et les tests appliqués soient reproductibles (→4.2.5.1). Il est également utile d’employer des techniques qui mettent en relief les données les plus singulières, dans le but de les corriger s’il s’agit d’erreurs, ou de les étudier dans les autres cas (→4.2.5.2). Enfin, l’emploi des statistiques rend possible la critique des procédures elles-mêmes et donc leur amélioration (→4.2.5.3). 4.2.5.1
Reproductibilité
Du fait qu’elles emploient des formules mathématiques, les statistiques appliquées aux mêmes données donneront toujours le même résultat, quel que soit l’expérimentateur – pour peu qu’elles ne fassent pas appel à une simulation. L’interprétation du résultat obtenu ne saurait être remplacée par un procédé automatisé: elle reste du ressort de l’intuition et met en jeu de nombreuses connaissances dépassant largement le cadre du test. Le fait que les étapes sont reproductibles autorise à envisager un accroissement itératif des données et une comparaison des résultats obtenus. 4.2.5.2
Recherche de l’inattendu
Les méthodes statistiques ont souvent la capacité de mettre en évidence à la fois la structure générale des données et l’inattendu qui y survient. Si l’on considère ce qu’un corpus nous livre par rapport à la fiabilité des données et à leur apport informatif, il y a quatre types de résultats auxquels on s’attend: 1/ des informations fiables, qui mettent en évidence un phénomène particulier; 2/ des informations fiables qui ne mettent en évidence que des phénomènes généraux; 3/ des informations erronées, dues à des erreurs de traitement ou d’encodage, qui mettent en
19 Le corpus étant en construction (→4.2.5). Bien que les conclusions soient moins assurées
quand nous avançons une interprétation pour ces cas moins documentés, elles nous permettent généralement de mettre en évidence des phénomènes nouveaux, élargissant parfois la problématique. Par exemple, nous verrons que les occurrences du ponctogramme ‹//› sont très rares, mais n’apparaissent que dans le cas particulier de l’ajout d’un mot ou d’un groupe de mots, ce qui montre que les «accidents» survenant dans le support sont en lien direct avec l’emploi de ponctuation (→7.4.4) pour le relevé exhaustif des occurrences de ce signe et une illustration de sa réalisation.
162
évidence de pseudo-phénomènes particuliers; 4/ des informations erronées donnant l’illusion qu’il existe un phénomène général correspondant. Scientifiquement, l’objectif est de repérer et de décrire adéquatement les informations relevant des deux premiers types.20 Dans un champ d’études déjà bien investigué, les informations correctes mais triviales sont de peu d’intérêt, et le chercheur centrera ses efforts sur la recherche d’informations particulières. Par contre, dans un cas comme celui qui nous occupe, où il est question d’approcher un champ presque vierge, toute information concernant la structure des relations nous intéresse, même très générale. Dans ce cadre, les statistiques se révèlent très utiles, dans la mesure où elles permettent l’identification de structures qui émergent d’un rassemblement de phénomènes. Revenons à la distribution observée ci-dessus (pourcentage de R2 parmi les constituants immédiats de la phrase): la boîte à moustaches (→4.1.2.4) montrait qu’une partie des documents présentaient une valeur aberrante. En quoi cela nous intéresset-il par rapport à notre manière d’aborder l’erreur? Si tout se passe bien – si nous choisissons le test ou la représentation qui convient et l’appliquons correctement –, les statistiques mettront en évidence les phénomènes marginaux: elles attireront notre attention sur eux en même temps qu’elles permettront la description rigoureuse des phénomènes généraux. Concrètement, cela signifie que: 1/ nous remarquerons les exceptions, mais également les erreurs particulières; 2/ les phénomènes aléatoires seront décrits de manière synthétique; 3/ les erreurs insignifiantes passeront inaperçues au milieu des phénomènes aléatoires sans perturber outre mesure leur description. Le fait qu’il existe des valeurs aberrantes détache certains documents et nous invite à vérifier si les annotations que nous y avons faites sont correctes (en l’occurrence, elles le sont). Le traitement des erreurs ne nous retiendra pas plus longtemps. 4.2.5.3
Perfectibilité des étapes
Nous ne parlerons pas ici de la perfectibilité des étapes antérieures à l’analyse (→0.5). Il est souvent rappelé qu’une démarche doit être falsifiable pour être scientifique; nous avons plusieurs fois été amené à poser un choix allant dans ce sens. Les statistiques ont l’avantage d’être directement critiquables à différents niveaux. D’une part, leur validité propre peut être remise en question (c’est le but d’une partie de la recherche fondamentale en mathématiques21 ). D’autre part, la justesse de leur application peut être critiquée – nous verrons à plusieurs reprises que le choix du test à appliquer n’est pas aisé: il n’existe pas de test universel. De ce dernier point de vue, il est important de comprendre la façon dont les tests fonctionnent pour critiquer leur 20 À moins d’adopter une démarche méthodologique et épistémologique, dans le cadre de la-
quelle les deux derniers types d’erreur revêtent tout leur intérêt. 21 Dans ce premier cas, évidemment, les utilisateurs des statistiques sont tout bonnement obli-
gés de faire confiance aux mathématiciens dont ils utilisent les tests: «vérifier que tout est en ordre de marche, sans vice caché, est le travail du mathématicien et du statisticien. Ce sont eux qui en tant que professionnels contrôlés par leurs pairs sont à même de nous donner les instruments que nous utiliserons.» (Cibois 2003, 3).
163
utilisation. Pour cette raison, nous expliquerons autant que possible nos choix et le fonctionnement des tests employés.22 Par contre, les conclusions fondées sur une perception intuitive de grandes quantités de données ne laissent pas d’autre choix que celui de croire sur parole celui qui en est responsable. Face à de grands ensembles de données, il est parfois difficile d’éviter que la description présente des contradictions, c’est à dire des erreurs accidentelles qui ne se conforment pas au modèle choisi pour décrire les structures, ou sont en désaccord avec les faits. Ces erreurs accidentelles sont susceptibles de perturber nos conclusions.
4.3
Mode opératoire
À présent que les outils et les données ont été présentés, nous conclurons cette première section en synthétisant brièvement la manière dont nous allons dépouiller et analyser les matériaux (→4.3.1). Nous préciserons également la manière dont les données numériques qui ont servi au travail seront mentionnées dans les sections qui suivent (→4.3.2). 4.3.1
Ordre de l’analyse
Nous nous servirons des acquis des chapitres →2 et →3 pour sélectionner une série de traits généraux décrivant les constituants (fonction, présence d’un relateur, etc.) et pour observer les interactions de ces traits avec la simple présence de ponctuation au sens restreint, sans tenir compte de la forme des ponctogrammes. L’étude de ces observations dégagera les tendances générales qui gouvernent l’emploi de la ponctuation ainsi que les problèmes méthodologiques qu’elle pose. Nous commencerons donc par rechercher des tendances générales sur un matériau réduit par sélection d’un petit ensemble de variables pertinentes. Ces tendances générales mettront en évidence quelles structures doivent être comparées du point de vue de leur marquage,23 ce qui fera l’objet d’une série de questions particulières, centrées sur les constructions les plus intéressantes (chapitre →6). Suite à ces études spécifiques, nous réintroduirons une partie des traits définitoires dont l’analyse générale n’aura pas tenu compte, comme la distribution des tendances observées entre les différents documents du corpus.24 Enfin, la forme des ponctogrammes sera traitée (chapitre →7). L’emploi des tests statistiques adéquats nous apprendra s’il y a quelque chose à dire des données: c’est-à-dire s’il faut tenter une interprétation après un test donné ou s’il est intéressant d’effectuer un nouveau test. Les résultats non significatifs laisseront 22 Comme nous ne pouvons faire de ce travail une introduction aux méthodes statistiques em-
ployées, nous renverrons systématiquement à la littérature adéquate. 23 Voir le chapitre →5. 24 Voir l’analyse de la ponctuation initiale des R2 non relatés non propositionnels ne figurant
à aucune des deux bornes de la structure qui les contient: →6.1.3.4. Nous y montrons que la tendance n’est pas générale, mais qu’elle est liée à la pratique de quelques documents particuliers.
164
ainsi certaines questions en suspens. Quand les données ne suffiront pas à réaliser un test en raison de leur faible effectif, nous nous limiterons à un commentaire philologique lorsque nous le jugerons opportun. 4.3.2
Présentation des dépouillements et des résultats
Les chiffres soumis aux calculs et les résultats de ces derniers sont nécessaires à notre exposé, c’est pourquoi nous avons choisi de les présenter systématiquement dans le texte de notre étude, qui ne serait pas compréhensible sans eux. Le recours constant à de volumineuses annexes aurait rendu la lecture particulièrement laborieuse – nous ne reportons en annexe que les données trop nombreuses pour figurer décemment sur une page ou celles d’un intérêt très limité. Le texte de nos interprétations a été allégé en commentant les tableaux de manière volontairement «humaine»: entre 81% et «un très grand nombre», entre 95.91% et «quasi tous», la seule différence réside dans l’intelligibilité. Les chiffres donnent une impression de grande précision, mais ont besoin d’être replacés dans leur ordre de grandeur relatif pour être significatifs. Le lecteur intéressé par les chiffres exacts retrouvera facilement ces derniers dans le tableau commenté. Nous ne rendons pas compte de l’ensemble des tests et des essais effectués, mais uniquement des étapes qui ont été nécessaires pour aboutir à nos conclusions. L’intérêt de présenter l’ensemble des échecs et problèmes est somme toute assez limité et demanderait un effort considérable pour être rédigé de manière accessible (et certainement un autre effort considérable pour être lu).
165
5
Tendances générales
La première étape de la description consistera à rechercher les grandes tendances qui gouvernent l’apparition de la ponctuation au sens restreint. Conformément à ce que nous avons exposé supra (→4.1.1), nous commencerons par définir l’étendue de notre échantillon et les individus qui le composent, en précisant les variables et modalités retenues: celles qui décrivent les propriétés morphosyntaxiques et positionnelles des constituants d’une part, et celles qui en décrivent la ponctuation d’autre part (→5.0). Un aperçu général de chacune des variables prise isolément sera donné (→5.1), avant d’envisager la manière dont elles entrent en relation. Les «tris croisés» qui servent à évaluer les liens entre deux variables seront alors détaillés (→5.2). Nous verrons en quoi cette démarche, pour instructive qu’elle soit, reste insuffisante si l’on se borne à séparer les caractères morphosyntaxiques des constituants et nous présenterons comment nous avons contourné ce problème (→5.3). Que ce soit au point de vue des calculs impliqués ou des variables choisies pour décrire les données, ce chapitre sera relativement abstrait, la recherche de tendances générales s’accompagnant d’une réduction inévitable. Néanmoins, dans la mesure où les individus seront définis à partir des données empiriques, et comme ces dernières seront réintroduites par la suite (chapitres →6 et →7), nous pensons que ce caractère abstrait n’est pas préjudiciable.
5.0
Définition des données
La définition des données est une partie importante de la conversion de notre question dans un «langage statistique» (→4.1). Il s’agira de délimiter l’échantillon étudié, en choisissant les individus et leurs variables définitoires. 5.0.1
Choix des individus et taille de l’échantillon
Il semble que pour aborder le problème qui nous intéresse, deux alternatives de définition des individus s’offrent à nous: ces derniers sont soit les constituants, soit les ponctogrammes. Pour cette première étape, nous avons considéré que les individus étaient les constituants. L’effectif total de l’échantillon (n) est de 90752 individus. Cet effectif correspond àl’ensemble des mots (64252 individus1 ) et de tous les constituants construits à partir de ces mots (récursivement jusqu’au niveau directement inférieur à celui des énoncés, 1
Certains mots à double fonction, comme nel (ne et le contractés) sont comptabilisés deux fois dans l’échantillon total des constituants, mais pas dans le compte des mots.
167
soit 26497 individus). L’échantillon ne comprend donc ni lesphrases, ni les énoncés non phrastiques. Par ailleurs, les énoncés en latin2 ont été retirés du corpus. 5.0.2
Définition des individus
Pour éviter d’avoir à développer abondamment chaque réduction et chaque regroupement, nous avons décidé de commencer le travail par une approche globale, puis de réintroduire ultérieurement certaines des informations négligées – et non de partir d’un ensemble de variables à réduire progressivement. Pour présenter les différentes variables et modalités choisies, nous allons détailler l’individu souligné dans l’exemple suivant: «· en tıeſmong de ceſte [8] choſe · aj ıo faıt ceſ letreſ ſaíeler de mon˘ſaıel · lan del jncarnatıon jhesu crıst · mıl · et · cc · et · xxx · vj · [9] el moıs · de jvle» (Document 1236–07, 7). ˘
Chaque individu soumis à notre étude se définit par trois types de variables, auxquelles nous ferons référence par la suite à l’aide d’un code alphabétique: 1. les variables d’ordre morphosyntaxique (quatre variables dont le code commence par M); 2. les variables positionnelles, décrivant la position de l’individu dans le constituant intégrant (deux variables, dont le code est en LI, pour ‘Localisation par rapport au constituant Intégrant’); 3. les variables relevant de la ponctuation (deux variables, dont le code commence par PP, pour ‘Ponctuation: Ponctogramme’; →2.2.4.1).
5.0.2.1
Variables morphosyntaxiques
Les variables morphosyntaxiques (M) correspondent au modèle d’analyse linguistique. Elles ont donc un fondement épistémologique défini dans les limites de notre travail; ces variables sont les suivantes: 1. la nature et la fonction du constituant intégrant, rassemblées dans une seule variable (MI): énoncé phrastique (MI.phrase), énoncé non phrastique (MI.¬phrase), proposition de mode personnel en syntaxe argumentale (MI.pers-arg), proposition de mode non personnel en syntaxe argumentale (MI.¬pers-arg), syntagme non propositionnel en syntaxe argumentale (MI.synt-arg) et proposition de mode personnel en syntaxe immédiate (MI.pers), proposition de mode non personnel en syntaxe immédiate (MI.¬pers) et syntagme non propositionnel en syntaxe immédiate (MI.synt); 2. la fonction du constituant (MF), soit sept modalités correspondant aux fonctions syntaxiques argumentales (→3.4.2): MF.P0, MF.S1, MF.R2, MF.R3, MF.A4, MF.C5 et MF.C6; deux modalités correspondant aux fonctions immédiates: MF.Ap
2
Lesquels ne sont pas décrits adéquatement par notre modèle (→3.4.7.6 b).
168
(apposition) et MF.Dt (déterminant, →3.4.6.1); ainsi que les fonctions MF.Co (relateur coordonnant, →3.4.7.2) et MF.Rl (relateur non coordonnant3 ); 3. la nature, propositionnelle ou non, du constituant (MN), soit trois modalités: non propositionnelle (MN.0), proposition personnelle (MN.pers), proposition non personnelle (MN.¬pers, →3.4.2.5 b); 4. la présence ou l’absence de relateur spécifiant la fonction du constituant, soit deux modalités: relateur présent (MR.1) ou absent (MR.0). Dans l’exemple choisi ici, les modalités sont donc: MI.phrase (la structure est constituant immédiat d’un énoncé phrastique), MF.C5 (le constituant est un circonstant), MN.0 (il n’est pas de nature propositionnelle), MR.1 (il est relaté par l’adverbe en). 5.0.2.2
Variables positionnelles
L’ordre des constituants, tel qu’il se manifeste «en surface» n’a pas été décrit de manière approfondie dans le chapitre →3. On peut raisonnablement penser qu’il interfère avec le système des relations syntaxiques. Les variables liées à la position sont: 1. au début de la structure intégrante ou non (LID.1 ou LID.0); 2. à la fin de la structure intégrante ou non (LIF.1 ou LIF.0). Ici, il s’agit de LID.1 (le constituant ouvre la phrase) et de LIF.0 (le constituant n’est pas le dernier de la phrase). La division de la position en deux variables rend exploitables les cas où une structure ne contient que deux constituants ou un seul. 5.0.2.3
Variables ponctuationnelles
La présence de la ponctuation de part et d’autre du constituant est décrite par deux variables: 1. présence ou absence d’un ponctogramme au début du constituant (respectivement PPD.1 ou PPD.0); 2. présence ou absence d’un ponctogramme à la fin du constituant (PPF.1 ou PPF.0). Dans l’exemple choisi ici, les modalités sont PPD.1 et PPF.1 (le constituant est à la fois précédé et suivi d’un ponctogramme). On gardera à l’esprit que la séparation entre ponctuation initiale et ponctuation finale est un artéfact, qui permet de considérer un même ponctogramme par rapport aux constituants qui s’achèvent à sa gauche (par rapport auxquels il est PPF) et par rapport à ceux qui débutent à sa droite. Les modalités sélectionnées sont d’un niveau très abstrait: dans les faits, les ponctogrammes associés à la modalité PPD.1 (de même qu’à PPF.1) ’ ne se limitent pas au simple ‹·›: ils prennent des formes variées, comme ‹/›, ‹·/›, ‹·›, ‹¶›, etc. La simple opposition entre la présence et l’absence de ponctogramme est une approximation de la richesse des signes réellement employés. Comme annoncé, nous reviendrons plus loin sur la forme de ces ponctogrammes.4 3 4
Séparé du précédent en raison de la différence importante de fonctionnement. La forme des ponctogrammes est ainsi décrite au chapitre →7.
169
MI
MF
MN
MR
PPD
PPF
LID
LIF
phrase
C5
0
1
1
1
1
0
TAB . 5.1 – Exemple de définition d’individu Texte en tıeſmong de ceſte choſe aj faıt ıo ceſ letreſ ſaíeler de mon˘ſaıel lan [. . .] · mıl · et · cc · et · xxx · vj el moıs · de jvle
MI
MF
MN
MR
PPD
PPF
LID
LIF
phrase phrase phrase phrase phrase phrase phrase
C5 P0 P0 S1 R2 C5 C5
0 0 0 0 ¬pers 0 0
1 0 0 0 0 0 1
1 1 0 0 0 1 1
1 0 0 0 1 1 1
1 0 0 0 0 0 0
0 0 0 0 0 0 1
˘
TAB . 5.2 – Exemples de définition d’individu
1 0
FAB
FRE
4 3 7
57.14 42.86 100
1 0
0
1
2
3
4
TAB . 5.3 – Exemple de tri à plat
5.0.2.4
Définition complète de l’exemple
Les différentes variables et modalités choisies pourraient décrire 8× 11 × 3 × 25 = 8448 types d’individus théoriques. L’individu est réduit à une ligne de cellules contenant chacune la modalité sélectionnée d’une des sept variables (table 5.1). En analysant tous les constituants immédiats de la phrase citée comme exemple (n = 6), on obtient la liste de la table 5.2.5 Le dépouillement de l’ensemble de l’échantillon produit donc 90752 lignes de ce type.6 D’un point de vue méthodologique, ces quelques variables aux modalités abstraites vont nous aider à construire un environnement de référence certes très général, mais non dépourvu d’intérêt.
5.1
Tris à plat
La première étape de l’analyse consiste à examiner chaque variable indépendamment et à vérifier la distribution de ses modalités. On reprend, pour chacune de ces dernières, sa fréquence absolue (FAB, nombre d’individus possédant la modalité) et sa fréquence relative (FRE, proportion d’individus possédant la modalité); pour le petit extrait qui nous sert d’exemple, les fréquences des deux modalités de PPD figurent dans la table 5.3 (la dernière ligne, en italiques, comporte les totaux). Quatre constituants sont marqués à l’initiale et trois ne le sont pas, ce qui représente respectivement 57.14% et 42.86% de l’effectif de l’échantillon – à la valeur duquel correspond le total 5 6
Concernant l’encodage de l’analyse du prédicat, voir le paragraphe Problèmes de la section Analyses syntaxiques des annexes. Voir annexe 5.0.1.all.txt.
170
synt-arg synt phrase pers pers-arg ¬pers ¬pers-arg ¬phrase
FAB
FRE
31437 28582 11085 8392 5343 3052 2385 476 90752
34.64 31.49 12.21 9.25 5.89 3.36 2.63 0.52 99.99
synt−arg synt phrase pers pers−arg ¬pers ¬pers−arg ¬phrase
0
5000
10000
15000
20000
25000
30000
TAB . 5.4 – Tri à plat de MI
de la première colonne. Normalement, le total de la seconde colonne est toujours 100, mais il arrive que la valeur varie légèrement, en raison des arrondis. L’examen des tris à plat ne nous informe pas sur la structure des relations entre les différentes variables, mais nous montre, d’une part, si certains effectifs ne sont pas trop réduits et risqueraient de biaiser les dépouillements7 et, d’autre part, d’attirer notre attention sur des phénomènes périphériques ou singuliers. Nous allons examiner successivement les tris à plats des variables non ponctuationnelles (→5.1.1 et →5.1.2), puis ceux de PPD et PPF (→5.1.3). 5.1.1
Variables morphosyntaxiques
Il n’est pas envisageable d’aborder en détails ce que nous apprennent les tris à plat de ces variables: l’étude statistique du système morphosyntaxique dépasse le cadre de notre étude. Cependant, les phénomènes les plus prégnants que l’on pourra mettre à jour dans les lignes qui suivent sont susceptibles d’interférer de manière plus ou moins importante avec la ponctuation; nous devrons donc nous en souvenir quand nous nous engagerons dans l’étude des relations. La lecture des tableaux est facilitée par la consultation simultanée des histogrammes représentant les distributions. 5.1.1.1
Variable MI
Le tri à plat de MI nous montre que les modalités MI.synt et MI.synt-arg sont surreprésentées (table 5.4). Par contre, la modalité MI.¬phrase concerne une quantité infime des constituants. Sa prise en considération pourrait compliquer inutilement les données. 5.1.1.2
Variable MF
Les fonctions sont logiquement en accord avec ce premier tri (table 5.5). L’abondance relative de constituants de fonction Ap était en effet prévisible: elle découle directe7
Si nous avions traité des variables continues, l’examen des tris à plat aurait dû être accompagné d’une analyse exploratoire univariée (évaluation de la forme de la distribution et de ses paramètres), qui aurait permis d’analyser la manière dont les données sont distribuées (Howell 1998, ch. 2).
171
Ap Rl P0 C5 Dt S1 R2 Co A4 C6 R3
FAB
FRE
42062 11944 8106 6648 6138 4697 3805 3345 1769 1157 1081 90752
46.35 13.16 8.93 7.33 6.76 5.18 4.19 3.69 1.95 1.27 1.19 100
Ap Rl P0 C5 Dt S1 R2 Co A4 C6 R3
0
10000
20000
30000
40000
TAB . 5.5 – Tri à plat de MF
0 pers ¬pers
FAB
FRE
85677 2640 2435 90752
94.41 2.91 2.68 100
0 pers ¬pers
0
20000
40000
60000
80000
TAB . 5.6 – Tri à plat de MN
ment de la grande quantité de MI.synt et de MI.synt-arg que le tri à plat précédent nous a laissé voir. Cette profusion soulève deux problèmes. Premièrement, l’étiquette apposition est peu raffinée. Elle correspond à des unités dont on perçoit intuitivement la différence de statut, mais que notre modèle morphosyntaxique ne distingue pas (→3.4.6.1), parce que les caractéristiques qui servent à les discerner relèvent d’un autre point de vue ou d’une autre approche de la langue. Par exemple, dans: «celi ki ces ıııı muıs tenrat en hyretage» (Document 1271–12–09, 8).
les mots ces, ıııı et muıs sont tous trois considérés comme des appositions, mais nous savons que le second est un chiffre romain; il est possible que ce statut ait une influence plus ou moins importante sur ses interactions avec le système de ponctuation. Par ailleurs, le tri mêle les fonctions apparaissant en syntaxe immédiate à celles que l’on rencontre en syntaxe argumentale. 5.1.1.3
Variable MN
Le tri à plat effectué sur la nature des constituants est celui de la table 5.6. La grande majorité des constituants ne sont pas de nature propositionnelle. Il faudra considérer les modalités MN.pers et MN.¬pers comme distinctives. 5.1.1.4
Variable MR
Le tri à plat des modalités de MR est dichotomique, puisqu’il n’y a que deux valeurs possibles (table 5.7). Cela nous montre que la présence d’un relateur est un phéno172
0 1
FAB
FRE
77794 12958 90752
85.72 14.28 100
0 1
0
20000
40000
60000
TAB . 5.7 – Tri à plat de MR
0 1
FAB
FRE
62372 28380 90752
68.73 31.27 100
0 1
0
10000
20000
30000
40000
50000
60000
40000
50000
60000
TAB . 5.8 – Tri à plat de LID
0 1
FAB
FRE
62372 28380 90752
68.73 31.27 100
0 1
0
10000
20000
30000
TAB . 5.9 – Tri à plat de LIF
mène qui est nettement moins fréquent que son absence, mais l’est plus que la nature propositionnelle. 5.1.1.5
Synthèse des variables morphosyntaxiques
Mêlant les observations de tous ces tris, on s’attend à rencontrer fréquemment des appositions, des constituants non propositionnels et des constituants non relatés. On extrapole ainsi que la plupart des constituants vérifieront simultanément ces trois modalités. Cette distribution des données est directement liée à leur formalisation. Les variables MN.0 et MR.0 correspondent en effet aux mots pris individuellement. Malgré son caractère artificiel, cette description est épistémologiquement justifiée par l’acceptation des principes de l’analyse en constituants immédiats. 5.1.2
Variables positionnelles
On peut faire pour les variables qui décrivent la localisation des constituants la même remarque générale que pour les variables morphosyntaxiques: elles ne nous intéressent pas directement, mais il faudra, le cas échéant, tenir compte de toute variation excessive. D’autre part, à l’instar de la variable MR, les modalités positionnelles sont dichotomiques. Pour commencer, notons que l’inégalité entre le nombre de constituants initiaux et le nombre de constituants finaux est due à l’élimination des constituants dont la réalisation matérielle a été endommagée (échancrures, taches).8 Les proportions de LID correspondent à celles de LIF (tables 5.8 et 5.9). Malgré la plus grande fréquence 8
Voir la section Transcriptions des annexes.
173
0 1
FAB
FRE
81655 9097 90752
89.98 10.02 100
0 1
0
20000
40000
60000
80000
TAB . 5.10 – Tri à plat de PPD
0 1
FAB
FRE
73986 16766 90752
81.53 18.47 100
0 1
0
10000
20000
30000
40000
50000
60000
70000
TAB . 5.11 – Tri à plat de PPF
des constituants qui ne se trouvent pas aux extrêmes, on voit que la différence de proportion entre les modalités est ici moindre que dans les tris précédents. 5.1.3
Ponctuation
Pour commencer, il est essentiel de garder à l’esprit que les individus ne sont pas envisagés de manière linéaire, mais d’un point de vue hiérarchique: il s’agit de dire s’il y a un signe au début ou à la fin d’un constituant ou s’il n’y en a pas. Ce sont des unités syntaxiques intégrées à une structure qui nous intéressent et non simplement des mots enchaînés les uns à la suite des autres. Les ponctogrammes ne sont pas les individus dans le cadre qui nous occupe. Dès lors, un même ponctogramme peut parfois marquer les limites de plusieurs constituants imbriqués. Ce phénomène a d’importantes répercussions que nous expliquerons ci-dessous (→5.1.3.2). Voyons comment les données sont distribuées avant d’aborder, cette fois de manière plus détaillée, les problèmes que ces mises à plat rendent déjà indentifiables. 5.1.3.1
Données
Le tri à plat des modalités de PPD est évidemment dichotomique (table 5.10). Les constituants ne sont généralement pas marqués à l’initiale: on peut donc se dire que le marquage initial est, d’un point de vue sémiotique, véritablement saillant. Les constatations sont assez similaires pour les modalités de PPF (table 5.11). Le marquage est un phénomène rare. En comparant les tables, on voit cependant qu’il y a plus de constituants qui reçoivent une marque finale que de constituants qui reçoivent une marque initiale. 5.1.3.2
Difficultés
Quelles sont les difficultés que cette différence de proportion met en évidence? La différence entre les deux types de marquage ne se comprend qu’en prenant en considération le principe de récursivité syntaxique (→a); et une réflexion sur le contraste entre le non-marquage et le marquage mène à distinguer nettement leur fonctionnement propre (→b).
174
a. Récursivité et disproportion entre PPD et PPF. Comment se fait-il que les effectifs de PPD.1 et PPF.1 diffèrent, puisque, comme nous l’avons signalé en définissant les variables,9 la distinction entre les ponctuations finale et initiale est un artéfact? Revenons un instant sur le modèle syntaxique. Nous avons indiqué qu’il permettait la récursivité (→5.0.2.3), option classique qui fonde une partie de l’économie du modèle. Du fait de l’enchâssement, une position dans la chaîne graphique située entre deux caténogrammes peut se trouver simultanément aux bornes d’un grand nombre de structures imbriquées. Ainsi, dans «· et lauons en tele maníre mís en noſtre papíer · et en noſtre regıſtre ⊗ et por que ceſte [15] choſe soıt plus ferme · noſ auons pendu a ceſt preſent eſcrít nos ſaıas propres en teſmonghage de / [16] veríte» (Document 1287–10, 14) .
la position marquée par le symbole ‹⊗›10 est à la fois à la fin d’une phrase et de deux constituants: 1. et lauons en tele maníre mís en noſtre papíer · et en noſtre regıſtre 2. en noſtre regıſtre 3. regıſtre et au début d’un C6 et, partant, d’une nouvelle phrase: 4. et por que ceſte [15] choſe soıt plus ferme · noſ auons pendu a ceſt preſent eſcrít nos ſaıas propres en teſmonghage de / [16] veríte 5. et À une seule position dans la chaîne correspondent cinq positions dans la hiérarchie syntaxique – sans compter le problème soulevé par la coordination. Il s’agit d’une conséquence importante de la récursivité dans le phénomène d’intégration syntaxique. Dans cette optique, si une langue a tendance à construire les constituants en plaçant les constituants sélectionnants (→3.4.6.1 b), à la suite des constituants sélectionnés,11 le nombre de constituants à la fin desquels les séparations entre caténogrammes se trouvent est en moyenne supérieur au nombre de constituants au début desquels ils se situent. Il en découle que si un constituant est suivi d’un ponctogramme, ce n’est pas nécessairement sur lui que porte le marquage, mais peut-être uniquement sur le constituant qui le contient ou sur celui qu’il contient. Par ailleurs, nous avons vu précédemment que Claude Tournier, parlant de la ponctuation moderne, a mis en évidence l’existence de lois d’absorption régissant la manière dont les ponctogrammes se combinent ou refusent la combinaison, en privilégiant souvent l’apparition d’un seul signe à la place de plusieurs signes qui auraient pu se trouver concaténés.12 Ainsi, en français moderne, le point final de phrase «absorbe» le point final abréviatif.
9
Voir les variables choisies pour décrire la ponctuation sous →5.0.2.3.
10 Il y a un ‹·› à cet endroit. Nous l’avons retiré pour simplifier la présentation. 11 Comme cela paraît être le cas en ancien français, ce que nous pourrions vérifier numérique-
ment à l’aide des informations encodées dans le corpus. 12 Voir notre réflexion générale sur la recherche d’une valeur pour les signes (→2.3.2).
175
Il n’y a aucune raison a priori pour que ce type de loi n’existe pas dans nos documents. Toutefois, dans un système ancien dont nous ne maîtrisons plus toute la finesse, il est bien malaisé d’appréhender efficacement les phénomènes d’absorption. Reprenons l’exemple ci-dessus: il n’est pas raisonnable de déterminer intuitivement le constituant sur lequel le ponctogramme situé à l’endroit marqué par ‹⊗› porte. On estimera donc dans un premier temps qu’il marque les cinq constituants aux bornes desquels il se trouve. Mieux vaut éviter de comparer directement PPD et PPF et étudier le comportement de chacune de ces variables de manière indépendante. b. Différence entre marquage et non-marquage. Comparons ce comportement à celui d’une absence de ponctogramme (à l’endroit marqué par ‹⊗› ci-dessous): «et por que ceſte [15] choſe soıt plus ferme · noſ auons pendu a ceſt preſent eſcrít ⊗ nos ſaıas propres en teſmonghage de / [16] veríte» (Document 1287–10, 14).
Dans ce cas, il est absolument clair que le non-marquage porte simultanément sur chacun des constituants aux limites desquels on le rencontre. La différence entre le marquage et le non-marquage est ainsi fondamentale, tout au moins d’un point de vue théorique. Considérer que la présence et l’absence de ponctuation fonctionnent de manière équivalente reviendrait à surestimer la quantité de marques présentes. Néanmoins, du point de vue du récepteur, il y a, somme toute, peu de différence entre les deux possibilités. Si l’on examine les associations entre la présence d’un ponctogramme et les structures qui le précèdent ou le suivent, on peut observer que les associations fortuites sont moins nombreuses que d’autres, plus systématiques. Ainsi, devant la structure «· et lauons en tele maníre mís en noſtre papíer · et en noſtre regıſtre · et por que ceſte [15] choſe soıt plus ferme · noſ auons pendu a ceſt preſent eſcrít nos ſaıas propres en teſmonghage de / [16] veríte» (Document 1287–10, 14).
imaginons que l’on interprète le ponctogramme souligné comme marquant globalement toutes limites des cinq constituants cités ci-dessus. L’emploi de méthodes statistiques, combiné à l’exploration d’un nombre important de données, montrera qu’un ponctogramme à cette position est plus susceptible de s’y trouver parce qu’il est à la fin d’une phrase et au début d’une autre que parce qu’il est à la fin d’une apposition comme registre.
5.2
Tris croisés par variable
Pour évaluer les liens existant entre les modalités de deux variables, il est courant de procéder à une tabulation de leurs effectifs. On effectue ainsi ce qu’on appelle un tri croisé. Ce type de tri est soumis à des tests statistiques spécifiques aux données qualitatives; ces tests évaluent en quelle mesure les fréquences sont ou non le fruit du hasard. Nous commencerons par donner un guide de lecture des tris croisés (→5.2.1). Ensuite, nous examinerons le croisement de toutes les variables morphosyntaxiques et positionnelles avec les variables ponctuationnelles (→5.2.2). Nous synthétiserons nos 176
A4 C5 C6 Co P0 R2 R3 S1
0
1
0 0 0 0 1 1 0 1 3
0 3 0 0 1 0 0 0 4
0 3 0 0 2 1 0 1 7
TAB . 5.12 – Exemple de tableau de contingence
découvertes par une conclusion prudente, qui mettra en lumière les acquis aussi bien que les défauts de la démarche (→5.2.3). 5.2.1
Guide de lecture
Cette section commence par une présentation de ce qu’est une table de contingence (→5.2.1.1), puis aborde les différents procédés statistiques couramment employés pour tester l’hypothèse nulle sur ces tabulations (→5.2.1.2 à →5.2.1.5). D’autres procédés seront expliqués plus loin, au moment où nous en ferons usage pour la première fois. 5.2.1.1
Tableau de contingence
Si nous croisons MF au niveau argumental (huit modalités) et PPD (deux modalités), nous obtenons un tableau à double entrée de seize cases, qui montre combien d’individus possèdent une modalité de PPD (colonnes) pour chaque modalité de MF (lignes). Ce genre de tableau est appelé tableau de contingence. Pour le petit exemple ci-dessus, on obtient la table 5.12.13 Les totaux portés en marge (en italiques) correspondent aux effectifs des tris à plat pour chaque variable. Le total de l’ensemble du tableau (soit 7, dans le coin inférieur droit) équivaut à l’effectif de l’échantillon étudié. On voit que trois C5 sont marqués par un ponctogramme initial, qu’un P0 est dans le même cas, etc. Les effectifs de ce premier tableau sont cependant trop faibles pour qu’on puisse l’exploiter (→5.2.1.2). En dépouillant tout le corpus (table 5.13, à gauche), nous obtenons suffisamment de données pour procéder à une analyse statistique et évaluer la pertinence de la répartition (table 5.13, à droite). La lecture intuitive du tableau de gauche (ou des fréquences relatives correspondantes) n’est pas recommandée et il serait imprudent d’en tirer quelque conclusion que ce soit. 5.2.1.2
Test du χ2 («chi-carré»)
Pour interpréter ce genre de tableau, il est courant d’effectuer un test statistique classique, nommé test du χ2 (voir les résultats dans la ligne sous les deux tableaux). 13 L’exemple est cité quand nous expliquons comment nous avons réduit les données (→5.0.2).
177
MF.A4 MF.C5 MF.C6 MF.Co MF.P0 MF.R2 MF.R3 MF.S1
PPD.0
PPD.1
577 1976 354 434 2244 1181 506 1259 8531
85 482 789 171 144 287 87 509 2554
662 2458 1143 605 2388 1468 593 1768 11085
PPD.0
PPD.1
8.95 ✩★★ 3.76 ✩✩✩ −314.11 ★★★ −2.15 ✩✩✩ 89.78 ★★★ 2.32 ✩✩✩ 5.4 ✩✩★ −7.59 ✩★★
−29.89 ★★★ −12.56 ★★★ 1049.21 ★★★ 7.17 ✩★★ −299.89 ★★★ −7.76 ✩★★ −18.03 ★★★ 25.37 ★★★
χ2 = 1883.93, ddl = 7, p = 0 ★★★
TAB . 5.13 – Exemple de tri croisé
A4 C5 C6 Co P0 R2 R3 S1
0
1
509.47 1891.67 879.65 465.61 1837.8 1129.77 456.37 1360.65 8530.99
152.53 566.33 263.35 139.39 550.2 338.23 136.63 407.35 2554.01
662 2458 1143 605 2388 1468 593 1768 11085
TAB . 5.14 – Exemple de tri croisé: valeurs attendues
a. Fonctionnement. Pour ce test, on calcule un coefficient mesurant l’écart qui existe entre ce tableau et la ventilation qu’il aurait présentée si les cases avaient été remplies aléatoirement, mais en conservant les mêmes totaux marginaux (situation H0 ). Si la situation était due au hasard, chacune des cases aurait eu comme valeur le produit des marges correspondantes divisé par le total du tableau (Howell 1998, 165–166), soit la table 5.14. On résume l’écart que la ventilation manifeste par rapport à H0 sous la forme d’un coefficient nommé χ2 . Plus ce coefficient est élevé,14 plus il est vraisemblable que le tableau de contingence ne soit pas dû au hasard, mais à un lien existant entre les variables. Il faut donc rejeter H0 au profit de H1 . Ce qui signifie, dans le cas d’une table de contingence, que la ventilation des données n’est pas aléatoire. On peut dès lors poser des hypothèses pour expliquer la manière dont cet écart par rapport à la situation d’indépendance (on parle d’écart à l’indépendance) est structuré. La probabilité de H0 est calculée sur la base d’une distribution également dite du χ2 , liée au 14 On calcule le coefficient χ2 suivant la formule
χ2 =
X (o − e)2 e
(5.1)
qui se lit: «Le χ2 est égal à la somme des carrés des écarts à H0 divisés par la valeur attendue si H0 était vraie.» Voir Muller 1973, 116–127 pour un exposé adapté à un public de linguistes; voir Howell 1998, ch. 6 pour les détails. Le calcul est modifié par un coefficient (correction de continuité de Yates, cf. Howell 1998, 167–168) dans le cas de tables croisant 2 × 2 modalités. La fonction R effectuant le test est chisq.test(), qui évalue la probabilité correspondant au coefficient obtenu.
178
nombre de degrés de liberté.15 (ddl), qui correspond au produit du nombre de modalités diminué de un de chacune des deux variables, en l’occurrence, (7 − 1) × (2 − 1) = 6. Cette probabilité est ici voisine de zéro; elle est inférieure à 0.001. On voit dans le tableau 5.13 ci-dessus que le coefficient χ2 est très élevé; donc, la probabilité que H0 soit vérifiée est proche de zéro. La ventilation du tableau n’est donc certainement pas aléatoire. Le nombre d’étoiles pleines correspond à un seuil α de rejet de H0 : ★★★ équivaut à p < 0.001, ✩★★ signifie p < 0.01, ✩✩★ signifie p < 0.05 et ✩✩✩ signifie p > 0.05 (H0 ne peut être rejetée). b. Conditions d’application. Le test a des conditions d’application peu restrictives, mais qu’il importe de respecter. Charles Muller (1973, 121) les résume efficacement:16 «1. ce test ne s’applique qu’à des effectifs absolus, jamais à des effectifs relatifs (pourcentages, par exemple), et jamais à des grandeurs (caractères17 qualitatifs); 2. il perd de sa précision quand les écarts sont établis par rapport à des effectifs trop faibles; dans la pratique, on s’interdira d’inscrire dans les effectifs théoriques des nombres inférieurs à 5, et on évitera s’il se peut les nombres inférieurs à 10; pour les effectifs réels, il n’y a pas de limitation;18 3. toute erreur sur le nombre de degrés de liberté fausse le résultat.»
À ces conditions, il faut ajouter celle de n’inclure dans le tableau que des observations indépendantes (Howell 1998, 175). Il faut que la probabilité de l’occurrence simultanée d’un individu A et d’un individu B soit égale au produit de la probabilité d’occurrence de chacun.19 En pratique, il est donc nécessaire que le total du tableau corresponde au nombre d’individus soumis au tri, pas plus. Ces contraintes sont assez claires et ne requièrent pas de commentaire, à l’exception du problème de l’indépendance des observations. c. Récursivité et indépendance des observations. Nous venons de voir que David Howell dénonçait comme une erreur typique le fait de prendre plusieurs fois le même individu en considération. Or, comme on a pu s’en apercevoir en analysant les tris à plat, le même signe est pris plusieurs fois en considération pour déterminer les valeurs de PPD et PPF pour l’ensemble des individus. En ce sens, ces variables sont d’emblée un indice de la non-indépendance des données. Néanmoins, ce sont les valeurs des variables décrivant les individus qui sont liées. Les individus sont, quant à eux, bel et bien indépendants. Les tests restent utilisables, mais les variables n’en demeurent pas moins liées a priori. Pour résoudre ce problème, il faudrait peut-être considérer chaque niveau d’intégration syntaxique indépendamment des autres, puis trouver les méthodes appropriées pour tester les relations entre ces différents niveaux. Cela ne serait envisageable que si nous avions à notre disposition une quantité bien plus importante de matériaux. On ne pourrait pas davantage faire des mots les individus de l’étude et les définir 15 Dans une table de contingence, il s’agit du nombre de cases dont l’effectif peut varier en
conservant des totaux marginaux fixes. Voir par exemple Howell 1998, 59 et 116–117. 16 Italiques en gras dans le texte. 17 Synonyme de variable que nous n’avons pas employé ici, pour éviter toute confusion. 18 En pratique, cette limite de 5 n’est pas toujours respectée sans pour autant biaiser les résultats,
cf. Howell 1998, 173–174. 19 Soit P(A ∩ B) = P(A) × P(B), cf. (Upton/Cook 2006, 106).
179
par de nombreuses variables correspondant aux constituants aux extrêmes desquels ils se trouvent. Pareille description mènerait obligatoirement à assigner un nombre de variables considérable à chaque individu – on rencontrerait les problèmes décrits sous →4.2.3. 5.2.1.3
Rapport de chances
Si nous effectuons une tabulation entre la variable MR et la variable PPD au niveau de la phrase, nous obtenons une table carrée de quatre cases (table 2 × 2). Pour compléter l’analyse d’une telle table, il est utile de calculer une statistique nommée rapports de chances (notée θ ci-dessous).20 Les rapports de chances ne sont pas influencés par l’inégalité des totaux marginaux (p. ex., le fait que le total de la première ligne ne soit pas le même que celui de la seconde) et montrent quel est le degré de liaison d’une variable par rapport à une autre.21 La tabulation de MR avec PPD donne le premier exemple de calcul du rapport de chances (→5.2.2.4). En situation de H0 , ce rapport vaut exactement 1. Plus le nombre s’écarte de l’unité, plus l’écart par rapport à l’indépendance est important – néanmoins, les rapports de chances sont purement descriptifs et ne permettent pas de faire des inférences. Pour les tables 2 × 2 qui suivront dans ce travail, nous avons reporté le θ correspondant aux attractions en-dessous du tableau de décomposition des contributions (→5.2.1.4). À ce stade, il est important de comprendre que la significativité du test et le rapport de chances sont deux mesures différentes. Il se pourrait qu’un θ peu élevé soit significatif, cela voudrait dire qu’il est pertinent de relever le contraste étudié, bien qu’il soit difficilement perceptible intuitivement. La situation inverse est tout aussi possible. 5.2.1.4
Structure de l’écart
Le coefficient χ2 pose une appréciation globale sur l’écart à H0 : soit la ventilation est due au hasard, soit elle ne l’est pas. Il est parfois utile d’évaluer dans quelle mesure chaque cellule du tableau s’écarte de H0 . Pour ce faire, nous avons choisi d’employer trois indicateurs distincts, reportés synthétiquement dans le sous-tableau de droite du tableau 5.13. Premièrement, le sens de l’écart est indiqué par un signe moins s’il est négatif (effectif moindre que dans la situation H0 ) et par aucun signe s’il est positif. 20 Il est tout à fait possible de calculer les rapports de chances pour des tables plus grandes
(Agresti 2002, 55–56), mais leur interprétation devient très compliquée. 21 Pour une table
A.1 A.2
B.1
B.2
a c r
b d s
m n N
la formule du rapport de chances de la case contenant l’effectif a (θ1,1 ) est donnée par Agresti (2002, 45): ad 1 1 θ1,1 = = θ2,2 = = (5.2) bc θ1,2 θ2,1
180
Le nombre correspond à la part du χ2 due à la valeur de la case correspondante dans le tableau de contingence (on parle de contribution au χ2 ). Nous avons en outre calculé p en considérant le χ2 pour chaque cellule du tableau avec ddl = 1 (comme s’il s’agissait d’un tableau de deux lignes et de deux colonnes). Grâce à cette décomposition de l’écart, on se fait aisément une idée de l’individualité des liens. Pour le tableau 5.13, on voit que les fonctions C6, Co et S1 sont liées positivement (attraction) au marquage, alors que les autres fonctions sont liées négativement (répulsion ou opposition). L’essentiel de l’information contenue dans le tableau est apporté par la ligne impliquant C6 et la présence d’un ponctogramme est plus discriminante que son absence (les contributions de la colonne de droite sont plus élevées que celles de la colonne de gauche). 5.2.1.5
Test exact de Fisher
Dans le cas où les conditions numériques d’utilisation du χ2 ne sont pas rassemblées, on conseille d’employer le test dit test exact de Fisher. La probabilité de la ventilation est calculée sur la base de la distribution hypergéométrique – qui correspond empiriquement à un tirage sans remise dans une urne.22 Pour des raisons techniques,23 il est parfois impossible de calculer une probabilité exacte pour l’ensemble de la table. Dans ce cas, il faut se contenter des données concernant la décomposition de l’écart pour travailler. Nous verrons des exemples où le test exact de Fisher, alternative au χ2 , a dû être employé. 5.2.2
Examen des tris croisés
Puisque, comme on vient de le voir, la distinction entre PPF et PPD est articifielle, il s’agit d’étudier ici la manière dont les constituants sont marqués sous deux angles différents. Nous ferons donc en parallèle deux études distinctes de la répartition de la même ponctuation. Nous essayerons de synthétiser ensuite les deux séries de résultats (→5.2.3). Pour éviter les interférences avec les phénomènes esthétiques de marquage du 22 Soit la table:
A.1 A.2
B.1
B.2
a c r
b d s
m n N
La formule de la probabilité de H0 est donnée par m!n!r!s! a!b!c!d!N!
(5.3)
Cf. Upton/Cook 2006, 160–161. Le test est effectué par la fonction R fisher.test(). 23 Dans R, l’algorithme par défaut du test consomme beaucoup de ressources si certains effec-
tifs sont élevés.
181
MI.pers MI.pers-arg MI.¬pers MI.¬pers-arg MI.phrase MI.¬phrase MI.synt MI.synt-arg
PPD.0
PPD.1
8018 4714 2997 2198 8473 256 26886 27866 81408
374 629 55 187 2540 149 1690 3430 9054
8392 5343 3052 2385 11013 405 28576 31296 90462
PPD.0
PPD.1
28.75 ★★★ −1.85 ✩✩✩ 22.84 ★★★ 1.25 ✩✩✩ −208.57 ★★★ −32.28 ★★★ 53.24 ★★★ −3.15 ✩✩✩
−258.46 ★★★ 16.61 ★★★ −205.37 ★★★ −11.2 ✩★★ 1875.37 ★★★ 290.24 ★★★ −478.68 ★★★ 28.29 ★★★
χ2 = 3516.13, ddl = 7, p = 0 ★★★
TAB . 5.15 – Tri croisé MI × PPD
MI.pers MI.pers-arg MI.¬pers MI.¬pers-arg MI.phrase MI.¬phrase MI.synt MI.synt-arg
PPF.0
PPF.1
7002 4281 2594 1861 8466 264 23611 25749 73828
1385 1062 450 523 2504 206 4855 5594 16579
8387 5343 3044 2384 10970 470 28466 31343 90407
PPF.0
PPF.1
3.42 ✩✩✩ −1.55 ✩✩✩ 4.71 ✩✩★ −3.78 ✩✩✩ −27.05 ★★★ −37.4 ★★★ 5.74 ✩✩★ 0.92 ✩✩✩
−15.22 ★★★ 6.89 ✩★★ −20.98 ★★★ 16.85 ★★★ 120.48 ★★★ 166.55 ★★★ −25.54 ★★★ −4.11 ✩✩★
χ2 = 461.19, ddl = 7, p = 1.75e − 95 ★★★
TAB . 5.16 – Tri croisé MI × PPF
début et de la fin de la charte, nous avons retiré les constituants dont le premier mot correspondait au premier mot du document des tests concernant la ponctuation initiale. De même, nous avons retiré les individus qui se trouvaient à la fin d’une charte pour les tests concernant la ponctuation finale. Tabulons donc successivement toutes les variables MI, MF, MN, MR, LID et LIF, d’une part avec PPD, d’autre part avec PPF. 5.2.2.1
Variable MI
Pour les différentes modalités de MI, la tabulation avec la ponctuation initiale donne le résultat du tableau 5.15. Si l’on regarde les contributions, le tri croisé montre très clairement que ce sont les constituants immédiats des structures ayant le statut d’énoncé (MI.phrase et MI.¬phrase) qui attirent le plus PPD.1. Les constituants des structures contractant une fonction argumentale (excepté MI.¬pers-arg) suivent également cette tendance, mais de manière mois nette. En dehors d’un contexte permettant les relations de type argumental, la répulsion est très forte. L’examen des tris croisés impliquant plutôt PPF (table 5.16) montre que la ponctuation finale ne suit pas toujours les mêmes tendances qu’avec PPD: avec MI × PPF, il est déjà clair que la ponctuation n’est pas similaire de part et d’autre des constituants. Remarquons tout d’abord que le χ2 de ce tableau est beaucoup plus bas que celui du tableau qui croisait MI et PPD. On constate une attraction pour tout ce qui est intégré à une structure ayant le statut d’énoncé ou une forme propositionnelle ayant
182
MF.A4 MF.Ap MF.C5 MF.C6 MF.Co MF.Dt MF.P0 MF.Rl MF.R2 MF.R3 MF.S1
PPD.0
PPD.1
1645 38135 5851 356 2488 5982 7867 10957 3341 854 3932 81408
123 3887 797 801 857 156 238 879 464 121 731 9054
1768 42022 6648 1157 3345 6138 8105 11836 3805 975 4663 90462
PPD.0
PPD.1
1.83 ✩✩✩ 2.69 ✩✩✩ −2.9 ✩✩✩ −450.92 ★★★ −90.59 ★★★ 38.03 ★★★ 45.05 ★★★ 8.77 ✩★★ −2.02 ✩✩✩ −0.62 ✩✩✩ −16.65 ★★★
−16.45 ★★★ −24.17 ★★★ 26.04 ★★★ 4054.41 ★★★ 814.56 ★★★ −341.94 ★★★ −405.03 ★★★ −78.85 ★★★ 18.16 ★★★ 5.62 ✩✩★ 149.67 ★★★
χ2 = 6594.96, ddl = 10, p = 0 ★★★
TAB . 5.17 – Tri croisé MF × PPD
une fonction argumentale. Tout comme pour la ponctuation initiale, les constituants de la phrase se caractérisent par l’attraction du marquage, mais leur contribution est nettement plus faible. On voit déjà que la ponctuation initiale et la ponctuation finale ne se comportent pas de manière identique en fonction du contexte syntaxique dans lequel le constituant se trouve. Cependant, il est assez évident, vu les contributions énormes pour cette ligne, que les constituants de la phrase ont une tendance au marquage très nette et dépassant celles de tous les autres, que ce soit vis-à-vis de PPD ou de PPF. 5.2.2.2
Variable MF
Abordons à présent le comportement de la ponctuation par rapport à la fonction des constituants. La ventilation des données dans la tabulation de MF et PPD donne la table 5.17: PPD.1 repousse les fonctions Ap, A4, Dt, P0 et Rl, mais attire les autres. Les répulsions ont une contribution plus forte que les attractions; on remarquera toutefois que la contribution la plus élevée est celle de la fonction C6, qui attire le ponctogramme initial. Il faut cependant relativiser ces observations. Comme nous l’avons fait remarquer supra (→5.2.2.2), le tri traite exactement de la même manière des unités que nous avons clairement distinguées d’un point de vue épistémologique. La ventilation des effectifs selon les variables MF et PPF est donnée dans la table 5.18. Avec les mêmes réserves que celles signalées pour PPD, les fonctions Co, C6, Rl, P0 et S1 repoussent PPF.1. Malgré l’importance de l’effectif Ap dans la colonne PPF.1, la contribution de la ligne correspondant à cette fonction est plus basse que les autres – tout en restant statistiquement significative. Cela montre que les constituants de cette fontion ne se laissent pas ranger dans une catégorie nette. La divergence entre PPD et PPF est encore plus présente dans le cas de MF que dans celui de MI. On pourra distinguer (voir la synthèse →5.2.3): 1/ les fonctions rejetant tout marquage; 2/ les fonctions attirant un marquage de part et d’autre; 3/ celles qui impliquent un comportement différent à gauche et à droite du constituant.
183
MF.A4 MF.Ap MF.C5 MF.C6 MF.Co MF.Dt MF.P0 MF.Rl MF.R2 MF.R3 MF.S1
PPF.0
PPF.1
1178 34014 4494 1152 3291 3654 6963 11841 2423 713 4105 73828
590 7930 2075 5 54 2388 1097 103 1379 366 592 16579
1768 41944 6569 1157 3345 6042 8060 11944 3802 1079 4697 90407
PPF.0
PPF.1
−48.93 ★★★ −1.66 ✩✩✩ −141.22 ★★★ 45.43 ★★★ 114.56 ★★★ −332.07 ★★★ 22.06 ★★★ 446.69 ★★★ −149.71 ★★★ −32.08 ★★★ 18.91 ★★★
217.88 ★★★ 7.38 ✩★★ 628.85 ★★★ −202.29 ★★★ −510.17 ★★★ 1478.73 ★★★ −98.24 ★★★ −1989.16 ★★★ 666.69 ★★★ 142.86 ★★★ −84.22 ★★★
χ2 = 7379.78, ddl = 10, p = 0 ★★★
TAB . 5.18 – Tri croisé MF × PPF
MN.0 MN.pers MN.¬pers
PPD.0
PPD.1
76713 2371 2324 81408
8674 269 111 9054
85387 2640 2435 90462
PPD.0
PPD.1
−0.21 ✩✩✩ −0.01 ✩✩✩ 8.04 ✩★★
1.92 ✩✩✩ 0.09 ✩✩✩ −72.27 ★★★
χ2 = 82.53, ddl = 2, p = 1.2e − 18 ★★★
TAB . 5.19 – Tri croisé MN × PPD
MN.0 MN.pers MN.¬pers
PPF.0
PPF.1
71328 936 1564 73828
14017 1702 860 16579
85345 2638 2424 90407
PPF.0
PPF.1
38.3 ★★★ −688.92 ★★★ −87.21 ★★★
−170.54 ★★★ 3067.85 ★★★ 388.34 ★★★
χ2 = 4441.16, ddl = 2, p = 0 ★★★
TAB . 5.20 – Tri croisé MN × PPF
5.2.2.3
Variable MN
En ce qui concerne la nature, la tabulation avec PPD donne le tri de la table 5.19. Les résultats du test sur cette dernière sont significatifs et l’examen des détails indique que l’élément fort est la répulsion que les propositions non personnelles manifestent par rapport au marquage, où la contribution est très forte. L’examen du tableau de contingence approprié révèle que la nature des constituants est également liée à leur ponctuation finale (table 5.20): les propositions s’opposent aux constituants non propositionnels par une attraction forte, particulièrement par ce qui est personnel. Contrairement à la ponctuation initiale, le marquage final correspond tout à fait au caractère saillant de ces structures, dont les tris à plat montraient la rareté relative. Le contraste morphosyntaxique entre les constituants «simples» et les constituants propositionnels est donc surtout marqué par la présence de ponctuation à la fin de ces derniers.
184
MR.0 MR.1
PPD.0
PPD.1
69506 11902 81408
8106 948 9054
PPD.0
PPD.1
-1.64 9.89
14.72 -88.89
θ
1.46
77612 12850 90462
χ2 = 114.78, ddl = 1, p = 8.77e − 27 ★★★
TAB . 5.21 – Tri croisé MR × PPD
MR.0 MR.1
PPF.0
PPF.1
66867 6961 73828
10695 5884 16579
77562 12845 90407
PPF.0
PPF.1
196.56 -1186.91
-875.32 5285.43
θ
5.28
2
χ = 7542.08, ddl = 1, p = 0 ★★★
TAB . 5.22 – Tri croisé MR × PPF
LID.0 LID.1
PPD.0
PPD.1
57785 23623 81408
4587 4467 9054
62372 28090 90462
PPD.0
PPD.1
48.83 -108.43
-439.07 974.93
θ
2.38
χ2 = 1570.31, ddl = 1, p = 0 ★★★
TAB . 5.23 – Tri croisé LID × PPD
5.2.2.4
Variable MR
La tabulation de MR et PPD mène à la création d’un tableau de contingence 2× 2, dont nous calculons le rapport de chances (table 5.21). La très faible probabilité calculée nous autorise à dire qu’il y a répulsion manifeste entre les constituants relatés et la ponctuation initiale. La valeur de θ correspond au rapport de chances entre les attractions et les répulsions du tableau. Ici, l’attraction est entre MR.1 et PPD.0. Il y a, selon le calcul des rapports de chances, 1.46 fois plus de «chances» derejeter le marquage initial pour les constituants relatés que pour les constituants non relatés.24 Par rapport à PPF, les constituants relatés manifestent une tendance opposée à celle qu’ils présentaient pour PPD (table 5.22): les constituants relatés attirent nettement le marquage final. Cela donne l’impression que la ponctuation marque la limite de droite des constituants relatés, alors que le relateur indique la limite de gauche. L’utilisation simultanée d’un procédé syntaxique et de la ponctuation «encadrerait» le constituant. 5.2.2.5
Variable LID
Les tris croisant la ponctuation et la position des constituants accusent des écarts encore plus élevés (table 5.23): les constituants se trouvant à l’initiale de la structure qui 24 Le rapport de chances inverse correspond naturellement à l’inverse du rapport présenté (il est
donc inférieur à 1). Dans les tableaux qui suivent, nous présenterons toujours le rapport de chances supérieur à 1, c’est-à-dire celui qui correspond à l’attraction.
185
LID.0 LID.1
PPF.0
PPF.1
46295 27533 73828
15732 847 16579
62027 28380 90407
PPF.0
PPF.1
-374.84 819.25
1669.22 -3648.22
θ
11.0
χ2 = 6510.04, ddl = 1, p = 0 ★★★
TAB . 5.24 – Tri croisé LID × PPF
LIF.0 LIF.1
PPD.0
PPD.1
54089 27319 81408
7993 1061 9054
62082 28380 90462
PPD.0
PPD.1
-56.68 123.98
509.6 -1114.77
θ
3.80
2
χ = 1804.01, ddl = 1, p = 0 ★★★
TAB . 5.25 – Tri croisé LIF × PPD
LIF.0 LIF.1
PPF.0
PPF.1
57783 16045 73828
4589 11990 16579
62372 28035 90407
PPF.0
PPF.1
920.94 -2048.9
-4101.04 9123.97
θ
9.4
χ2 = 16192.49, ddl = 1, p = 0 ★★★
TAB . 5.26 – Tri croisé LIF × PPF
les intègre attirent PPD.1. Les tendances liées à la ponctuation finale sont également opposées à celles qu’on observait pour PPD (table 5.24), où le rapport de chances est énorme: la position initiale repousse très nettement PPF.1. 5.2.2.6
Variable LIF
Si l’on observe la tabulation entre PPD et LIF (table 5.25), on voit que la répulsion est beaucoup plus forte que le lien entre LID et PPD. Si l’on considère simultanément les deux derniers tris, on est amené à penser que la ponctuation initiale marque la limite de gauche des constituants. La valeur de θ est élevée dans les deux cas, ce qui signifie qu’on aurait toutes les chances de repérer ces contrastes à la simple lecture naturelle des documents. En reliant cette tendance au fait que les relateurs – qui rejettent PPD – se trouvent généralement à l’initiale du constituant qu’ils relatent, ce comportement va de pair avec la répulsion existant entre PPD.1 et la fonction de relateur. On pourrait déjà avancer comme hypothèse que, puisque la position des relateurs marque la limite de gauche des constituants relatés (→3.4.4.2), la présence de ponctuation à cet endroit paraît redondante. Et parallèlement (table 5.26), la position finale attire PPF.1. La ponctuation finale marque ainsi la limite de droite des constituants de manière générale.
186
⊗ [ constituant 1 ] ⊗ [ constituant 2 ] ⊗ F IG . 5.1 – Synthèse après tris croisés généraux: segmentation et ponctogrammes
5.2.3
Synthèse et critique de la démarche
Cet ensemble de tris nous a permis de remarquer que la ponctuation était liée à chacune des variables sélectionnées pour l’étude. La synthèse ci-dessous permettra de s’en rendre compte, tout en nous invitant à réfléchir sur la validité des analyses telles que nous avons pu les mener jusqu’à présent. Cette démarche critique nous mènera à reconsidérer notre approche, de façon à ce qu’elle soit plus respectueuse de la réalité que nous cherchons à décrire. L’analyse du détail des tris croisés met en lumière que la ponctuation est un procédé qui s’ajoute à ceux fournis par la morphosyntaxe pour marquer les limites des constituants25 (→5.2.3.1). On pourrait également tenter une synthèse des différentes tendances en essayant de faire voir comment les variables qui ne relèvent pas de la ponctuation se comportent par rapport à celle-ci, mais la synthèse obtenue resterait intuitive (→5.2.3.2). En particulier, une telle analyse ne tiendrait pas compte de la multiplicité des tendances, cantonnant chaque modalité dans un schéma spécifique. De plus, elle diffracterait les variables définitoires des individus, de sorte qu’il ne serait pas possible d’évaluer comment les différentes combinaisons de modalités morphosyntaxiques et positionnelles sont liées à PPD et PPF (→5.2.3.3). 5.2.3.1
Ponctuation et segmentation en constituants
Au chapitre →3, nous avons vu que l’accord et la présence de relateurs délimitaient les constituants (→3.4.4.7). Les tris croisés avec MF, MR, LID et LIF indiquent que l’on peut raisonnablement penser que la ponctuation remplit, entre autres, une fonction similaire. Le nombre de ponctogrammes aux bornes des constituants est en effet significativement supérieur (→5.2.2.5 et →5.2.2.6). Cela montre que ce sont principalement les limites des constituants qui sont marquées et que la ponctuation a une fonction de segmentation isolant les constituants de même niveau les uns des autres. Les scribes concevaient donc la segmentation en unités de manière similaire à la façon dont nous l’avons modélisée. Soit, schématiquement, la figure 5.1.26 Par ailleurs, ce comportement est tout à fait en accord avec ce que nous avons vu au sujet de MR.1: les constituants relatés repoussent PPD.1 et attirent PPF.1. Quant à MF.Rl, qui est la modalité généralement vérifiée pour la fonction du premier constituant d’une structure relatée, il repousse fortement toute ponctuation (figure 5.2). On aurait donc deux manières de délimiter les groupes de mots fonctionnant ensemble. Certains groupes seraient délimités par un ponctogramme de part et d’autre, 25 Voir le rôle des relateurs à cet égard: →3.4.4.2. 26 Dans les schémas qui suivent, nous représentons la présence d’un ponctogramme quelconque
par ‹⊗› et son absence par ‹ø›. Quand les données ne suffisent pas ou que l’écart observé n’est pas significatif, nous l’indiquons par un point d’interrogation.
187
⊗ [ constituant 1 ] ø [ Rl — ø reste du constituant 2 ] ⊗ F IG . 5.2 – Synthèse après tris croisés généraux: segmentation, relateurs et ponctogrammes
h
ø [ constituant 1 ] [Rl — reste du constituant 2 ] ⊗ [ constituant 3 ] ø
i
F IG . 5.3 – Synthèse après tris croisés généraux: interruption
alors que les syntagmes s’ouvrant sur un relateur seraient marqués par un ponctogramme à la finale. Rappelons qu’il s’agit de tendances statistiques. Elles sont en ce sens relativement abstraites par rapport aux données: les signes sont, nous l’avons vu (→5.1.3), assez rares (en particulier à l’initiale), et leur apparition simultanée aux deux extrémités d’un constituant n’est évidemment pas systématique. En outre, dans les faits, ce fonctionnement est rendu opaque par la récursivité des structures syntaxiques. Si la chaîne graphique est linéaire, la structure syntaxique ne l’est pas; il arrive fréquemment que certains constituants non marqués en contiennent d’autres, qui au contraire le sont (figure 5.3). Par exemple, dans «· en cel ıor et en cel oíre míemes · lí deuant dıt foímens [14] en rendírent don et veſture a frere johan condıſt pangnon · delle vauz ſaín lam [15]ber [. . .]» (Document 1276–02–24, 13).
la structure de condıſt pangnon est introduite par un relateur et s’achève par un ponctogramme. Pourtant, elle se trouve à l’intérieur du constituant plus large a frere johan condıſt pangnon · delle vauz ſaín lamber. De la même manière, quand nous avons étudié les liens entre les modalités de MF et celles de PPF (→5.2.2.2), nous avons vu que PPF.1 et MF.Co étaient liés négativement. Cette observation, validée par le test du χ2 , correspondrait ainsi à un rejet du ponctogramme à la suite d’un coordonnant. Pourtant, il existe des occurrences de coordonnants qui sont suivis d’un ponctogramme. Or, le lien entre les deux modalités va dans le sens de la répulsion et la modalité PPF.1 renvoie à la présence d’une autre modalité PPD.1 pour les constituants qui suivent un constituant marqué à la finale. Il serait donc intéressant de considérer que les constituants MF.Co qui vérifient PPF.1 ne sont pas fonctionnellement marqués, mais que la marque qui les suit est causée par le contexte environnant. Un lien significatif ne se comprend donc pas comme une implication logique: il ne s’agit que d’une tendance indiquant une convergence, n’impliquant pas nécessairement une relation de causalité. 5.2.3.2
Un panorama trop général
a. Schémas de ponctuation. En considérant conjointement l’ensemble des tendances, on schématise facilement la manière dont sont réparties les marques de ponctuation. Il y a quatre cas de figure: 1/ ponctuation devant et derrière, 2/ seulement devant, 3/ seulement derrière, 4/ aucune ponctuation. À chacune de ces possibilités sont asso188
⊗
MI.(phrase | ¬phrase | pers-arg) | MF.(R2 | R3 | C5) ⊗
F IG . 5.4 – Synthèse après tris croisés généraux: ponctogramme devant et derrière
⊗
MI.synt-arg | MF.(S1 | C6 | Co) | MR.0 | LID.1 | LIF.0
ø
F IG . 5.5 – Synthèse après tris croisés généraux: ponctogramme devant seulement
ø
MI.¬pers-arg | MF.(A4 | Ap | Dt) | MN.¬pers | MR.1 | LID.0 | LIF.1
⊗
F IG . 5.6 – Synthèse après tris croisés généraux: ponctogramme derrière seulement
ø
MI.(synt | pers | ¬pers) | MF.(P0 | Rl) ø
F IG . 5.7 – Synthèse après tris croisés généraux: aucun ponctogramme
ciées un certain nombre de modalités morphosyntaxiques et positionnelles.27 Le premier schéma (ponctuation devant et derrière) est ainsi représenté dans la figure 5.4. On voit que les modalités des deux variables associées à un marquage de part et d’autre ne sont pas incompatibles. Le schéma de ponctuation uniquement initial est celui de la figure 5.5. Ce schéma est à la fois trivial et étonnant. Suivant notre connaissance de la langue étudiée, il est normal de retrouver associées les modalités de MF et de MR qu’on voit ici (les C6 et les coordonnants ne sont jamais relatés; les sujets ne le sont que très rarement.28 De même, C6 et S1 sont souvent en position initiale et Co n’est jamais en position finale. Par contre, il n’est pas possible de rencontrer S1 ou C6 dans un intégrant non propositionnel. De même, il nous semble que Co n’est quasiment jamais initial. L’association de la modalité MI.synt-arg est donc problématique. Si la ponctuation n’est que finale, le schéma est celui de la figure 5.6. Les modalités ne sont pas incompatibles. Dans les cas où la ponctuation est généralement absente de part et d’autre, comme ceux de la figure 5.7, P0 n’est jamais en contexte immédiat – puisqu’il définit les structures propositionnelles.29 Enfin, deux autres schémas partiels ont été mis à jour (figure 5.8). b. Limitations. Il faut toutefois faire preuve d’une grande vigilance car une telle synthèse est imprécise et donc dangereuse. Tout d’abord, pour se faire une idée de la manière dont les attractions sont échelonnées, on devrait décomposer progressivement chaque tableau en faisant des χ2 suc27 Dans les schémas ci-dessous, la barre verticale signifie ‘ou’. Grouper entre parenthèses plu-
sieurs modalités séparées par des barres verticales nous permet d’isoler une alternative: MI.(phrase | synt) signifie ‘MI.phrase ou MI.synt’. 28 Généralement dans le cadre de la tournure _c’est a savoir. . . _ ou _conute chose soit. . . _, voir les sujets propositionnels (→3.4.4.5). 29 Voir →3.4.2 sur la définition du terme proposition.
189
?
MN.pers ⊗ ? [ MN.0 ] ø
F IG . 5.8 – Synthèse après tris croisés généraux: cas intermédiaires
cessifs (voir →6.1.1 pour un exemple). En effet, face au tableau croisant MN et PPF, par exemple, nous avons vu que la décomposition de l’écart laissait des cases dont la contribution isolée n’était pas pertinente. Mais qu’en est-il de la comparaison des cases entre elles? Le nombre de tests à effectuer deviendrait très rapidement trop important pour être gérable et pour permettre une interprétation aisée. Par ailleurs, la synthèse a été construite sur la base de dépouillements qui négligent toute relation entre PPD et PPF. On vérifie ainsi que MF.Co attire PPD.1, mais y a-t-il une différence entre les MF.Co en fonction de leur ponctuation initiale? 5.2.3.3
Atomisation des individus
Revenons à présent aux problèmes de compatibilité des modalités des différentes variables: deux modalités se rapprochent d’une forme de marquage soit parce qu’elles se ressemblent par rapport au marquage (c’est le cas des différentes modalités d’une même variable), soit parce qu’elles s’attirent. Malheureusement, tels qu’ils ont été menés, les tris croisés ci-dessus ne laissent pas quantifier les relations entre les modalités non ponctuationnelles. Par exemple, nous savons par expérience qu’un grand nombre de R2 sont de nature propositionnelle (mode personnel). Or, autant MF.R2 que MN.pers attirent PPF.1. Comment pourrait-on dire si la présence d’un signe à la finale est plus liée à l’une ou à l’autre de ces modalités morphosyntaxiques? Cet ensemble d’observations ne nous informe que sur la manière dont les variables se comportent lorqu’elles sont comparées deux à deux. Il s’agit d’un guide précieux, mais qui gagnerait à être enrichi par une vue plus globale, comparant systématiquement les relations entretenues par toutes les variables. Enfin, si les tris croisés nous ont montré les liens entre MF.R2 et PPF.1, MR.0 et PPF.0, ces liens négligent une dimension importante des données: les différentes modalités d’une même variable ont beau être mutuellement exclusives, il est évident que les constituants combinent des modalités morphosyntaxiques et positionnelles qui sont liées de manière parfois antagonistes à PPF. Ainsi, MF.R2 et MR.0 ne sont pas incompatibles, comme en témoigne «· et par che ke che ſoıt plus ferme choıſe et eſtable / mes ſıres renírs [. . .] at pendut ſon ſaıal a˘ceſ pre/[20]ſenſ lettreſ en teſmoıngnage de˘veríteıt» (Document 1274–02–24, 18). ˘
˘
La construction ſon ſaıal assumant la fonction R2 est loin d’être exceptionnelle. De même, il se pourrait que les constituants vérifiant MR.1 soient marqués simplement parce qu’ils sont souvent en position LIF.1. Cependant, ce n’est pas la relation entre les variables morphosyntaxiques qui nous intéresse, mais la manière dont ces dernières interfèrent avec la ponctuation. Dès lors, que faire de ces informations si les individus traités sont trop complexes pour en déduire une description valable? Il s’agit donc de trouver un moyen de traiter des relations entre plus de deux variables. Nous avons essayé de faire en sorte que plusieurs 190
tris croisés successifs éclaircissent le terrain, ce que nous exposons dans la section suivante.
5.3
Tris croisés sur une variable de synthèse
Nous expliquerons tout d’abord comment nous avons mis en place une nouvelle série de tris croisés effectués sur une variable synthétisant toutes les autres variables morphosyntaxiques et positionnelles (→5.3.1) avant de les étudier en détail (→5.3.2). Dans la synthèse qui suivra, nous évaluerons dans quelle mesure la ponctuation est régulière en dressant le tableau synoptique des tendances de ponctuations initiale et finale, ce qui nous mènera à poser les questions qui orienteront la suite de notre travail (→5.3.3). Nous avons rejeté d’autres techniques appliquables aux données catégorielles, comme l’analyse factorielle des correspondances, la description statistique des classes et l’analyse log-linéaire. Ce rejet est lié au fonctionnement de ces outils, qu’on aurait bien du mal à présenter en quelques lignes. Retenons simplement ceci: l’analyse factorielle a le défaut d’être trop intuitive et ne permet pas d’inférence,30 et la description statistique des classes complique le traitement des unités peu attestées. Quant à l’analyse log-linéaire, seule méthode que nous connaissions qui soit capable de tenir compte de la diffraction des modalités, elle impose des contraintes concernant les effectifs que nous ne pourrions respecter ici.31 5.3.1
Procédure
Pour éviter l’atomisation, nous avons dû grouper certaines variables morphosyntaxiques et positionnelles en une seule «super-variable» comportant de nombreuses modalités. La grande table de contingence obtenue en croisant cette nouvelle variable avec les variables ponctuationnelles a ensuite été décomposée en plus petites tables exploitables individuellement. 5.3.1.1
Fusion des variables
À l’exception de l’analyse log-linéaire, impraticable avec les données dont nous disposons, les méthodes multivariées ne résolvent pas efficacement le problème de l’atomisation des individus. L’idée qui vient immédiatement à l’esprit est celle d’effectuer des tests non sur des variables simples, mais sur des combinaisons de plusieurs d’entre elles. On combinerait les variables retenues en une seule que l’on évaluerait par rapport à sa relation au marquage. Nous avons donc regroupé les variables morphosyntaxiques et positionnelles en une seule variable complexe, qui ne diffracte pas l’information apportée par 30 Nous en ferons néanmoins usage dans le cadre de l’étude de la forme des ponctogrammes
(chapitre →7): dans ce cas, le nombre de modalités retenues est suffisamment réduit pour employer efficacement cette méthode. 31 Cf. Howell 1998, 705–706 qui expose le problème en termes généraux et Agresti 2002, 395– 396 qui présente les implications mathématiques de ces faibles effectifs.
191
MI
LID
LIF
MF
MN
MR
MM
phrase phrase phrase phrase phrase phrase phrase
1 0 0 0 0 0 0
0 0 0 0 0 0 1
C5 P0 P0 S1 R2 C5 C5
0 0 0 0 ¬pers 0 0
1 0 0 0 0 0 1
1,0,C5,0,1 0,0,P0,0,0 0,0,P0,0,0 0,0,S1,0,0 0,0,R2,¬pers,0 0,0,C5,0,0 0,1,C5,0,1
TAB . 5.27 – Exemple de définition d’individus, MM en dernière colonne
les individus. Les modalités possibles de cette nouvelle variable (notée MM) correspondent à toutes les combinaisons possibles entre les modalités des variables simples LID, LIF, MF, MN et MR. Soit, pour l’exemple donné ci-dessus, la table 5.27.32 De cette manière, chaque individu n’est plus défini que par une seule variable tenant simultanément compte des variables morphosyntaxiques et positionnelles. Le désavantage de cette manipulation est que les individus dont la définition en variables est peu représentée ne sont pas exploitables à l’aide d’un simple test de χ2 . Dans ces conditions, il y a deux possibilités: les regrouper avec des membres d’une autre classe, ou les éliminer des calculs. La première possibilité ne tronque pas l’échantillon; cependant, elle introduit progressivement un biais incontrôlable au point de vue de la qualité des données, dont la description procure, nous l’avons déjà souligné,33 une représentation extrêmement réduite. La seconde solution évite le biais, mais tronque l’échantillon, nous privant d’informations peut-être précieuses. On ne pourrait adopter a priori la première attitude, puisque nous ne connaissons pas la relation que nous voulons mettre en évidence. Nous avons donc choisi de rejeter dans un premier temps toutes les configurations qui ne sont pas suffisamment représentées, quitte à les commenter par la suite. 5.3.1.2
Séparation par modalité de MI
Les analyses sont faites séparément pour les différents types de constituants intégrants (MI, division suivant les bases épistémologiques de la description), ainsi que pour les deux types de marquage. Cette séparation s’est révélée nécessaire: elle permet de lever les problèmes d’homogénéité que nous avions remarqués au sujet des modalités de MF (→5.2.2.2). De cette manière, Ap et Dt, fonctions de syntaxe immédiate, seront traités indépendamment des modalités de MF correspondant à des fonctions argumentales. Cette séparation des types d’incluants diminue l’imprécision liée à la récursivité sans toutefois la réduire à néant. Le seul moyen d’y parvenir serait d’éliminer du traitement toute structure apparaissant à plus d’un niveau, ce qui n’est pas envisageable pour une recherche de tendances générales et pourra éventuellement se faire dans des études plus ciblées.
32 Voir la section où nous exposons comment sont définis les individus (→5.0.2). 33 Voir la section où nous choisissons les variables employées pour décrire les individus (→5.0).
192
0,0,C6,0,0 autres
0
1
132 8523 8655
10 2665 2675
142 11188 11330
0
1
5.1 -0.06
-16.51 0.21
θ
4.13
χ2 = 20.97, ddl = 1, p = 4.68e − 06 ★★★ Après ajustement de Šidàk pour 43 comparaisons: ★★★ (seuils: 0.00119, 0.000234, 2.33e-05)
TAB . 5.28 – Exemple de décomposition de la table de contingence MM × PPD: 0,0,C6,0,0
5.3.1.3
Décomposition des écarts
Pour appréhender la manière dont les différentes modalités de cette nouvelle variable morphosyntaxique et positionnelle attirent ou repoussent la ponctuation, il suffit d’effectuer un test pour chaque ligne des quatorze tableaux de contingence croisant MM avec PPD et PPF – sept modalités de MI et deux variables de ponctuation. Ces tests sont basés sur des tables 2 × 2, réduisant les modalités de MM à celle de la ligne intéressée et à une valeur nommée autres, reprenant les effectifs de toutes les autres modalités. De cette manière, les constituants 0,0,S1,0,0, par exemple, sont opposés à toutes les autres constructions – et l’on peut faire de même avec chaque modalité de MM. L’hypothèse nulle de chaque test serait que le type de constituant focalisé n’attire ni ne rejette de manière particulièrement significative la ponctuation (initiale ou finale, en fonction de la variable croisée avec MM). Si l’on prend comme exemple l’interaction des constituants 0,0,C6,0,0 et de PPD au niveau de la phrase, on obtient la table 5.28, qui est une table 2 × 2. Le tri croisé nous invite à rejeter l’hypothèse nulle et à admettre que ces constituants rejettent significativement PPD. Les constructions attestées moins de dix fois (qui mènent obligatoirement à des valeurs attendues inférieures à 5; →5.2.1.2) n’ont pas été examinées de la sorte, mais leur effectif a toujours été pris en compte dans la ligne autres. D’autre part, nous avons ajouté une ligne supplémentaire à la suite du tableau, ce qui mérite un commentaire. Le fait de pratiquer ces deux comparaisons de manière indépendante mène en effet au problème des comparaisons multiples, bien connu des statisticiens. Opérer de multiples tests et combiner leur résultat augmente la probabilité de commettre une erreur de la première espèce en fonction du nombre de tests et du seuil de tolérance retenu.34 Pour pallier ce problème, il est courant de corriger le seuil α à l’aide de l’ajustement nommé ajustement de Šidàk. Cette correction tient compte du nombre de comparaisons effectuées.35 Il reste néanmoins intéressant de conserver les 34 La formule donnant la probabilité de commettre au moins une fois une erreur de la première
espèce est (cf. Upton/Cook 2006, 286): 1 − (1 − α)c
(5.4)
Soit 0.14 avec α = 0.05 et seulement trois comparaisons. 35 Le seuil corrigé est ainsi:
1 − (1 − α)1/c
(5.5)
Voir par exemple Abdi 2007 pour une présentation générale. Cet ajustement est universel, puisqu’il est basé sur l’inégalité de Bonferroni, «qui stipule que la probabilité d’occurrence
193
0 1
FAB
FRE
8655 2675 11330
76.39 23.61 100
0 1
0
2000
4000
6000
8000
TAB . 5.29 – Tri à plat de PPD pour les constituants MI.phrase
probabilités non corrigées parallèlement aux probabilités corrigées. Nous avons ainsi ajouté une ligne au tableau du χ2 , comportant les seuils α de 5%, 1% et 0.1% ajustés à l’aide de la méthode de Šidàk – les étoiles de cette ligne correspondent aux seuils ajustés: trois étoiles noires correspondent à une probabilité ajustée de 0.1% ou moins, deux étoiles noires à 1%, etc. 5.3.2
Examen des tris croisés
Les sept sections qui suivent comprennent l’analyse des quatorze tableaux de contingence correspondant aux sept types de structure incluante (modalités de MI). Chaque analyse comporte deux divisions: une pour la ponctuation initiale, une autre pour la ponctuation finale. 5.3.2.1
Phrase
Au niveau de la phrase, l’individualité des observations est garantie par l’absence de récursivité. Une phrase est toujours directement intégrée au texte, et jamais à aucune autre structure.36 a. Assimilation des énoncés non phrastiques à la phrase. Pour cette analyse et pour toutes celles qui suivront, nous avons décidé d’assimiler aux phrases les énoncés non phrastiques exprimant un procès.37 Ces derniers, dont l’analyse est faite sur le modèle de la proposition, sont en effet peu nombreux et partagent leurs frontières avec celles des phrases (→3.4.1.2). Il sera relativement aisé de réviser nos conceptions ultérieurement, lorsqu’il sera question d’étudier les constructions marquées spécifiques aux énoncés non phrastiques (→6.1.3.12). d’un ou plusieurs événements ne peut jamais dépasser la somme de leurs probabilités individuelles» (cf. Howell 1998, 409, sic; italiques dans le texte). Cependant, il est considéré comme relativement conservateur (c’est-à-dire sévère) et il augmente ainsi le risque de commettre l’erreur β (Upton/Cook 2006, 286) – l’ajustement dit de Bonferroni est encore plus conservateur. Dans un contexte où les tests employés sont tous non paramétriques (voir note 45), la puissance des tests s’en voit très fortement diminuée. Il faut cependant noter que les règles de décomposition du χ2 en comparaisons indépendantes (exposées sous →6.1.1.1 a) ne sont pas respectées ici (les effectifs de chaque ligne sont pris en considération dans plusieurs tables). Dans ce cas, l’ajustement de Šidak est plus approximatif (Abdi 2007, §2.4). 36 Dans le cas contraire, il s’agit d’une proposition subordonnée. Aucun cas de discours rapporté n’a été relevé. 37 Voir →3.4.5. Voir la liste de ces énoncés dans l’annexe dep-5.3.2.1.a-notphrase-1. Les énoncés non phrastiques n’exprimant pas un procès, peu nombreux une fois les énoncés latins ignorés (parmi lesquels on compte les seings notariaux), sont retirés de l’échantillon (voir leur liste dans l’annexe dep-5.3.2.1.a-notphrase-2).
194
Attractions (seuil adapté 0.119%) 1,0,C6,0,0 1,0,S1,0,0 1,0,C5,0,1 1,0,C5,0,0 1,0,R2,0,0 1,0,P0,0,0 1,0,R3,0,1 1,0,A4,0,0 1,0,A4,0,1 1,0,C5,pers,1 1,0,A4,¬pers,1 0,0,C5,pers,0 0,0,Co,0,0 0,1,C5,0,0 0,1,S1,pers,1 0,1,C5,pers,1 0,1,C5,¬pers,1
780/1002 (78%) 201/245 (82%) 98/112 (88%) 84/95 (88%) 80/107 (75%) 40/43 (93%) 27/27 (100%) 22/23 (96%) 26/33 (79%) 9/10 (90%) 14/21 (67%) 13/22 (59%) 171/605 (28%) 75/242 (31%) 14/49 (29%) 9/30 (30%) 8/30 (27%) 1e−300
1
F IG . 5.9 – Attractions entre PPD et MM, au niveau phrase Répulsions (seuil adapté 0.119%) 0,0,P0,0,0 0,0,C5,0,1 0,0,C5,0,0 0,0,A4,0,1 0,1,R2,¬pers,0 0,1,A4,0,1 0,1,P0,0,0 0,0,C5,pers,1 0,0,C6,0,0 0,0,R2,¬pers,0 0,0,A4,¬pers,1 0,0,R3,0,1 0,1,R2,pers,1 0,0,A4,0,0 0,0,R3,0,0 0,1,S1,0,0 0,1,A4,¬pers,1 0,1,R3,0,1 0,1,A4,0,0 0,0,R2,0,0 0,0,R2,pers,1 0,1,C5,0,1 0,1,R2,0,0 0,1,A4,pers,1 0,0,C5,¬pers,1 0,0,S1,0,0
103/2253 (4.6%) 55/826 (6.7%) 46/608 (7.6%) 13/273 (4.8%) 4/177 (2.3%) 2/110 (1.8%) 1/95 (1.1%) 7/128 (5.5%) 10/142 (7.0%) 0/70 (0.0%) 0/60 (0.0%) 58/378 (15.3%) 33/243 (13.6%) 1/54 (1.9%) 14/137 (10.2%) 14/127 (11.0%) 0/28 (0.0%) 3/39 (7.7%) 0/18 (0.0%) 149/722 (20.6%) 2/19 (10.5%) 79/366 (21.6%) 60/277 (21.7%) 6/33 (18.2%) 3/18 (16.7%) 331/1404 (23.6%) 1.23e−124
1
F IG . 5.10 – Répulsions entre PPD et MM, au niveau phrase
b. Marquage initial. Les proportions entre les individus marqués à l’initiale et ceux qui ne le sont pas se résument à la table 5.29. Près d’un quart des individus sont marqués à l’initiale. On sait par les tris croisés précédents (→5.2.2.1) que cette proportion est significativement supérieure aux autres. En décomposant les tableaux de contingence croisant PPD avec les modalités de MM rencontrées au niveau d’intégration syntaxique correspondant à la phrase et attestées au moins dix fois, on obtient une liste de probabilités. Celles-ci sont ensuite classées par ordre croissant en deux graphiques, correspondant respectivement aux attractions et aux répulsions entre les modalités de MM et la présence de marquage. Ces graphiques, dont nous allons détailler les conventions de lecture, prennent la forme donnée dans les figures 5.9 et 5.10.38 Les graphiques se lisent comme suit. L’axe des abscisses, construit sur une
38 Le tri croisé sur la base duquel ce graphique a été construit peut être consulté en annexe; voir
annexe 5.3.2.table-PPD-phrase. Il en sera de même pour tous les graphiques de ce chapitre, pour lesquels nous fournissons les tabulations sous un nom explicite.
195
échelle logarithmique,39 correspond à la probabilité40 qu’une modalité de MM attire (première figure) ou repousse (seconde figure) non significativement le marquage initial (non-rejet de l’hypothèse H0 ). Le rapport exact des quantités de constructions marquées est reporté sur l’axe vertical de droite. Cette proportion donne une idée de la régularité du marquage. La couleur du fond du graphique aide à identifier les paliers de significativité: le fond blanc correspond à un rejet de l’hypothèse nulle une fois que la correction de Šidàk a été appliquée à un seuil de 5%; le fond gris clair correspond à une H0 qui ne serait pas rejetée avec cette correction, mais qui le serait dans le cas d’un test unique (toujours un seuil de 5%); le fond gris foncé indique que H0 ne peut être rejetée selon aucun de ces critères. Par exemple, la première ligne figurant en haut du tableau des attractions concerne les constituants de type 1,0,C6,0,0, c’est-à-dire les C6 non relatés de nature non propositionnelle situés au début de la phrase. La probabilité qu’il n’y ait pas attraction (H0 ) est infime et se trouve largement en-dessous du seuil corrigé le plus bas. Pour cette raison, le point correspondant à 1,0,C6,0,0 est situé très haut dans dans la portion blanche du graphique. Les effectifs reportés dans la marge de gauche correspondent aux dépouillements et révèlent qu’une très large proportion des constituants sont marqués. On peut également voir que 1,0,S1,0,0 apparaît juste en dessous, avec une probabilité supérieure, mais demeurant extrêmement significative. Au fur et à mesure que l’on descend dans le graphique, la probabilité de H0 augmente, jusqu’à franchir le seuil critique au-delà duquel les points figurent dans la zone grisée. Les coordonnants (0,0,Co,0,0) s’y trouvent, mais dans la partie la plus claire. Cela signifie que si nous n’avions effectué qu’un seul test opposant les coordonnants aux autres constituants, le résultat aurait permis de rejeter l’hypothèse nulle. Néanmoins, nous avons dû effectuer de nombreux χ2 et il est plus prudent de ne pas accepter que l’attraction entre PPD.1 et 0,0,Co,0,0 est significative. Quant aux 0,1,C5,pers,1 (propositions de mode personnel relatées à fonction de circonstant se trouvant en fin de phrase), elles apparaissent dans la partie la plus foncée, ce qui veut dire que la probabilité du test est trop élevée pour qu’on juge l’attraction significative. Combiner les tris croisés successifs et les comparer sous la forme de graphique met ainsi clairement en évidence les constituants qui se distinguent des autres, que ce soit du point de vue des attractions ou de celui des répulsions. Pareilles visualisations rendent simultanément accessibles plusieurs types d’informations: ils nous informent certes sur la significativité des écarts, mais également sur leur régularité. L’observation attentive du détail des modalités de MM met en lumière des tendances qui les dépassent. On peut parfois observer qu’il existe un comportement solidaire de différents types de constituants, qui partagent une position, une fonction ou une nature similaires. Les graphiques ne sont cependant pas construits pour mettre 39 Il s’agit, plus précisément, d’un logarithme décimal. Le logarithme décimal d’un nombre est
la puissance à laquelle il faut élever 10 pour obtenir ce nombre. Soit, par exemple, log10 (100) = 2, log10 (0.10) = −1, etc.
(5.6)
Appliqué à un axe, ce type d’échelle permet de réduire la distance entre les paliers de significativité: il y a la même distance entre 0.1 et 0.01 qu’entre 0.01 et 0.001, puisque les logarithmes de 0.1, 0.01 et 0.001 sont −1, −2 et −3. 40 Nous avons fixé le plancher des probabilités à 1e − 300.
196
ce dernier type d’information en évidence: ces ressemblances ne ressortent qu’à la lecture attentive de chacun d’entre eux. On peut ainsi décrire les deux graphiques. Examinons pour commencer celui qui symbolise les attractions: – ce sont essentiellement les constituants initiaux qui attirent PPD; – dans d’autres positions (dans le corps ou à la finale), les coordonnants et deux formes de C5 attirent le marquage, mais de ces trois types, seules les incidentes (c’est-à-dire 0,0,C5,pers,0) sont marquées dans plus de la moité des cas et doivent être conservées après ajustement du seuil α; – le marquage initial est extrêmement régulier; le pourcentage de marquage pour chaque constituant attirant le ponctogramme est supérieur à 80% dans plus de la moitié des cas (toutes les fonctions sont concernées), ce qui est particulièrement le cas pour les constituants initiaux; – les constituants marqués sont généralement simples (non relatés et de nature non propositionnelle), mais cela est certainement dû au fait que, de manière générale, ce sont des constituants simples qui ouvrent la phrase. Voyons ce que le second tableau nous apprend des répulsions: – à cet égard, aucun constituant initial ne repousse le ponctogramme initial, même de manière non significative: les tendances négatives répondent aux tendances positives de manière remarquablement systématique; – les répulsions ont une régularité qui dépasse 90% (soit une proportion de constituants marqués inférieure à 10%) pour la majorité des constituants concernés, ce qui implique toutes les fonctions; – étant donné sa place centrale dans la construction de la phrase, le prédicat requiert toute notre attention: on voit ici qu’il manifeste le rejet le plus important par rapport à PPD; – il y a une très grande diversité dans les types de constituants qui repoussent le marquage. Il ressort essentiellement un contraste entre les constituants initiaux, qui attirent le marquage, et ceux qui ne le sont pas, qui le repoussent. Ces observations mettent en évidence un emploi très régulier de la ponctuation pour délimiter les bornes de la phrase: sans étudier PPF, nous savons déjà que le marquage sera très régulier à la finale, puisque les phrases s’enchaînent les unes aux autres. On ne peut par contre pas s’avancer en ce qui concerne les fonctions particulières qui feraient exception à cette tendance. Étant donné son importance, le marquage du premier constituant de la phrase représente très certainement la plus grande partie de l’écart à l’indépendance. De ce fait, il est possible que les autres attractions soient complètement occultées par un contraste d’une telle ampleur. Il est donc intéressant de refaire l’ensemble des tris croisés, mais en retirant les constituants initiaux de l’échantillon. Nous construisons ainsi les graphiques 5.11 et 5.12. Nous ne commenterons pas les répulsions, sinon pour constater que leur nombre a logiquement diminué. Les attractions mises en lumière par cette nouvelle série de tests sont bien entendu les coordonnants et les circonstants qui se distinguaient déjà dans le graphique 5.9, mais également:
197
Attractions (seuil adapté 0.160%) 0,0,S1,0,0 0,0,Co,0,0 0,1,C5,0,0 0,0,C5,pers,0 0,0,R2,0,0 0,1,C5,0,1 0,1,R2,0,0 0,1,S1,pers,1 0,1,C5,pers,1 0,1,C5,¬pers,1 0,0,R3,0,1 0,1,A4,pers,1 0,0,C5,¬pers,1 0,1,R2,pers,1
331/1404 (24%) 171/605 (28%) 75/242 (31%) 13/22 (59%) 149/722 (21%) 79/366 (22%) 60/277 (22%) 14/49 (29%) 9/30 (30%) 8/30 (27%) 58/378 (15%) 6/33 (18%) 3/18 (17%) 33/243 (14%) 1.29e−33
1
F IG . 5.11 – Attractions significatives entre PPD et MM, au niveau phrase (sans les constituants initiaux) Répulsions (seuil adapté 0.160%) 0,0,P0,0,0 0,0,C5,0,1 0,0,C5,0,0 0,1,R2,¬pers,0 0,0,A4,0,1 0,1,A4,0,1 0,1,P0,0,0 0,0,R2,¬pers,0 0,0,A4,¬pers,1 0,0,C5,pers,1 0,0,A4,0,0 0,0,C6,0,0 0,1,A4,¬pers,1 0,1,A4,0,0 0,0,R3,0,0 0,1,R3,0,1 0,1,S1,0,0 0,0,R2,pers,1
103/2253 (4.6%) 55/826 (6.7%) 46/608 (7.6%) 4/177 (2.3%) 13/273 (4.8%) 2/110 (1.8%) 1/95 (1.1%) 0/70 (0.0%) 0/60 (0.0%) 7/128 (5.5%) 1/54 (1.9%) 10/142 (7.0%) 0/28 (0.0%) 0/18 (0.0%) 14/137 (10.2%) 3/39 (7.7%) 14/127 (11.0%) 2/19 (10.5%) 1.20e−44
1
F IG . 5.12 – Répulsions significatives entre PPD et MM, au niveau phrase (sans les constituants initiaux)
0 1
FAB
FRE
8648 2707 11355
76.16 23.84 100
0 1
0
2000
4000
6000
8000
TAB . 5.30 – Tri à plat de PPF pour les constituants MI.phrase
– les sujets 0,0,S1,0,0, ainsi que les régimes 0,0,R2,0,0 et 0,1,R2,0,0; – les 0,1,S1,pers,1 (quoique de manière non significative après correction du seuil); – une grande variété de circonstants relatés en position finale: 0,1,C5,0,0, 0,1,C5,pers,1 et 0,1,C5,¬pers,1. c. Marquage final. Comme on s’y attendait, la proportion de structures marquées à la finale est très proche de la proportion observée pour le marquage initial (table 5.30). À nouveau, du fait que la modalité de MI est MI.phrase, aucun problème de récursivité ne se pose. Les graphiques synthétisant les attractions et répulsions sont aussi riches que ceux que nous avons analysés pour PPD, auxquels ils répondent assez bien. Pour ce qui est des attractions (figure 5.13):
198
Attractions (seuil adapté 0.119%) 0,1,C5,0,1 0,1,R2,0,0 0,1,R2,pers,1 0,1,R2,¬pers,0 0,1,C5,0,0 0,1,S1,0,0 1,0,R3,0,1 0,1,A4,0,1 0,0,C5,pers,1 0,1,A4,pers,1 0,1,C5,¬pers,1 0,1,R3,0,1 0,1,A4,¬pers,1 0,1,C5,pers,1 0,1,S1,pers,1 0,1,P0,0,0 0,0,C5,pers,0 0,0,R3,0,1 0,1,A4,0,0 0,0,C5,0,1 0,0,R2,pers,1 1,0,C5,pers,1 0,0,C5,¬pers,1 0,0,R2,¬pers,0
275/340 (81%) 212/276 (77%) 192/243 (79%) 147/177 (83%) 150/193 (78%) 110/127 (87%) 96/133 (72%) 81/109 (74%) 80/128 (62%) 32/33 (97%) 28/29 (97%) 30/37 (81%) 25/28 (89%) 26/30 (87%) 33/49 (67%) 36/58 (62%) 17/22 (77%) 131/378 (35%) 10/18 (56%) 225/826 (27%) 9/19 (47%) 5/10 (50%) 7/18 (39%) 17/70 (24%) 6.43e−138
1
F IG . 5.13 – Attractions entre PPF et MM, au niveau phrase Répulsions (seuil adapté 0.119%) 0,0,P0,0,0 1,0,C6,0,0 0,0,Co,0,0 1,0,S1,0,0 0,0,C6,0,0 0,0,S1,0,0 1,0,R2,0,0 0,0,A4,0,1 1,0,P0,0,0 1,0,C5,0,0 1,0,A4,0,1 0,0,R3,0,0 0,0,A4,¬pers,1 0,0,C5,0,0 0,0,R2,0,0 0,0,A4,0,0 1,0,A4,¬pers,1 1,0,C5,0,1 1,0,A4,0,0
56/2253 (2.5%) 5/1002 (0.5%) 13/605 (2.1%) 17/279 (6.1%) 0/142 (0.0%) 257/1404 (18.3%) 4/107 (3.7%) 38/273 (13.9%) 0/44 (0.0%) 8/95 (8.4%) 0/34 (0.0%) 17/137 (12.4%) 4/60 (6.7%) 116/608 (19.1%) 150/722 (20.8%) 7/54 (13.0%) 2/21 (9.5%) 21/112 (18.8%) 5/23 (21.7%) 3.24e−155
1
F IG . 5.14 – Répulsions entre PPF et MM, au niveau phrase
– elles restent très régulières, mais sont apparemment moins franches que pour PPD.1 (pourcentages moins élevés); – elles paraissent spécifiques de la position finale; – les constituants attirant PPF.1 sans vérifier LIF.1 sont les C5 qui prennent la forme d’une proposition personnelle ou sont relatés et les R3 non propositionnels relatés; – si l’on ajoute à cet inventaire les constituants ne passant pas le seuil corrigé, on retrouve également les R2 propositionnels (mode personnel) et les C5 non propositionnels non finaux, mais relatés. Les répulsions principales (figure 5.14) nous disent que: – le marquage final n’est jamais repoussé par les constituants qui occupent la dernière position de la structure dont ils sont constituants immédiats; – la répulsion du marquage final semble caractéristique des constituants non relatés de nature non propositionnelle. Seuls les constituants de fonction A4 paraissent
199
Attractions (seuil adapté 0.183%) 1,0,R3,0,1 0,0,C5,pers,1 0,0,R3,0,1 0,0,C5,0,1 0,0,C5,pers,0 0,0,R2,0,0 0,0,S1,0,0 0,0,C5,0,0 0,0,R2,pers,1 1,0,C5,pers,1 0,0,C5,¬pers,1 0,0,R2,¬pers,0 1,0,C5,0,1 1,0,A4,0,0 0,0,A4,0,1
96/133 (72%) 80/128 (62%) 131/378 (35%) 225/826 (27%) 17/22 (77%) 150/722 (21%) 257/1404 (18%) 116/608 (19%) 9/19 (47%) 5/10 (50%) 7/18 (39%) 17/70 (24%) 21/112 (19%) 5/23 (22%) 38/273 (14%) 5.86e−86
1
F IG . 5.15 – Attractions significatives entre PPF et MM, au niveau phrase (sans les constituants finaux) Répulsions (seuil adapté 0.183%) 0,0,P0,0,0 1,0,C6,0,0 0,0,Co,0,0 0,0,C6,0,0 1,0,S1,0,0 1,0,R2,0,0 1,0,P0,0,0 1,0,A4,0,1 0,0,A4,¬pers,1 1,0,C5,0,0 0,0,R3,0,0 1,0,A4,¬pers,1 0,0,A4,0,0
56/2253 (2.5%) 5/1002 (0.5%) 13/605 (2.1%) 0/142 (0.0%) 17/279 (6.1%) 4/107 (3.7%) 0/44 (0.0%) 0/34 (0.0%) 4/60 (6.7%) 8/95 (8.4%) 17/137 (12.4%) 2/21 (9.5%) 7/54 (13.0%) 1.32e−69
1
F IG . 5.16 – Répulsions significatives entre PPF et MM, au niveau phrase (sans les constituants finaux)
en effet incompatibles avec le marquage dans d’autres conditions, mais jamais de manière catégoriquement significative; – P0 repousse également ce marquage. Ces faits ne contredisent pas ceux qui caractérisaient le marquage initial ci-dessus (→5.3.2.1 b): il y a bien une propension à employer les signes aux limites de la phrase. La différence fondamentale entre l’absence de ponctuation des constituants simples (MN.0 et MR.0) et la ponctuation des constituants complexes est manifeste. Néanmoins, ces dernières observations ne résistent pas à un nouveau test ignorant les constituants finaux. La force de l’attraction entre PPF.1 et les constituants en fin de phrase est telle qu’elle occulte d’autres liens, tout comme l’attraction entre la ponctuation initiale et le début de la phrase cachait d’autres tendances (figures 5.15 et 5.16). Les nouveaux tests font ressortir l’ensemble des constituants non finaux qui se distinguaient déjà en première analyse, mais également: – 0,0,S1,0,0 et 0,0,R2,0,0; – ainsi qu’un ensemble de constructions ne dépassant pas le seuil corrigé: 0,0,R2,¬pers,0 et les circonstants 1,0,C5,pers,1 et 0,0,C5,¬pers,1.
200
0 1
FAB
FRE
4714 629 5343
88.23 11.77 100
0 1
0
1000
2000
3000
4000
TAB . 5.31 – Tri à plat de PPD pour les constituants MI.pers-arg Attractions (seuil adapté 0.171%) 0,0,Co,0,0 1,0,C6,0,0 0,0,Rl,0,0 1,0,Rl,0,0 1,0,S1,0,0 0,0,C5,pers,0 1,0,A4,¬pers,1 0,1,C5,0,1 0,1,C5,0,0 1,0,R2,0,0 0,1,R2,pers,1
127/387 (33%) 9/10 (90%) 12/33 (36%) 111/701 (16%) 6/13 (46%) 5/15 (33%) 4/12 (33%) 31/190 (16%) 12/73 (16%) 3/13 (23%) 7/49 (14%) 4.18e−40
1
F IG . 5.17 – Attractions entre PPD et MM, au niveau pers-arg
5.3.2.2
Propositions personnelles de fonction argumentale
Les spécificités du marquage de la phrase dégagées, abordons celles des structures inférieures, en commençant par celles qui lui ressemblent le plus. Les constituants immédiats des structures de nature propositionnelle (mode personnel) de fonction argumentale sont beaucoup moins nombreux que les constituants immédiats de la phrase, ce qui se traduit par un nombre plus important de types de constituants peu représentés (effectif < 10). Abordons, comme nous venons de le faire au niveau de la phrase, la ponctuation initiale, puis la ponctuation finale. Il faut noter qu’à partir de ce dépouillement, la récursivité des structures introduit le problème méthodologique que nous avons présenté supra (→5.1.3 a). À ce stade, nous ne le traiterons pas. Nous y reviendrons au chapitre suivant, lorsqu’il sera question d’étudier ces constituants particuliers (notamment →6.1.1). a. Marquage initial. La proportion de marquage est plus faible qu’au niveau de la phrase (table 5.31). Cela correspond, comme on l’a vu, à un écart positif significatif par rapport aux tendances dégagées dans les tris croisés (→5.2.2.3). La faible fréquence de PPD.1 laisse entendre que le phénomène de marquage doit être très prégnant. Les attractions (figure 5.17) nous apprennent que: – bien que les effectifs soient faibles, il reste particulièrement clair que la position initiale est particulièrement liée au marquage, les relateurs se trouvant généralement à l’initiale des structures dont ils sont un constituant immédiat; – la régularité d’attraction est beaucoup moins nette qu’au niveau de la phrase (il n’y a guère que le peu fréquent 1,0,C6,0,0 qui attire la ponctuation à plus de 90%); – les constituants qui attirent le plus le marquage sont les relateurs, les coordonnants et les C6 (c’est-à-dire l’ensemble des mots capables de mettre en relation les propositions entre elles); – en tenant compte des constituants rejetés après correction, les incidentes sont également liées au marquage initial.
201
Répulsions (seuil adapté 0.171%) 0,0,P0,0,0 0,0,A4,0,1 0,1,P0,0,0 0,1,R2,0,0 0,1,A4,0,1 0,0,R2,0,0 0,0,A4,0,0 0,0,R2,¬pers,0 0,1,R2,¬pers,0 0,0,S1,0,0 0,0,R3,0,1 0,0,R3,0,0 0,0,C5,pers,1 0,1,A4,0,0 0,0,C5,0,0 0,0,A4,¬pers,1 0,0,C5,0,1 0,1,R3,0,1 0,1,S1,0,0
65/980 (6.6%) 4/261 (1.5%) 0/92 (0.0%) 6/127 (4.7%) 3/77 (3.9%) 19/249 (7.6%) 0/37 (0.0%) 0/37 (0.0%) 1/49 (2.0%) 82/830 (9.9%) 2/57 (3.5%) 2/46 (4.3%) 1/27 (3.7%) 0/12 (0.0%) 45/429 (10.5%) 0/11 (0.0%) 40/372 (10.8%) 3/26 (11.5%) 4/38 (10.5%) 4.5e−08
1
F IG . 5.18 – Répulsions entre PPD et MM, au niveau pers-arg Attractions (seuil adapté 0.205%) 0,0,Co,0,0 0,0,Rl,0,0 0,1,C5,0,1 0,0,C5,pers,0 0,1,C5,0,0 0,1,R2,pers,1 0,1,R3,0,1 0,0,C5,0,1
127/387 (33%) 12/33 (36%) 31/190 (16%) 5/15 (33%) 12/73 (16%) 7/49 (14%) 3/26 (12%) 40/372 (11%) 2.36e−49
1
F IG . 5.19 – Attractions significatives entre PPD et MM, au niveau persarg (sans les constituants initiaux)
0 1
FAB
FRE
4281 1062 5343
80.12 19.88 100
0 1
0
1000
2000
3000
4000
TAB . 5.32 – Tri à plat de PPF pour les constituants MI.pers-arg
En ce qui concerne les répulsions (figure 5.18): – aucun constituant initial ne paraît incompatible avec le marquage initial; – par ailleurs, alors que les attractions du marquage initial sont très faibles au même niveau, les répulsions sont quant à elles extrêmement fortes et leur régularité dépasse systématiquement les 90%; – la position de P0 (répulsion) paraît aussi forte qu’au niveau de la phrase. La ressemblance de ces tendances avec celles qui caractérisaient la phrase est frappante. Ainsi, à l’instar de la phrase, la proposition de mode personnel et de fonction argumentale attire particulièrement PPD.1 devant son premier constituant. Il est donc utile de procéder à une nouvelle analyse, éliminant de l’échantillon tous les individus dont la modalité de la variable LID est 1 (figures 5.19 et 5.20). Ces nouveaux graphiques ne changent pas les attractions de manière aussi spectaculaire que c’était le cas au niveau de la phrase. On voit simplement que les 0,1,C5,0,1 sont particulièrement marqués, mais ne passent pas le seuil corrigé. La relative pauvreté des résultats est certainement liée à la faiblesse des effectifs.
202
Répulsions (seuil adapté 0.205%)
4/261 (1.5%) 65/980 (6.6%) 0/92 (0.0%) 6/127 (4.7%) 0/37 (0.0%) 0/37 (0.0%) 3/77 (3.9%) 1/49 (2.0%) 2/57 (3.5%) 19/249 (7.6%) 2/46 (4.3%) 1/27 (3.7%) 0/12 (0.0%) 82/830 (9.9%) 0/11 (0.0%) 4/38 (10.5%) 45/429 (10.5%)
0,0,A4,0,1 0,0,P0,0,0 0,1,P0,0,0 0,1,R2,0,0 0,0,A4,0,0 0,0,R2,¬pers,0 0,1,A4,0,1 0,1,R2,¬pers,0 0,0,R3,0,1 0,0,R2,0,0 0,0,R3,0,0 0,0,C5,pers,1 0,1,A4,0,0 0,0,S1,0,0 0,0,A4,¬pers,1 0,1,S1,0,0 0,0,C5,0,0
1.64e−06
1
F IG . 5.20 – Répulsions significatives entre PPD et MM, au niveau persarg (sans les constituants initiaux)
Attractions (seuil adapté 0.171%)
151/190 (79%) 90/127 (71%) 55/73 (75%) 54/77 (70%) 40/49 (82%) 37/49 (76%) 55/92 (60%) 140/372 (38%) 20/26 (77%) 24/38 (63%) 11/12 (92%) 18/27 (67%) 11/15 (73%) 8/37 (22%) 12/57 (21%)
0,1,C5,0,1 0,1,R2,0,0 0,1,C5,0,0 0,1,A4,0,1 0,1,R2,¬pers,0 0,1,R2,pers,1 0,1,P0,0,0 0,0,C5,0,1 0,1,R3,0,1 0,1,S1,0,0 0,1,A4,0,0 0,0,C5,pers,1 0,0,C5,pers,0 0,0,R2,¬pers,0 0,0,R3,0,1
1.03e−96
1
F IG . 5.21 – Attractions entre PPF et MM, au niveau pers-arg
Répulsions (seuil adapté 0.171%)
1/701 (0.14%) 50/980 (5.10%) 0/387 (0.00%) 91/830 (10.96%) 50/429 (11.66%) 1/46 (2.17%) 0/33 (0.00%) 2/37 (5.41%) 0/12 (0.00%) 0/10 (0.00%) 42/249 (16.87%) 45/261 (17.24%) 1/13 (7.69%) 1/13 (7.69%) 2/11 (18.18%)
1,0,Rl,0,0 0,0,P0,0,0 0,0,Co,0,0 0,0,S1,0,0 0,0,C5,0,0 0,0,R3,0,0 0,0,Rl,0,0 0,0,A4,0,0 1,0,A4,¬pers,1 1,0,C6,0,0 0,0,R2,0,0 0,0,A4,0,1 1,0,R2,0,0 1,0,S1,0,0 0,0,A4,¬pers,1
1.66e−44
1
F IG . 5.22 – Répulsions entre PPF et MM, au niveau pers-arg
203
Attractions (seuil adapté 0.256%) 0,0,C5,0,1 0,0,C5,pers,1 0,0,C5,pers,0 0,0,A4,0,1 0,0,R2,0,0 0,0,R3,0,1 0,0,R2,¬pers,0 0,0,C5,0,0 0,0,A4,¬pers,1 0,0,S1,0,0
140/372 (38%) 18/27 (67%) 11/15 (73%) 45/261 (17%) 42/249 (17%) 12/57 (21%) 8/37 (22%) 50/429 (12%) 2/11 (18%) 91/830 (11%) 5.86e−68
1
F IG . 5.23 – Attractions significatives entre PPF et MM, au niveau persarg (sans les constituants finaux)
b. Marquage final. La proportion de constituants marqués est également plus réduite qu’au niveau de la phrase (table 5.32), où les liens entre MM et PPF prennent la forme des figures 5.21 et 5.22. Cela nous permet de remarquer que: – le marquage est largement plus présent à la finale des constructions; – bien qu’apparemment plus faibles qu’elles ne l’étaient au niveau de la phrase, les attractions du marquage initial sont ici nettement plus régulières; – en outre, seuls quelques types de constituants attirent PPF.1 sans être à la finale. Ceux dont la fréquence est suffisante sont de fonction C5: 0,0,C5,pers,0 (incidentes), 0,0,C5,pers,1 et 0,0,C5,0,1, c’est-à-dire les circonstants complexes. Quant aux répulsions: – à nouveau, PPF.1 n’est repoussé par aucun constituant final, relaté, ou de nature propositionnelle; – outre le rejet systématique de PPF.1 par P0, on voit que les constituants relateurs et coordonnants sont quasi totalement incompatibles avec un ponctogramme à leur suite, ce qui correspond à ce qu’on pouvait déjà remarquer pour les constituants MI.phrase (rejet de PPF.1 par les C6 et les Co). Il saute aux yeux que les tendances détectées pour les propositions personnelles de fonction argumentale ne diffèrent que faiblement de celles qu’on a pu dégager au niveau de la phrase: ce sont les limites de gauche et de droite qui attirent le plus la ponctuation (de ce fait, les relateurs sont particulièrement marqués à l’initiale), et certains C5 se détachent distinctement du reste des constituants. À ce stade, on est déjà en droit de se demander si la différence de fréquence de marquage des limites de la phrase et de la proposition personnelle de fonction argumentale est significativement différente. En comparaison avec le marquage initial, les fréquences absolues et relatives de marquage final sont beaucoup plus élevées. Nous nous attendons à ce que le retrait des constituants finaux de l’échantillon produise des changements conséquents dans les nouveaux graphiques (figures 5.23 et 5.24). Une série d’actants particulièrement marqués à la finale se détachent: – les 0,0,R2,0,0 et les 0,0,R3,0,1, qui attiraient déjà PPF.1 au niveau de la phrase; – mais également les 0,0,A4,0,1.
204
Répulsions (seuil adapté 0.256%) 1,0,Rl,0,0 0,0,Co,0,0 0,0,P0,0,0 0,0,Rl,0,0 0,0,R3,0,0 0,0,A4,0,0 1,0,A4,¬pers,1 1,0,C6,0,0 1,0,R2,0,0 1,0,S1,0,0
1/701 (0.14%) 0/387 (0.00%) 50/980 (5.10%) 0/33 (0.00%) 1/46 (2.17%) 2/37 (5.41%) 0/12 (0.00%) 0/10 (0.00%) 1/13 (7.69%) 1/13 (7.69%) 1.45e−22
1
F IG . 5.24 – Répulsions significatives entre PPF et MM, au niveau persarg (sans les constituants finaux)
0 1
FAB
FRE
2198 187 2385
92.16 7.84 100
0 1
0
500
1000
1500
2000
TAB . 5.33 – Tri à plat de PPD pour les constituants MI.¬pers-arg Attractions (seuil adapté 0.244%) 0,0,Co,0,0 0,1,R2,pers,1 0,1,C5,0,0 1,0,Rl,0,0 0,1,C5,0,1 0,0,R2,0,0 0,1,R3,0,1 0,0,C5,0,0
39/152 (25.7%) 8/15 (53.3%) 14/57 (24.6%) 36/270 (13.3%) 17/140 (12.1%) 20/189 (10.6%) 3/20 (15.0%) 6/76 (7.9%) 1.14e−16
1
F IG . 5.25 – Attractions entre PPD et MM, au niveau ¬pers-arg
5.3.2.3
Propositions non personnelles de fonction argumentale
Le nombre de constituants est encore moindre à ce niveau.41 Nous n’avons que peu de matériaux pour travailler. a. Marquage initial. La ponctuation initiale est ici très rare (table 5.33). En conséquence, on s’attend à ce que les attractions nous apprennent relativement peu de choses (peu de constituants ont un comportement suffisamment marqué pour être distinctif), comme on le voit sur les figures 5.25 et 5.26.42 On peut tout de même faire quelques observations, rendues possibles par les effectifs: – il y a tout d’abord une dissemblance notable avec ce qui précède, puisque la position initiale ne ressort pas; – par contre, l’attraction du marquage par les constituants Co et Rl reste pertinente (quoique les proportions en révèlent l’aspect non systématique); ces données sont peu différenciées de ce que nous avons pu voir ci-dessus. Les quelques tendances négatives ne concordent pas toujours avec celles que l’on avait pu observer pour les autres constructions déjà étudiées: 41 Il est probable que cela est en partie dû à la manière dont nous avons traité les C5, que nous
avons «remontés» au niveau syntaxique le plus élevé possible (→3.4.7.4). 42 Voir les annexes pour les tableaux.
205
Répulsions (seuil adapté 0.244%) 0,1,P0,0,0 0,0,P0,0,0 1,0,P0,0,0 0,1,R2,0,0 0,1,A4,0,1 0,0,R3,0,1 0,0,Rl,0,0 0,0,A4,0,1 1,0,R3,0,0 0,0,A4,0,0 0,0,R3,0,0 1,0,R2,0,0 0,0,C5,0,1
0/238 (0.00%) 2/280 (0.71%) 4/282 (1.42%) 8/164 (4.88%) 1/48 (2.08%) 1/35 (2.86%) 0/17 (0.00%) 1/33 (3.03%) 0/14 (0.00%) 0/11 (0.00%) 0/11 (0.00%) 8/122 (6.56%) 9/119 (7.56%) 3.92e−06
1
F IG . 5.26 – Répulsions entre PPD et MM, au niveau ¬pers-arg Attractions (seuil adapté 0.301%) 0,0,Co,0,0 0,1,R2,pers,1 0,1,C5,0,0 0,1,C5,0,1 0,0,R2,0,0 0,1,R3,0,1
39/152 (26%) 8/15 (53%) 14/57 (25%) 17/140 (12%) 20/189 (11%) 3/20 (15%) 4.47e−16
1
F IG . 5.27 – Attractions significatives entre PPD et MM, au niveau ¬persarg (sans les constituants initiaux) Répulsions (seuil adapté 0.301%) 0,0,P0,0,0 0,1,P0,0,0 0,1,R2,0,0 0,1,A4,0,1 0,0,R3,0,1 0,0,Rl,0,0 0,0,A4,0,1 0,0,A4,0,0 0,0,R3,0,0 0,0,C5,0,0 0,0,C5,0,1
2/280 (0.71%) 0/238 (0.00%) 8/164 (4.88%) 1/48 (2.08%) 1/35 (2.86%) 0/17 (0.00%) 1/33 (3.03%) 0/11 (0.00%) 0/11 (0.00%) 6/76 (7.89%) 9/119 (7.56%) 1.13e−06
1
F IG . 5.28 – Répulsions significatives entre PPD et MM, au niveau ¬persarg (sans les constituants initiaux)
– il est vrai que P0 rejette presque toujours le marquage, avec une régularité très forte; – néanmoins, ce rejet a lieu dans toutes les positions – alors que dans les tableaux précédents, il n’y avait jamais de répulsion entre PPD et la position initiale, même non significative. Cela est cohérent avec le fait que l’attraction n’était pas particulièrement importante à l’initiale. Comme on pouvait s’y attendre, le fait de retirer les constituants initiaux de l’échantillon ne change rien aux attractions (figures 5.27 et 5.28). Les coordonnants, les 0,1,R2,pers,1 et les 0,1,C5,0,0 restent les seuls à être liés au marquage. b. Marquage final. Contrairement au marquage initial, le marquage final reste bien présent (table 5.34). Ce qu’il met en évidence est proche de ce qui a été dit plus haut. Les attractions (figure 5.29) montrent que: – c’est le critère positionnel qui demeure dominant: les constituants en position finale attirent le ponctogramme;
206
0 1
FAB
FRE
1861 523 2384
78.06 21.94 100
0 1
0
500
1000
1500
TAB . 5.34 – Tri à plat de PPF pour les constituants MI.¬pers-arg Attractions (seuil adapté 0.244%) 0,1,C5,0,1 0,1,R2,0,0 0,1,C5,0,0 0,1,A4,0,1 0,1,R2,pers,1 0,1,R3,0,1 0,0,C5,0,1 0,1,P0,0,0 0,0,R3,0,1
105/140 (75%) 114/164 (70%) 49/57 (86%) 28/48 (58%) 12/15 (80%) 13/20 (65%) 27/119 (23%) 53/237 (22%) 8/35 (23%) 2.09e−54
1
F IG . 5.29 – Attractions entre PPF et MM, au niveau ¬pers-arg Répulsions (seuil adapté 0.244%) 1,0,Rl,0,0 1,0,P0,0,0 0,0,P0,0,0 0,0,Co,0,0 1,0,R2,0,0 0,0,R2,0,0 0,0,Rl,0,0 1,0,R3,0,0 0,0,A4,0,0 0,0,R3,0,0 0,0,A4,0,1 0,0,C5,0,0
0/270 (0.0%) 6/282 (2.1%) 18/280 (6.4%) 6/152 (3.9%) 4/122 (3.3%) 26/189 (13.8%) 0/17 (0.0%) 0/14 (0.0%) 0/11 (0.0%) 0/11 (0.0%) 6/33 (18.2%) 16/76 (21.1%) 4.63e−20
1
F IG . 5.30 – Répulsions entre PPF et MM, au niveau ¬pers-arg
– le marquage est plus régulier que pour PPD. Les répulsions (figure 5.30) restent peu surprenantes: – aucun constituant final ne rejette PPF.1; – les fonctions P0, Co et Rl sont presque systématiquement PPF.0. Le marquage final a un comportement qui reste assez proche de ce qu’on a remarqué pour les autres types de propositions. L’observation combinée du marquage initial et du marquage final nous fait dire que les propositions non personnelles (prédicat au mode infinitif ou participe) ne sont pas délimitées de la même manière que les propositions dont le prédicat est à un mode personnel. D’un autre côté, il est à présent clair que le prédicat rejette fortement toute forme de marquage – nous verrons ci-dessous si cette tendance est confirmée dans le cadre de propositions de fonction immédiate. Les tests sur l’échantillon limité aux constituants non finaux laissent se démarquer une partie des mêmes constituants que ceux relevés aux niveaux MI.phrase et MI.persarg (figures 5.31 et 5.32). Nous pouvons observer que: – les circonstants propositionnels sont trop peu attestés pour être évalués, mais les autres 0,0,C5,0,1 et 0,0,C5,0,0 sont particulièrement marqués;
207
Attractions (seuil adapté 0.366%) 0,0,C5,0,1 0,0,C5,0,0 0,0,R2,0,0 0,0,R3,0,1 0,0,A4,0,1
27/119 (23%) 16/76 (21%) 26/189 (14%) 8/35 (23%) 6/33 (18%) 1.98e−10
1
F IG . 5.31 – Attractions significatives entre PPF et MM, au niveau ¬persarg (sans les constituants finaux) Répulsions (seuil adapté 0.366%) 1,0,Rl,0,0 1,0,P0,0,0 1,0,R2,0,0 0,0,Co,0,0 0,0,Rl,0,0 0,0,P0,0,0 1,0,R3,0,0 0,0,A4,0,0 0,0,R3,0,0
0/270 (0.0%) 6/282 (2.1%) 4/122 (3.3%) 6/152 (3.9%) 0/17 (0.0%) 18/280 (6.4%) 0/14 (0.0%) 0/11 (0.0%) 0/11 (0.0%) 6.31e−07
1
F IG . 5.32 – Répulsions significatives entre PPF et MM, au niveau ¬persarg (sans les constituants finaux)
0 1
FAB
FRE
27866 3430 31296
89.04 10.96 100
0 1
0
5000
10000
15000
20000
25000
TAB . 5.35 – Tri à plat de PPD pour les constituants MI.synt-arg
– les actants 0,0,R2,0,0 et 0,0,R3,0,1 sont à nouveau dans le groupe des attractions significatives; – les 0,0,A4,0,1 attirent également le marquage, mais de manière moins nette.
5.3.2.4
Arguments non propositionnels
Le modèle ne posant que deux fonctions en syntaxe immédiate, on s’attend à ce que les listes soient plus courtes. Il est également à prévoir que soient mises en évidence des tendances de nature différente par rapport à celles examinées dans des contextes propositionnels. a. Marquage initial. Le tri à plat est présenté dans la table 5.35. En conséquence du petit nombre de modalités à ce niveau d’intégration, il y a effectivement peu de variété dans l’attraction du marquage initial, ainsi que le montre la figure 5.33. Les faits les plus distinctifs au point de vue des attractions sont: – les constituants attirant PPD.1 ne sont généralement pas relatés; – de très nombreux constituants qui ne se trouvent pas à l’initiale semblent attirer le marquage; cela va à l’encontre de ce que nous avions remarqué au sujet de la position des signes et de leur capacité à délimiter les constituants (→5.2.3.1); – aucun type de constituant final n’attire le marquage; – les coordonnants sont à nouveau mis en évidence.
208
Attractions (seuil adapté 0.256%) 1,0,Ap,0,0 0,0,Co,0,0 1,0,Ap,¬pers,0 0,0,Dt,0,0 0,0,Ap,0,0 1,0,Ap,0,1 1,0,Rl,0,0 1,1,Ap,0,0
981/4953 (20%) 311/1217 (26%) 39/56 (70%) 27/113 (24%) 1120/9286 (12%) 6/24 (25%) 539/4690 (11%) 4/34 (12%) 2.15e−104
1
F IG . 5.33 – Attractions entre PPD et MM, au niveau synt-arg Répulsions (seuil adapté 0.256%) 0,1,Ap,0,0 0,1,Dt,0,1 0,1,Ap,¬pers,0 0,1,Ap,pers,1 0,1,Ap,0,1 0,0,Ap,¬pers,0 0,0,Dt,0,1 0,1,Dt,0,0 0,0,Ap,pers,1 0,0,Rl,0,0 0,1,Dt,¬pers,1 1,0,Dt,0,0
231/5568 (4.15%) 31/1900 (1.63%) 4/723 (0.55%) 74/1254 (5.90%) 0/149 (0.00%) 0/130 (0.00%) 39/632 (6.17%) 5/202 (2.48%) 5/120 (4.17%) 4/79 (5.06%) 5/88 (5.68%) 1/25 (4.00%) 8.2e−72
1
F IG . 5.34 – Répulsions entre PPD et MM, au niveau synt-arg Attractions (seuil adapté 0.366%) 0,0,Co,0,0 0,0,Ap,0,0 0,0,Dt,0,0
311/1217 (26%) 1120/9286 (12%) 27/113 (24%) 5.22e−103
1
F IG . 5.35 – Attractions significatives entre PPD et MM, au niveau syntarg (sans les constituants initiaux) Répulsions (seuil adapté 0.366%) 0,1,Ap,0,0 0,1,Dt,0,1 0,1,Ap,¬pers,0 0,1,Ap,0,1 0,1,Ap,pers,1 0,0,Ap,¬pers,0 0,1,Dt,0,0 0,0,Dt,0,1 0,0,Ap,pers,1 0,0,Rl,0,0 0,1,Dt,¬pers,1
231/5568 (4.15%) 31/1900 (1.63%) 4/723 (0.55%) 0/149 (0.00%) 74/1254 (5.90%) 0/130 (0.00%) 5/202 (2.48%) 39/632 (6.17%) 5/120 (4.17%) 4/79 (5.06%) 5/88 (5.68%) 1.27e−43
1
F IG . 5.36 – Répulsions significatives entre PPD et MM, au niveau syntarg (sans les constituants initiaux)
En ce qui concerne les répulsions (figure 5.34): – le rejet de PPD.1 est à nouveau très important, en particulier pour les constituants propositionnels (mode non personnel); – on observe en outre que les constituants en position finale sont particulièrement peu marqués. Comme on peut le remarquer dans le graphiques 5.35 et 5.36, aucun autre contraste ne ressort une fois que les constituants initiaux sont retirés de l’échantillon, ce qui
209
0 1
FAB
FRE
25749 5594 31343
82.15 17.85 100
0 1
0
5000
10000
15000
20000
25000
TAB . 5.36 – Tri à plat de PPF pour les constituants MI.synt-arg Attractions (seuil adapté 0.256%) 0,1,Ap,pers,1 0,1,Dt,0,1 0,1,Ap,0,0 0,1,Dt,0,0 0,0,Dt,0,1 0,1,Ap,0,1 0,1,Dt,¬pers,1 1,1,Ap,0,0 0,1,Ap,¬pers,0 0,0,Dt,0,0 0,0,Ap,pers,1
765/1252 (61%) 818/1832 (45%) 1717/5558 (31%) 100/201 (50%) 206/632 (33%) 69/146 (47%) 47/88 (53%) 24/34 (71%) 182/713 (26%) 42/113 (37%) 43/120 (36%) 1e−300
1
F IG . 5.37 – Attractions entre PPF et MM, au niveau synt-arg Répulsions (seuil adapté 0.256%) 1,0,Rl,0,0 1,0,Ap,0,0 0,0,Ap,0,0 0,0,Co,0,0 0,0,Rl,0,0 1,0,Ap,¬pers,0 0,0,Ap,¬pers,0 1,0,Dt,0,0 1,0,Ap,0,1
52/4797 (1.1%) 312/4987 (6.3%) 1151/9286 (12.4%) 28/1217 (2.3%) 1/79 (1.3%) 0/56 (0.0%) 13/130 (10.0%) 1/25 (4.0%) 1/24 (4.2%) 9e−238
1
F IG . 5.38 – Répulsions entre PPF et MM, au niveau synt-arg
confirme que les attractions les plus importantes doivent être cherchées ailleurs que dans la position des constituants. b. Marquage final. Les proportions de marquage sont figurent dans la table 5.36. Il y a plus de variété dans les constituants attirant le marquage final que le marquage initial (figure 5.37). Néanmoins, nous constatons que: – la plupart des constituants qui attirent le marquage et sont présents en quantité suffisante pour être évalués se trouvent en position finale (à l’exception des déterminants et des appositions propositionnelles non relatées); – les constituants relatés attirent le marquage indépendamment de leur position. Par rapport aux rejets (figure 5.38), – leur fréquence est très élevée et implique les Co et les Rl; – aucun constituant final ne rejette la ponctuation finale; – les fréquences absolues des constituants de fonction Ap non finaux acceptant le marquage sont suffisamment élevées pour qu’on s’interroge sur leur particularité, malgré une fréquence relative de rejet très importante; – les constituants propositionnels paraissent repousser le marquage dans la mesure où ils ne se trouvent pas directement à la finale du constituant qui les intègre. Comme les fréquences le laissaient prévoir, ce sont les 0,0,Ap,0,0 qui ressortent comme particulièrement marqués une fois les constituants finaux retirés de l’échan-
210
Attractions (seuil adapté 0.427%) 0,0,Dt,0,1 0,0,Ap,0,0 0,0,Dt,0,0 0,0,Ap,pers,1 0,0,Ap,¬pers,0
206/632 (33%) 1151/9286 (12%) 42/113 (37%) 43/120 (36%) 13/130 (10%) 3.37e−104
1
F IG . 5.39 – Attractions significatives entre PPF et MM, au niveau syntarg (sans les constituants finaux) Répulsions (seuil adapté 0.427%) 1,0,Rl,0,0 0,0,Co,0,0 1,0,Ap,0,0 0,0,Rl,0,0 1,0,Ap,¬pers,0 1,0,Dt,0,0 1,0,Ap,0,1
52/4797 (1.1%) 28/1217 (2.3%) 312/4987 (6.3%) 1/79 (1.3%) 0/56 (0.0%) 1/25 (4.0%) 1/24 (4.2%) 6.28e−99
1
F IG . 5.40 – Répulsions significatives entre PPF et MM, au niveau syntarg (sans les constituants finaux)
0 1
FAB
FRE
8018 374 8392
95.54 4.46 100
0 1
0
2000
4000
6000
8000
TAB . 5.37 – Tri à plat de PPD pour les constituants MI.pers
tillon (figures 5.39 et 5.40). Ce contraste est problématique, dans la mesure où le type d’apposition qui se démarque ainsi est particulièrement hétérogène.43 5.3.2.5
Propositions personnelles de fonction immédiate
Abordons à présent les constituants des structures de fonction immédiate, en commençant par les propositions personnelles. a. Marquage initial. La proportion de constituants marqués est faible (table 5.37). Les fréquences absolues sont donc souvent trop petites pour qu’on puisse les exploiter. Cependant, les attractions (figure 5.41) nous livrent des informations précieuses: – premièrement, la position initiale semble liée au marquage, comme c’était le cas au niveau argumental, mais de manière assez peu régulière (cf. pourcentages); 1,0,S1,0,0, qui représente toutes les propositions en qui, est significativement lié à une ponctuation initiale; les autres constituants initiaux (Rl, R2, A4, C5) ne sont pas liés significativement; – les relateurs coordonnants attirent très significativement PPD, de la même manière que nous l’avons remarqué dans la plupart des autres contextes; – par contre, les relateurs non coordonnants ne sont pas significativement liés à PPD.1, bien que le sens de l’écart soit celui d’une attraction; – les différents types de C5 attirent PPD, particulièrement à la finale. 43 Étant donné que le modèle assimile de nombreux types de constituants à des appositions
(→3.4.6.1). Nous reviendrons ultérieurement sur cette question (→6.2).
211
Attractions (seuil adapté 0.151%) 0,0,Co,0,0 0,0,Rl,0,0 0,0,R2,pers,1 0,1,C5,0,0 0,1,C5,¬pers,1 1,0,S1,0,0 1,0,C5,0,0 0,1,C5,0,1 0,0,C5,0,1 1,0,A4,0,0 1,0,R2,0,0 1,1,R2,¬pers,0 0,1,C5,pers,1 0,0,R3,0,1 0,1,R2,pers,1 0,0,C5,pers,1 0,1,S1,0,0 0,0,R2,¬pers,0 0,0,A4,0,1 1,0,Rl,0,0
95/476 (20.0%) 7/10 (70.0%) 4/10 (40.0%) 14/96 (14.6%) 4/12 (33.3%) 57/841 (6.8%) 11/97 (11.3%) 22/273 (8.1%) 21/267 (7.9%) 5/36 (13.9%) 18/256 (7.0%) 2/10 (20.0%) 2/13 (15.4%) 3/34 (8.8%) 2/23 (8.7%) 2/26 (7.7%) 1/17 (5.9%) 2/28 (7.1%) 5/107 (4.7%) 26/575 (4.5%) 4.72e−63
1
F IG . 5.41 – Attractions entre PPD et MM, au niveau pers Répulsions (seuil adapté 0.151%) 0,0,P0,0,0 0,1,P0,0,0 0,0,S1,0,0 0,0,R2,0,0 0,0,C5,0,0 0,1,R2,0,0 0,1,A4,0,1 0,0,R3,0,0 0,1,A4,0,0 0,1,R2,¬pers,0 0,0,A4,¬pers,1 0,0,A4,0,0 0,1,R3,0,1 1,0,R2,¬pers,0
12/1661 (0.72%) 3/764 (0.39%) 12/1074 (1.12%) 10/450 (2.22%) 9/404 (2.23%) 5/224 (2.23%) 6/246 (2.44%) 0/59 (0.00%) 0/46 (0.00%) 1/66 (1.52%) 0/20 (0.00%) 1/44 (2.27%) 1/43 (2.33%) 0/11 (0.00%) 3.12e−16
1
F IG . 5.42 – Répulsions entre PPD et MM, au niveau pers
0 1
FAB
FRE
7002 1385 8387
83.49 16.51 100
0 1
0
1000
2000
3000
4000
5000
6000
7000
TAB . 5.38 – Tri à plat de PPF pour les constituants MI.pers
Pour les répulsions (figure 5.42): – le prédicat rejette le marquage, de la même manière qu’en syntaxe argumentale; – les constituants simples manifestent une répulsion (significative ou non). Les scribes avaient peut-être tendance à «remonter» le niveau de ces C5; le signe qui les précède indiquerait dès lors la fin de la proposition subordonnée. Retirer les constituants initiaux de l’échantillon avant de tester les associations a pour conséquence principale d’augmenter la significativité des quatre types de constituants dépassant le seuil corrigé de Šidàk (figures 5.43 et 5.44). Les tendances restent donc plus ou moins stables. b. Marquage final. Le marquage final est, sans surprise, plus abondant (table 5.38). On met ainsi à jour les tendances de la figure 5.45. PPF.1 est principalement observé pour les constituants en finale. Dans les autres cas, seuls les constituants vérifiant
212
Attractions (seuil adapté 0.190%)
95/476 (20.0%) 7/10 (70.0%) 14/96 (14.6%) 4/10 (40.0%) 4/12 (33.3%) 22/273 (8.1%) 21/267 (7.9%) 2/13 (15.4%) 3/34 (8.8%) 2/23 (8.7%) 2/26 (7.7%) 2/28 (7.1%) 5/107 (4.7%) 1/17 (5.9%)
0,0,Co,0,0 0,0,Rl,0,0 0,1,C5,0,0 0,0,R2,pers,1 0,1,C5,¬pers,1 0,1,C5,0,1 0,0,C5,0,1 0,1,C5,pers,1 0,0,R3,0,1 0,1,R2,pers,1 0,0,C5,pers,1 0,0,R2,¬pers,0 0,0,A4,0,1 0,1,S1,0,0
1.78e−79
1
F IG . 5.43 – Attractions significatives entre PPD et MM, au niveau pers (sans les constituants initiaux)
Répulsions (seuil adapté 0.190%)
12/1661 (0.72%) 3/764 (0.39%) 12/1074 (1.12%) 10/450 (2.22%) 9/404 (2.23%) 0/59 (0.00%) 5/224 (2.23%) 6/246 (2.44%) 0/46 (0.00%) 1/66 (1.52%) 0/20 (0.00%) 1/44 (2.27%) 1/43 (2.33%)
0,0,P0,0,0 0,1,P0,0,0 0,0,S1,0,0 0,0,R2,0,0 0,0,C5,0,0 0,0,R3,0,0 0,1,R2,0,0 0,1,A4,0,1 0,1,A4,0,0 0,1,R2,¬pers,0 0,0,A4,¬pers,1 0,0,A4,0,0 0,1,R3,0,1
3.33e−14
1
F IG . 5.44 – Répulsions significatives entre PPD et MM, au niveau pers (sans les constituants initiaux)
Attractions (seuil adapté 0.151%)
438/764 (57%) 175/272 (64%) 78/94 (83%) 137/246 (56%) 125/222 (56%) 56/66 (85%) 17/23 (74%) 12/13 (92%) 17/26 (65%) 23/43 (53%) 13/17 (76%) 9/12 (75%) 8/10 (80%) 20/46 (43%) 67/267 (25%) 6/10 (60%) 23/107 (21%) 5/28 (18%) 6/34 (18%)
0,1,P0,0,0 0,1,C5,0,1 0,1,C5,0,0 0,1,A4,0,1 0,1,R2,0,0 0,1,R2,¬pers,0 0,1,R2,pers,1 0,1,C5,pers,1 0,0,C5,pers,1 0,1,R3,0,1 0,1,S1,0,0 0,1,C5,¬pers,1 0,0,R2,pers,1 0,1,A4,0,0 0,0,C5,0,1 1,1,R2,¬pers,0 0,0,A4,0,1 0,0,R2,¬pers,0 0,0,R3,0,1
3.48e−222
1
F IG . 5.45 – Attractions entre PPF et MM, au niveau pers
213
Répulsions (seuil adapté 0.151%) 0,0,P0,0,0 1,0,S1,0,0 0,0,S1,0,0 1,0,Rl,0,0 0,0,Co,0,0 0,0,C5,0,0 1,0,R2,0,0 0,0,R2,0,0 1,0,C5,0,0 0,0,R3,0,0 1,0,A4,0,0 0,0,A4,0,0 0,0,Rl,0,0 0,0,A4,¬pers,1 1,0,R2,¬pers,0
35/1661 (2.11%) 1/841 (0.12%) 30/1074 (2.79%) 0/575 (0.00%) 1/476 (0.21%) 13/404 (3.22%) 0/256 (0.00%) 36/450 (8.00%) 1/97 (1.03%) 0/59 (0.00%) 1/36 (2.78%) 3/44 (6.82%) 0/10 (0.00%) 2/20 (10.00%) 1/11 (9.09%) 1.7e−69
1
F IG . 5.46 – Répulsions entre PPF et MM, au niveau pers Attractions (seuil adapté 0.244%) 0,0,C5,0,1 0,0,C5,pers,1 0,0,R2,pers,1 0,0,A4,0,1 0,0,R2,0,0 0,0,R3,0,1 0,0,R2,¬pers,0 0,0,A4,¬pers,1 0,0,A4,0,0 1,0,R2,¬pers,0
67/267 (25.1%) 17/26 (65.4%) 8/10 (80.0%) 23/107 (21.5%) 36/450 (8.0%) 6/34 (17.6%) 5/28 (17.9%) 2/20 (10.0%) 3/44 (6.8%) 1/11 (9.1%) 1.89e−72
1
F IG . 5.47 – Attractions significatives entre PPF et MM, au niveau pers (sans les constituants finaux) Répulsions (seuil adapté 0.244%) 1,0,S1,0,0 1,0,Rl,0,0 0,0,P0,0,0 0,0,Co,0,0 1,0,R2,0,0 0,0,S1,0,0 0,0,R3,0,0 1,0,C5,0,0 0,0,C5,0,0 0,0,Rl,0,0 1,0,A4,0,0
1/841 (0.12%) 0/575 (0.00%) 35/1661 (2.11%) 1/476 (0.21%) 0/256 (0.00%) 30/1074 (2.79%) 0/59 (0.00%) 1/97 (1.03%) 13/404 (3.22%) 0/10 (0.00%) 1/36 (2.78%) 1.96e−09
1
F IG . 5.48 – Répulsions significatives entre PPF et MM, au niveau pers (sans les constituants finaux)
MF.C5 ou MN.pers sont marqués. Les répulsions (figure 5.46) sont quant à elles très fortes (elles atteignent 90% dans tous les cas) et elles ne concernent que les constituants simples. On peut se demander si les constituants initiaux qui ressortent ici (dont la fréquence de marquage avoisine les 0% et dont les fréquences absolues sont proche de 0) ne sont pas des relateurs (des constituants spécifiants) ayant une fonction argumentale (→3.4.6.4 a), du type: «celi ki ces iiii muis tenrat en hyretage» (Document 1271–12–09, 8).
Si nous retirons les constituants finaux de l’échantillon, nous obtenons les figures 5.47 et 5.48; nous voyons à nouveau se démarquer:
214
0 1
FAB
FRE
2997 55 3052
98.2 1.8 100
0 1
0
500
1000
1500
2000
2500
TAB . 5.39 – Tri à plat de PPD pour les constituants MI.¬pers Attractions (seuil adapté 0.341%) 0,0,Co,0,0 0,0,R2,0,0 0,1,C5,0,0 1,0,Rl,0,0 0,0,C5,0,1 0,1,C5,0,1 1,0,P0,0,0 0,0,C5,0,0 0,0,Rl,0,0
11/30 (36.7%) 5/26 (19.2%) 3/14 (21.4%) 8/105 (7.6%) 4/52 (7.7%) 4/63 (6.3%) 3/40 (7.5%) 1/14 (7.1%) 1/18 (5.6%) 6.14e−43
1
F IG . 5.49 – Attractions entre PPD et MM, au niveau ¬pers Répulsions (seuil adapté 0.341%) 0,1,P0,0,0 1,0,C5,0,0 1,0,R3,0,0 0,1,A4,0,1 0,0,P0,0,0 1,0,R2,0,0
3/1296 (0.23%) 7/1210 (0.58%) 0/10 (0.00%) 0/14 (0.00%) 1/77 (1.30%) 0/31 (0.00%) 4.61e−08
1
F IG . 5.50 – Répulsions entre PPD et MM, au niveau ¬pers
0 1
FAB
FRE
2594 450 3044
85.22 14.78 100
0 1
0
500
1000
1500
2000
2500
TAB . 5.40 – Tri à plat de PPF pour les constituants MI.¬pers
– de nombreux types de circonstants; – ainsi que les relateurs 0,0,Rl,0,0; – et les actants 0,0,R2,pers,0, 0,0,R3,0,1 et 0,0,A4,0,0.
5.3.2.6
Propositions non personnelles de fonction immédiate
a. Marquage initial. La ponctuation initiale est presque inexistante (table 5.39). Les effectifs, très faibles, laissent paraître quelques tendances, mais on aurait de la peine à les exploiter en les considérant seules. Remarquons tout de même (figure 5.49) que les relateurs attirent le marquage initial et qu’au point de vue des répulsions (figure 5.50), les C5 initiaux rejettent le marquage. b. Marquage final. La ponctuation finale est plus fréquente que la ponctuation initiale (table 5.40). On doit cependant s’attendre à ce que les attractions ne concernent pratiquement que les constituants qui se trouvent à la finale de la structure étudiée, ce qui est effectivement le cas (figure 5.51). Malgré le peu de matériaux disponibles,
215
Attractions (seuil adapté 0.341%) 0,1,P0,0,0 0,1,C5,0,1 0,1,C5,0,0 0,1,A4,0,1 0,0,C5,0,1
345/1288 (27%) 42/63 (67%) 12/14 (86%) 7/14 (50%) 15/52 (29%) 4.11e−57
1
F IG . 5.51 – Attractions entre PPF et MM, au niveau ¬pers Répulsions (seuil adapté 0.341%) 1,0,C5,0,0 1,0,Rl,0,0 1,0,P0,0,0 1,0,R2,0,0 0,0,P0,0,0 0,0,Rl,0,0 0,0,Co,0,0 1,0,R3,0,0 0,0,R2,0,0 0,0,C5,0,0
5/1210 (0.41%) 0/105 (0.00%) 0/40 (0.00%) 0/31 (0.00%) 5/77 (6.49%) 0/18 (0.00%) 2/30 (6.67%) 0/10 (0.00%) 2/26 (7.69%) 2/14 (14.29%) 3.72e−73
1
F IG . 5.52 – Répulsions entre PPF et MM, au niveau ¬pers Attractions (seuil adapté 0.465%) 0,0,C5,0,1 0,0,P0,0,0 0,0,C5,0,0 0,0,R2,0,0 0,0,Co,0,0
15/52 (28.8%) 5/77 (6.5%) 2/14 (14.3%) 2/26 (7.7%) 2/30 (6.7%) 4.57e−39
1
F IG . 5.53 – Attractions significatives entre PPF et MM, au niveau ¬pers (sans les constituants finaux) Répulsions (seuil adapté 0.465%) 1,0,C5,0,0 1,0,Rl,0,0 1,0,R3,0,0 1,0,P0,0,0 1,0,R2,0,0 0,0,Rl,0,0
5/1210 (0.41%) 0/105 (0.00%) 0/10 (0.00%) 0/40 (0.00%) 0/31 (0.00%) 0/18 (0.00%) 4.05e−15
1
F IG . 5.54 – Répulsions significatives entre PPF et MM, au niveau ¬pers (sans les constituants finaux)
soulignons néanmoins que les C5 sont particulièrement marqués et que les relateurs rejettent à nouveau le ponctogramme (cela est encore plus visible dans la figure 5.53).
5.3.2.7
Constituants non propositionnels de fonction immédiate
Ce type d’intégration syntaxique est très difficile à traiter. Alors que les propositions sont formées à partir du prédicat et de ses arguments et que les arguments sont à leur tour construits sur la base de propositions ou de syntagmes, les constituants non propositionnels sont très souvents constitués d’autres structures de même nature, imbriquées récursivement. Par exemple,
216
0 1
FAB
FRE
26886 1690 28576
94.09 5.91 100
0 1
0
5000
10000
15000
20000
25000
TAB . 5.41 – Tri à plat de PPD pour les constituants MI.synt Attractions (seuil adapté 0.285%) 1,0,Ap,0,0 0,0,Co,0,0 0,1,Ap,pers,1 1,0,Dt,0,1 0,1,Dt,¬pers,1 0,0,Ap,pers,1
1026/6426 (16.0%) 91/393 (23.2%) 38/423 (9.0%) 4/38 (10.5%) 1/10 (10.0%) 3/44 (6.8%) 1e−300
1
F IG . 5.55 – Attractions entre PPD et MM, au niveau synt Répulsions (seuil adapté 0.285%) 0,1,Ap,0,0 1,0,Rl,0,0 0,1,Dt,0,1 0,1,Dt,0,0 0,1,Ap,¬pers,0 0,0,Dt,0,1 0,0,Ap,¬pers,0 1,0,Dt,0,0 0,0,Rl,0,0 0,0,Dt,0,0 0,1,Ap,0,1 0,0,Ap,0,0
104/8004 (1.30%) 133/5261 (2.53%) 23/2158 (1.07%) 5/597 (0.84%) 6/559 (1.07%) 6/222 (2.70%) 1/89 (1.12%) 0/32 (0.00%) 2/76 (2.63%) 3/89 (3.37%) 0/11 (0.00%) 242/4116 (5.88%) 2.75e−94
1
F IG . 5.56 – Répulsions entre PPD et MM, au niveau synt «· la nos requíſent lı deuant dıſ fre [7]res ke nos lour feıſſíemes don et veſture delle lour part de demı boníer de [8] terre eríle kí aluz eſt et kı lour aſtoıt eſkeut de par pere et de par mere · eas [9] et damoıſelle heluít lour ſerour · et kı gıeſt enſ el terrour de hekes» (Document 1277–05–04, 6).
Par ailleurs, la taille des constituants non propositionnels est généralement réduite par rapport à celle des structures argumentales. La simple lecture des documents laisse voir qu’un grand nombre de syntagmes sont composés de seulement deux mots, ce qui a pour conséquence que le premier est forcément initial et que le deuxième est nécessairement final. a. Marquage initial. Le tri à plat (table 5.41) montre que le nombre de constituants marqués reste très élevé, en particulier si on le considère de manière absolue pour l’ensemble et le tableau.44 Selon la figure 5.55, il y a un détachement très net de Co et de Ap initiaux du côté des attractions, alors que les répulsions présentes à ce niveau (figure 5.56) se résument ainsi: – les constituants finaux rejettent le marquage; – les relateurs font de même. Il n’y a pas, comme c’était le cas dans un contexte argumental, une grande quantité
44 Voir les annexes.
217
0 1
FAB
FRE
23611 4855 28466
82.94 17.06 100
0 1
0
5000
10000
15000
20000
TAB . 5.42 – Tri à plat de PPF pour les constituants MI.synt Attractions (seuil adapté 0.285%) 0,1,Ap,0,0 0,1,Dt,0,1 0,1,Ap,pers,1 0,1,Dt,0,0 0,1,Ap,¬pers,0 0,1,Dt,¬pers,1 0,0,Ap,pers,1 0,1,Ap,0,1
2711/7914 (34%) 912/2150 (42%) 292/423 (69%) 214/579 (37%) 192/559 (34%) 7/10 (70%) 18/44 (41%) 6/11 (55%) 1e−300
1
F IG . 5.57 – Attractions entre PPF et MM, au niveau synt Répulsions (seuil adapté 0.285%) 1,0,Ap,0,0 1,0,Rl,0,0 0,0,Ap,0,0 0,0,Co,0,0 0,0,Dt,0,1 0,0,Rl,0,0 0,0,Dt,0,0 0,0,Ap,¬pers,0 1,0,Dt,0,0 1,0,Dt,0,1
172/6431 (2.67%) 47/5262 (0.89%) 234/4116 (5.69%) 3/393 (0.76%) 18/222 (8.11%) 2/76 (2.63%) 5/89 (5.62%) 6/89 (6.74%) 0/32 (0.00%) 5/38 (13.16%) 8.13e−266
1
F IG . 5.58 – Répulsions entre PPF et MM, au niveau synt
de constituants non initiaux qui attirent le marquage. Concrètement, les syntagmes ne sont donc généralement pas «interrompus» par la ponctuation. b. Marquage final. La quantité de marquage final est à nouveau bien supérieure à la quantité de marquage initial (table 5.42). Selon la figure 5.57, les seules constructions qui attirent le marquage sans se trouver à la finale sont les propositions personnelles relatées. Par ailleurs, le rejet (figure figure 5.58) semble caractériser tous les constituants ne se trouvant pas à la finale. On ne peut cependant parler de «règle» car un nombre non négligeable (fréquence absolue) d’Ap non finaux acceptent PPF.1. Ces répulsions impliquent à nouveau que les syntagmes ne sont habituellement pas «rompus» par la présence d’un ponctogramme. 5.3.3
Synthèse
En guise de synthèse, nous comparons la régularité du marquage initial à la régularité du marquage final (→5.3.3.1). Nous mettons ensuite en relation les observations des différents tris croisés. Pour ce faire, nous construisons deux tableaux synoptiques (→5.3.3.2). Leur description mène à la définition de points forts et de questions concernant les tendances générales dégagées (→5.3.3.3).
218
5.3.3.1
Régularités
Comme le montraient déjà les tris à plat (→5.1.3), la ponctuation est un phénomène rare par rapport à la non-ponctuation. On pouvait donc s’attendre à ce que la présence d’une marque dans un contexte qui l’attire soit tout simplement moins régulière que son absence dans un contexte qui la repousse. Les tris croisés ne s’opposent pas à cette conclusion et un rapide test permet de s’en assurer. Reprenons toutes les spécificités positives et regroupons dans un premier échantillon (désigné du nom attraction) tous les pourcentages enregistrés pour les constituants attirant significativement le marquage dans les tableaux ci-dessus. Faisons ensuite de même avec les répulsions, non pas en considérant le pourcentage de marquage, mais la différence de 100 diminué de ce dernier (échantillon nommé répulsion). Nous obtenons deux distributions dont la différence des médianes peut être évaluée à l’aide d’un test nommé test de Wilcoxon.45 Nous avons reporté les résultats du test, ainsi qu’une représentation des deux échantillons, dans les graphiques de la figure 5.59. Les encoches figurant de part et d’autre de la médiane dans le troisième graphique sont un moyen graphique de mettre en évidence la différence entre les médianes des deux échantillons: de manière générale, si les encoches de deux boîtes ne figurent pas en vis-à-vis, cela signifie que les médianes sont significativement différentes.46 Le graphique est très clair. Les courbes montrent que la distribution de la régularité de marquage est bimodale, ce qui est généralement l’indice que l’échantillon observé est le résultat d’un mélange entre deux échantillons différents. Il devrait être possible de regrouper les constituants (par position, par fonction, etc.) de manière à mettre en évidence ces deux groupes, mais aucun des découpages que nous avons pu effectuer n’a abouti à une séparation nette. Il ressort de la différence entre les fréquences d’attraction et les fréquences de répulsion que la présence de ponctuation autour d’un constituant d’un type qui la repousse est nettement plus prégnante que son absence dans un environnement l’attirant. Extrapolons ainsi: si un ponctogramme apparaît alors qu’il ne le devrait pas suivant les tendances décelées dans ce chapitre, il est plausible que les causes de son occurrence doivent être recherchées ailleurs, c’est-à-dire soit dans le contexte immédiat, soit à un niveau d’analyse qui ne soit pas exclusivement morphosyntaxique. 5.3.3.2
Tableaux synoptiques
a. Visualisation simultanée des tris croisés. Les vingt-huit graphiques de tendances et les commentaires que nous en avons fait ci-dessus ont chacun leur intérêt propre, sans toutefois présenter une vue d’ensemble de la situation. Pour construire une telle 45 Les distributions ne sont pas normales (→4.1.2) et requièrent un test non paramétrique, indé-
pendant de la forme de la distribution (Howell 1998, ch. 18). Les tests non paramétriques ont l’avantage de ne pas nécessiter que les données soient distribuées d’une manière particulière pour être applicables (la plupart des tests paramétriques supposent la normalité des distributions). Ils ont cependant l’inconvénient de manquer de puissance, c’est-à-dire d’augmenter les chances de commettre l’erreur β (voir page 157). Le test est effectué par la fonction R wilcox.test(). 46 Voir l’aide de R, ?boxplot.
219
Attraction
18 16 14 12 10 8 6 4 2 0
0.030
Densité
0.025 0.020 0.015 0.010 0.005 0.000 0
20
40
60
80
Répulsion
18 16 14 12 10 8 6 4 2 0
0.4
Densité
0.3 0.2 0.1 0.0 92
94
96
98
Test de Wilcoxon: p = 8.7e−17
100 80 60 40 20
Attraction
Répulsion
F IG . 5.59 – Proportions de marquage
220
100
vue, il faut combiner les résultats des différents graphiques. On obtient ainsi deux tableaux synthétiques: un pour le marquage par un ponctogramme à l’initiale et un pour le marquage par un ponctogramme à la finale. Les tableaux ne donnent certes pas d’informations qui ne soient déjà apportées par l’analyse détaillée, mais ils en présentent une sélection de manière simultanée, de façon à faire apparaître les ressemblances et les différences. Pour chaque combinaison positionnelle et morphosyntaxique (verticalement) et chaque type de structure intégrante (horizontalement), le tableau indique si le type de marquage concerné est attiré significativement (indiqué par un carré noir), significativement si l’ajustement de Šidàk est négligé (triangle noir) et non significativement (petit disque noir). Les symboles blancs représentent les répulsions et correspondent au même classement (carré, triangle, disque). Dans les cas où le nombre d’attestations d’une structure n’atteint pas 10 ou est absent à un niveau d’intégration particulier, la case est laissée vide. Pour PPD, le tableau obtenu sur la base des principes exposés est donc reporté dans la figure 5.60. Le tableau correspondant au marquage final est donné dans la figure 5.61. Ces deux résumés ont été conçus de manière à mettre en évidence les ressemblances et les différences entre les constituants de même MI (verticalement) et entre les MI où se rencontre un même type de constituant (horizontalement). Nous avons commencé par séparer les tendances observées en syntaxe argumentale (à gauche) de celles observées en syntaxe immédiate (à droite), étant donné que peu de modalités de MM se retrouvent dans les deux types d’intégration. Pour rendre les deux sous-tableaux plus lisibles, nous avons permuté les lignes et les colonnes de manière à regrouper les tendances significatives en deux groupes, les plus denses qu’il a été possible. Ces tableaux, couplés aux analyses faites dans la section →5.2.2, synthétisent notre exploration en une série de points forts et de questions qui nous serviront de guides par la suite. b. Nécessité d’écarter les constituants aux bornes de la structure qui les contient. Étant donné la récursivité et l’attraction du marquage aux bornes, chercher dans ce qui n’est pas aux bornes paraît plus raisonnable. La plupart du temps, dans le cas des structures propositionnelles, la ponctuation a tendance à être attestée au début ou à la fin des constituants englobants. La fréquence de ce marquage est parfois,47 suffisamment forte pour occulter la présence d’autres tendances plus subtiles. L’examen des tris croisés débarrassés des positions extrêmes (initiales pour PPD et finales pour PPF) a ainsi montré que certains types de constituants attiraient le marquage plus clairement qu’on ne l’aurait pensé. Il est donc utile de construire de nouveaux tableaux synoptiques, fondés cette fois sur les tests effectués à partir des échantillons modifiés. Le tableau 5.62 synthétise les tendances de ponctuation initiale, alors que le tableau 5.63 synthétise les tendances de ponctuation finale. Du fait de leur dépendance par rapport aux constructions de niveau d’intégration syntaxique supérieur, les constituants dont la modalité de MI vaut synt ou synt-arg ne pourraient être traités de la même manière. Nous verrons ci-dessous (→5.3.3.3 e) les options que nous avons choisies quant au traitement de ces unités.
47 Voir →6.1.1 où les fréquences dépassent les 80%.
221
1,0,Dt,0,1
0,0,Co,0,0 0,1,C5,0,0 1,0,Rl,0,0 1,0,C6,0,0 0,0,Rl,0,0 1,0,S1,0,0 1,0,A4,0,0 0,0,C5,pers,0 1,0,A4,¬pers,1 0,1,C5,¬pers,1 1,0,R3,0,1 1,0,R2,0,0 1,0,C5,pers,1 1,0,C5,0,1 1,0,A4,0,1 0,0,R2,pers,1 0,0,R2,0,0 0,1,C5,0,1 1,0,P0,0,0 1,0,C5,0,0 0,1,R2,pers,1 0,1,C5,pers,1 1,1,R2,¬pers,0 0,1,S1,pers,1 1,0,R2,¬pers,0 0,1,A4,pers,1 0,0,C5,¬pers,1 1,0,R3,0,0 0,1,S1,0,0 0,1,A4,¬pers,1 0,1,R3,0,1 0,1,A4,0,0 0,1,R2,0,0 0,0,R3,0,0 0,0,A4,0,0 0,0,C5,0,1 0,0,C6,0,0 0,0,C5,pers,1 0,0,R3,0,1 0,1,R2,¬pers,0 0,0,S1,0,0 0,0,A4,¬pers,1 0,0,R2,¬pers,0 0,0,C5,0,0 0,1,A4,0,1 0,0,A4,0,1 0,0,P0,0,0 0,1,P0,0,0
1,0,Ap,¬pers,0 1,0,Ap,0,0 0,0,Dt,0,0 0,0,Ap,0,0 0,0,Co,0,0 1,1,Ap,0,0 1,0,Ap,0,1 1,0,Rl,0,0 1,0,Dt,0,0 0,1,Dt,¬pers,1 0,0,Rl,0,0 0,0,Ap,pers,1 0,1,Dt,0,1 0,1,Dt,0,0 0,1,Ap,pers,1 0,1,Ap,¬pers,0 0,1,Ap,0,1 0,1,Ap,0,0 0,0,Dt,0,1 0,0,Ap,¬pers,0
synt−arg
Attraction significative Attraction significative (si non ajustée) Attraction non significative (seuil 5%) Répulsion significative Répulsion significative (si non ajustée) Répulsion non significative (seuil 5%)
phrase
pers ¬pers−arg ¬pers pers−arg
F IG . 5.60 – Tableau synoptique des tendances générales, PPD
222
synt
1,0,Dt,0,1
0,1,C5,0,1 0,1,C5,0,0 0,1,A4,0,1 0,1,P0,0,0 0,1,R3,0,1 0,1,R2,pers,1 0,1,R2,0,0 0,1,S1,0,0 0,1,R2,¬pers,0 0,0,C5,pers,1 0,0,C5,0,1 0,1,A4,0,0 0,1,C5,pers,1 0,1,C5,¬pers,1 0,0,C5,pers,0 0,0,R2,pers,1 0,0,R3,0,1 1,0,R3,0,1 0,1,S1,pers,1 0,1,A4,pers,1 0,1,A4,¬pers,1 1,1,R2,¬pers,0 0,0,R2,¬pers,0 1,0,C5,pers,1 0,0,C5,¬pers,1 1,0,R2,¬pers,0 1,0,C5,0,1 1,0,R3,0,0 1,0,A4,¬pers,1 1,0,A4,0,1 1,0,A4,0,0 0,0,A4,¬pers,1 0,0,Rl,0,0 0,0,A4,0,0 0,0,R3,0,0 0,0,C6,0,0 1,0,C6,0,0 0,0,A4,0,1 0,0,R2,0,0 1,0,P0,0,0 1,0,S1,0,0 1,0,C5,0,0 0,0,C5,0,0 0,0,S1,0,0 1,0,R2,0,0 1,0,Rl,0,0 0,0,P0,0,0 0,0,Co,0,0
0,1,Dt,¬pers,1 0,1,Dt,0,1 0,1,Dt,0,0 0,1,Ap,pers,1 0,1,Ap,¬pers,0 0,1,Ap,0,1 0,1,Ap,0,0 0,0,Dt,0,1 0,0,Ap,pers,1 1,1,Ap,0,0 0,0,Dt,0,0 1,0,Dt,0,0 1,0,Ap,0,1 0,0,Ap,¬pers,0 1,0,Ap,¬pers,0 1,0,Ap,0,0 0,0,Ap,0,0 1,0,Rl,0,0 0,0,Rl,0,0 0,0,Co,0,0
synt−arg
synt
Attraction significative Attraction significative (si non ajustée) Attraction non significative (seuil 5%) Répulsion significative Répulsion significative (si non ajustée) Répulsion non significative (seuil 5%)
phrase
pers
pers−arg¬pers−arg ¬pers
F IG . 5.61 – Tableau synoptique des tendances générales, PPF
223
0,0,Co,0,0 0,1,C5,0,0 0,1,C5,0,1 0,0,Rl,0,0 0,0,R2,0,0 0,0,C5,pers,0 0,1,R2,pers,1 0,1,C5,¬pers,1 0,0,R2,pers,1 0,1,R2,0,0 0,1,C5,pers,1 0,1,S1,pers,1 0,1,A4,pers,1 0,0,C5,¬pers,1 0,1,R3,0,1 0,0,R3,0,1 0,1,S1,0,0 0,1,A4,¬pers,1 0,0,S1,0,0 0,1,A4,0,0 0,0,R3,0,0 0,0,R2,¬pers,0 0,0,C6,0,0 0,0,C5,pers,1 0,0,A4,¬pers,1 0,0,A4,0,0 0,1,A4,0,1 0,0,C5,0,1 0,1,R2,¬pers,0 0,0,C5,0,0 0,0,A4,0,1 0,1,P0,0,0 0,0,P0,0,0
Attraction significative Attraction significative (si non ajustée) Attraction non significative (seuil 5%) Répulsion significative Répulsion significative (si non ajustée) Répulsion non significative (seuil 5%)
phrase
pers ¬pers−argpers−arg ¬pers
F IG . 5.62 – Tableau synoptique des tendances générales, PPD (sans les constituants initiaux)
5.3.3.3
Points forts et questions
Nous sommes à présent en mesure de visualiser clairement quels liens entre les constructions et la ponctuation sont les plus intéressants. Les quatre tableaux synoptiques mettent en relief des ressemblances et des différences entre les lignes et les colonnes. Les points forts de ces synthèses nous permettent de poser les questions qui nous guideront dans la suite de notre recherche. a. Critère positionnel et marquage de la phrase. Ce que les deux premiers tableaux synoptiques montrent,48 c’est que les constituants finaux attirent globalement la ponctuation finale, alors que les constituants initiaux attirent plutôt la ponctuation initiale. Pour ce qui concerne le marquage initial, remarquons tout d’abord qu’à l’excep48 Voir les figures 5.60 et 5.61.
224
0,0,C5,0,1 0,0,R2,0,0 0,0,C5,pers,1 0,0,R3,0,1 0,0,C5,0,0 0,0,R2,pers,1 0,0,C5,pers,0 0,0,A4,0,1 1,0,R3,0,1 0,0,S1,0,0 0,0,R2,¬pers,0 1,0,C5,pers,1 0,0,C5,¬pers,1 1,0,R2,¬pers,0 1,0,C5,0,1 0,0,A4,¬pers,1 1,0,A4,0,0 1,0,R3,0,0 1,0,A4,¬pers,1 0,0,A4,0,0 0,0,Rl,0,0 0,0,R3,0,0 1,0,A4,0,1 1,0,R2,0,0 0,0,C6,0,0 1,0,C6,0,0 1,0,C5,0,0
Attraction significative Attraction significative (si non ajustée) Attraction non significative (seuil 5%) Répulsion significative Répulsion significative (si non ajustée) Répulsion non significative (seuil 5%)
1,0,P0,0,0 1,0,S1,0,0 0,0,P0,0,0 0,0,Co,0,0 1,0,Rl,0,0
phrase
pers
pers−arg¬pers−arg ¬pers
F IG . 5.63 – Tableau synoptique des tendances générales, PPF (sans les constituants finaux)
tion des constituants immédiats des propositions dont le prédicat n’est pas un verbe conjugué à un mode personnel, les attractions semblent concentrées en position initiale (modalité de MM commençant par 1,0) et les répulsions sont particulièrement présentes à la finale (0,1). À la finale, aux bornes des structures intégrantes, la relation entre les positions des constituants et leur ponctuation finale est encore plus systématique qu’elle ne l’était pour le marquage initial. Il n’y a pratiquement pas d’exception qui soit statistiquement significative: s’ils sont initiaux, les constituants repoussent généralement significativement la ponctuation; s’ils sont finaux, ils l’attirent. Néanmoins, pour les propositions personnelles qui n’ont pas le statut d’énoncé, la proportion de résultats non significatifs est assez importante pour qu’on se pose la question de savoir si le lien entre les positions extrêmes et la tendance au marquage
225
est spécifique de la phrase. Si l’on observe les propositions non personnelles, il serait peu raisonnable de conclure qu’il existe une tendance à marquer leur premier constituant et à ne pas marquer le dernier. Au contraire, ces propositions ne se caractérisent quasiment que par des phénomènes particuliers, comme le rejet de PPD par P0 et l’attraction par C5 (→d). L’analyse effectuée jusqu’à présent ne donne pas de réponse à la question du marquage de la phrase, puisque les dépouillements des différents types de structures ont été faits de manière indépendante. Il est donc nécessaire d’effectuer une étude ciblée à ce sujet. b. Prédicat. Le rejet du marquage par le prédicat dans toute position autre que l’initiale (en particulier au début de la phrase, qui est le seul contexte où le marquage est effectivement attiré) semble être commun à toutes les sortes de propositions. Il faudra également se demander quelles conditions font que le prédicat initial d’une proposition non personnelle en syntaxe immédiate attire le marquage. La situation est encore plus univoque pour le marquage final, qui est toujours repoussé, à moins que le prédicat achève la structure à laquelle il est intégré. Face à un rejet d’une telle systématicité, comment expliquer que certains prédicats soient tout de même marqués? c. Actants. Si l’on ignore les tendances positionnelles, qui sont les plus fortes, on peut élablir une liste précise, reprenant les actants au marquage atypique. Une fois les constituants initiaux retirés de l’échantillon, les attractions particulièrement fortes vis-à-vis de PPD.1 concernent:49 – – – – – –
0,0,S1,0,0: phrase 0,1,S1,pers,1: phrase 0,0,R2,0,0: phrase, ¬pers 0,1,R2,0,0: phrase 0,0,R2,pers,1: pers 0,1,R2,pers,1: ¬pers-arg
Quant à la ponctuation finale, les actants l’attirant sont: – – – – – – –
0,0,S1,0,0: phrase 0,0,R2,0,0: phrase, pers-arg, ¬pers-arg, pers 0,0,R2,pers,1: phrase, pers 0,0,R2,¬pers,0: phrase, pers 0,0,R3,0,1: phrase, pers-arg, ¬pers-arg, pers 1,0,R3,0,1: phrase 0,0,A4,0,1: pers-arg, ¬pers-arg, pers
Il est nécessaire d’étudier indépendamment chacun de ces types d’actants. d. Marginalité des C5. À côté des quelques actants particulièrement marqués, les circonstants le sont encore plus fortement. On constate d’ailleurs que les attractions sont en général clairement significatives. Le phénomène le plus prégnant dans le tableau du marquage initial est le comportement des incidentes (0,0,C5,pers,0), qui attirent généralement la ponctuation initiale, en particulier au niveau de la phrase et de la proposition personnelle. Cette position étonnante des incidentes n’est pas le seul phénomène digne d’intérêt. Tout d’abord, le marquage initial des différents C5 en position finale se différencie 49 Chaque type de constituant est suivi de son ou ses niveau(x) d’intégration syntaxique.
226
de celui des autres constituants. Cela est particulièrement le cas au niveau de la phrase, où l’on observe, sans même retirer les constituants aux bornes, que les tendances de marquage sont non significatives, alors que le rejet est très net pour les autres constituants. De manière générale, à part au niveau de la phrase (où le contraste principal est d’ordre positionnel), les tendances qui caractérisent C5, lorsqu’elles sont présentes, vont dans le sens du marquage (ou d’une tendance non significative) et non du rejet. Le marquage final des C5 ne se trouvant pas à une des bornes du constituant qui les intègre est également particulièrement présent, mais il concerne alors essentiellement les constituants complexes, c’est-à-dire vérifiant MR.1 ou une autre nature que MN.0. Les attractions vis-à-vis de la ponctuation initiale (une fois les constituants initiaux retirés) sont: – – – – – –
0,0,C5,0,1: pers, ¬pers 0,0,C5,pers,0: phrase, pers-arg 0,1,C5,0,0: phrase, ¬pers-arg, pers, ¬pers 0,1,C5,0,1: phrase, pers-arg, pers 0,1,C5,¬pers,1: phrase, pers 0,1,C5,pers,1: phrase
Les attractions concernant PPF.1 sont: – – – – – –
0,0,C5,0,0: phrase, ¬pers-arg, ¬pers 0,0,C5,0,1: phrase, pers-arg, ¬pers-arg, pers, ¬pers 0,0,C5,pers,0: phrase, pers-arg 0,0,C5,¬pers,1: phrase 0,0,C5,pers,1: phrase, pers-arg, pers 1,0,C5,pers,1: phrase
Chacun de ces types de circonstant devra être étudié indépendamment. e. Appositions et déterminants. Au niveau d’intégration immédiat, le raffinement des données est assez faible et nous a déjà posé problème à plusieurs reprises. Nous avons des difficultés à appréhender la tendance au marquage des constituants Ap et Dt qui ne se trouvent pas aux bornes du constituant les intégrant. On se doute déjà que la prise en considération exclusive des variables choisies jusqu’à présent ne suffira pas à aborder ce problème, qui dépasse le modèle morphosyntaxique tel que nous l’avons conçu. Par ailleurs, il est probable que les phénomènes de marquage observés au niveau de la syntaxe immédiate sont liés à des tendances touchant directement des structures situées plus haut dans la hiérarchie syntaxique ou plus généralement répandues. Il nous semble que le marquage des constituants MI.synt-arg et MI.synt ne pourra être appréhendé qu’une fois achevée l’étude de la ponctuation au niveau actanciel. f. C6 et relateurs (dont coordonnants). Les coordonnants et les autres relateurs occupent une position morphosyntaxiquement déterminée dans le syntagme – les relateurs simples sont presque systématiquement à l’initiale et les coordonnants ne sont que très rarement à l’une des extrémités. Le comportement de PPD reste très cohérent d’une colonne à l’autre du tableau. Les coordonnants attirent le marquage initial dans tous les cas. Quant aux relateurs initiaux (non coordonnants), ils attirent le marquage quand ils sont constituants immédiats soit de propositions personnelles à fonction argumentale, soit de propositions
227
non personnelles. Les relateurs des constituants non propositionnels rejettent le marquage en contexte immédiat (ou bien l’opposition n’est pas significative). Cela remet en question les tendances que les tris croisés mettaient en évidence: il semblerait que le type de constituant intégrant ait une influence sur la ponctuation des relateurs. Pour PPF, les tendances sont globalement contraires à celles décelées pour PPD: coordonnants et relateurs repoussent significativement la ponctuation finale quelles que soient la nature et la fonction du constituant qui les contient directement – mis à part pour le coordonnant dans les propositions non personnelles en contexte immédiat, pour lequel la tendance n’est pas claire. À ces observations, il faut ajouter que les constituants initiaux des «relatives», de nature non propositionnelle non relatés intégrés à une proposition personnelle ne jouant pas le rôle d’argument se comportent comme des relateurs par rapport à la ponctuation finale et la repoussent. g. Coordination. Par ailleurs, la question des coordonnants ouvre celle de la coordination, que les dépouillements ont jusqu’à présent totalement négligée. Le coordonnant n’étant qu’une spécification supplémentaire (→3.4.7.2), il y a lieu de se demander comment fonctionne le marquage entre les membres qu’il ne sert pas à relier. h. Interférences. Pour toutes les tendances décelées, figurent en trame de fond deux questions importantes auxquelles les tris croisés ne donnent pas de réponse. Premièrement, le lien n’est-il pas spécifique à un ou plusieurs documents? Dans la mesure où nous avons considéré les documents comme indistincts, il peut nous avoir échappé que certaines attractions ou répulsions mises en évidence dans ce chapitre soient spécifiques à un petit ensemble de documents contenant de nombreuses attestations. Deuxièmement, la ponctuation n’est-elle pas liée à un environnement morphosyntaxique particulier, plutôt qu’à la structure à laquelle elle paraît liée? Par exemple, ne peut-on pas dire que les incidentes attirent le marquage initial, en raison du constituant qui les précède et non à cause de leur nature propre?
228
6
Fréquences de marquage
Les conclusions et les questions amenées par l’examen des tris croisés sur une variable de synthèse1 formeront le point de départ de ce chapitre. Prenant appui sur ces tendances principales, nous allons mettre en évidence celles qui peuvent être généralisées et montrer comment les constructions qu’elles impliquent se comportent par rapport au marquage. C’est donc dans ce chapitre que nous dépasserons le repérage du marquage à valeur simplement visuelle, pour identifier exactement sur quelles unités portent les signes. Nous aurons alors identifié l’interaction entre le système de la ponctuation et la structuration morphosyntaxique. Nous commencerons par exposer la procédure suivie (→6.0). Viendra ensuite une série d’analyses détaillées. Dans un premier temps, nous ferons l’étude du marquage en syntaxe argumentale et dans les cas de coordination, ce qui mènera à de premières conclusions (→6.1). En nous servant de ces dernières, nous aborderons les constructions en syntaxe immédiate (→6.2), puis la question des relateurs et des C6 (→6.3). Au terme de ce parcours, nous aurons une idée nette de la manière dont la ponctuation se distribue autour des constituants, tout au moins du point de vue de sa fréquence.
6.0
Procédure d’analyse
En premier lieu, voyons comment nous avons défini nos données (→6.0.1) et par quelles étapes sont passées chacune des études effectuées dans les sections ultérieures (→6.0.2). 6.0.1
Définition des données
La définition des individus et des variables servant à leur description n’est pas problématique: les individus resteront les constructions et constituants. Quant aux variables descriptives de base, elles seront généralement identiques à celles employées dans le cadre du tri croisé sur la variable synthétique MM. Nous ajouterons cependant trois variables supplémentaires, dont une partie ou l’ensemble sera mobilisé pour chaque analyse (→6.0.1.1). Posant à nouveau le délicat problème de la récursivité, nous aurons à expliquer la manière dont les individus ont été sélectionnés pour former les échantillons dont nous aurons besoin (→6.0.1.2).
1
Voir, au chapitre précédent, →5.3 et en particulier la synthèse, sous →5.3.3.
229
6.0.1.1
Variables additionnelles
Pour affiner le travail déjà effectué, il nous faudra enrichir la description des individus à l’aide de variables supplémentaires. La première d’entre elles sera la référence de la charte dans laquelle le constituant ou la phrase a été relevé. Cette précision réintroduit de manière systématique l’individualité des documents, de façon à ce qu’ils ne soient plus nécessairement considérés comme indistincts. Cette variable prendra le nom de RB (pour ‘référence bibliographique’); ses modalités seront les 148 dates des documents dépouillés telles que nous les citons dans la liste des références en fin de volume. La deuxième et la troisième variables ajoutées décrivent l’environnement des constituants. Tout constituant immédiat est susceptible, quelle que soit la structure qui l’intègre, d’être suivi ou précédé d’un autre constituant de même niveau d’intégration syntaxique – bien entendu, les constituants initiaux ont comme particularité de ne pas être précédés d’un autre constituant, de même que les constituants finaux ne sont suivis par aucun autre.2 Nous appellerons contexte immédiat cet environnement direct des constituants étudiés. Les variables décrivant le contexte immédiat reprennent la description morphosyntaxique des constituants (MM) qui entourent l’individu. Elles prendront comme noms MMP pour le constituant précédent et MMS pour le constituant suivant. Par exemple, dans le circonstant prenant la forme du syntagme: «el moıs · de jvle» (Document 1236–07, 9).
le déterminant de jvle constitue le contexte immédiat se trouvant à la suite du mot moıs, lequel est donc défini entre autres par la modalité 0,1,Dt,0,1 de la variable MMS, soit MMS.0,1,Dt,0,1. Réciproquement, moıs est le contexte immédiat se trouvant devant le déterminant, soit MMP.0,0,Ap,0,0. D’autres nouvelles variables seront parfois mobilisées. Nous les présenterons en temps utile. 6.0.1.2
Sélection des individus
L’épineuse question de la récursivité (→5.1.3.2 a) se pose spécifiquement pour chaque construction faisant l’objet d’un examen particulier. Dans certains cas, aucune récursivité n’est possible, notamment avec les constituants qui ne se trouvent pas à l’une des limites de la structure qui les intègre. Ainsi, jamais 0,0,Ap,0,0 ne posera de problème à cet égard, puisque son premier ou son dernier constituant n’auront jamais la même valeur de MM. Dans d’autres cas, le phénomène refait surface. Par exemple, dans le cadre de l’étude du marquage de la proposition, il est inévitable que l’on trouve des mots qui soient à la fois à la fin d’une phrase et d’une subordonnée qui l’achèverait, comme dans:
2
Il arrive que l’ordre linéaire ne corresponde pas à une séquence de constituants de même niveau d’intégration. Dans ce cas, le contexte immédiat ne peut être étudié de manière aussi simple. Nous avons retiré de l’échantillon toutes ces structures complexes, dont la liste ficgure dans les annexes dep-6.0.1.1.notMMP-PPD et dep-6.0.1.1.notMMS-PPF.
230
«Conute choise soit a tos ke l’an de_grasce m cc quatre_vins et chinq, [. . .] vinrent par devant nos [. . .] me sires Simons, [4] vestis delle Magdalene a_Treste, d’une part, et freres Giles, maistres delle Va Benoite, d’atre part.» (Document 1286–03–23, 2).
où le mot part souligné est à la fin de la phrase, mais également de la subordonnée. On ne peut éliminer complètement les inconvénients liés à la récursivité si l’on s’obstine à vouloir garder l’ensemble des individus pour effectuer un test. Pour que l’expérience soit utile, nous devons commencer par isoler les différentes structures les unes des autres, en ne considérant que les constituants indépendants. Pratiquement, s’il faut, par exemple, comparer le marquage des phrases à celui des subordonnées, nous sélectionnerons donc exclusivement les individus qui sont à l’extrémité de gauche ou de droite (en fonction du marquage étudié) d’une et une seule proposition – phrase ou subordonnée. De manière générale, si nous étudions la ponctuation initiale nous exclurons de l’échantillon les constituants dont le premier mot est également celui d’un autre constituant. Quand nous étudierons la ponctuation finale, nous procéderons de la même manière avec les derniers mots. Ainsi, ni la phrase, ni la subordonnée de l’exemple cité ci-dessus ne seront conservées. 6.0.2
Étapes de l’analyse
De manière générale, nous aborderons la fréquence du marquage pour chaque structure étudiée. L’analyse prendra un tour différent en fonction du constituant ou de la structure étudié(e). La première étape du traitement de chacune de ces questions particulières sera de vérifier si les attractions ou répulsions observées ne sont pas caractéristiques d’un ou de quelques documents particuliers, représentés par la variable RB. Chaque fois que cela sera possible, le contexte immédiat sera testé; de la même manière que nous l’aurons fait par rapport à la variable RB, nous vérifierons si certains contextes immédiats ne sont pas particulièrement surreprésentés. Dans les cas où la structure se prête à la comparaison avec une ou plusieurs autres, l’examen sera alors contrastif. Les constituants intéressants qui suivent les mêmes tendances et se ressemblent d’un point de vue morphosyntaxique seront alors comparés du point de vue de la fréquence de leur marquage. On peut théoriquement arriver à deux observations: soit les fréquences de marquage sont clairement différentes, soit on ne peut statistiquement affirmer cette différence. S’il est possible d’en déceler une, cela signifie que, d’une manière ou d’une autre, la structure a une certaine individualité par rapport à d’autres qui lui ressemblent. Il faudra souvent procéder à plusieurs tests successifs pour analyser la structure du tableau. Nous emploierons essentiellement le test du χ2 et le test exact de Fisher3 pour évaluer la pertinence des ventilations. Nous ferons sporadiquement appel à d’autres techniques; par exemple, le test de Wilcoxon sur des échantillons indépendants, le test de Kruskal-Wallis4 ou la représentation sous forme de courbes de densité ou de «boîtes à moustaches» (→4.1.2). Le fonctionnement des outils nouveaux sera exposé quand nous en ferons usage pour la première fois. 3 4
Voir, respectivement, →5.2.1.2 et →5.2.1.5. Voir Howell 1998, 740–741.
231
6.1
Examen des structures argumentales et de la coordination
Pour des raisons qui apparaîtront au fur et à mesure du développement de cette section, l’idéal est de traiter dans un premier temps les structures argumentales ainsi que la coordination. La synthèse des résultats obtenus pourra alors être exploitée dans la suite, lors du traitement de la ponctuation en syntaxe immédiate (→6.2). Les structures seront décrites dans un ordre reflétant l’organisation de la structure argumentale: tout d’abord la phrase et la proposition (→6.1.1), puis le prédicat (→6.1.2), les différents actants et A4 (→6.1.3) et les circonstants (→6.1.4). Nous étudierons enfin la coordination et dresserons un premier bilan (→6.1.5). 6.1.1
Phrase et proposition personnelle
Comme nous l’avons expliqué ci-dessus (→5.3.2.1), l’énoncé non phrastique exprimant un procès a été assimilé à la phrase pour les dépouillements qui suivent. Il existe une tendance à marquer le début et la fin de la phrase, c’est du moins ce que nous apprennent les tris croisés sur la variable MM lorqu’ils sont effectués au niveau de la phrase. De même, les propositions personnelles sont surtout marquées après leur dernier constituant. Morphosyntaxiquement, notre modèle distingue les phrases des autres propositions personnelles par la capacité que les phrases ont à jouer le rôle d’énoncé (→3.4.2.5 b). Les propositions personnelles ont ainsi une fonction syntaxique propre à l’intérieur d’une proposition (fonction argumentale) ou d’un syntagme non propositionnel (fonction immédiate).5 On peut donc se demander si cette différence morphosyntaxique correspond à une différence significative de fréquence de marquage. La fréquence du marquage initial, puis celle du marquage final seront examinées indépendamment. Nous considérerons les mots par rapport à leur position dans la proposition personnelle. Si nous tentons d’étudier la relation entre les propositions et la ponctuation initiale, nous devons, pour chaque mot, répondre à quatre questions: 1/ le mot est-il au début de la phrase? 2/ le mot est-il au début d’une subordonnée à fonction d’argument? 3/ le mot est-il au début d’une subordonnée en syntaxe immédiate? 4/ y a-t-il un ponctogramme devant ce mot? Pour étudier la ponctuation finale, les individus sont décrits en posant les questions correspondantes (le mot est-il à la fin de la phrase? etc.). Comme nous désirons comparer le marquage des différentes sortes de propositions personnelles, nous retirerons de l’échantillon tous les individus pour lesquels la réponse aux trois premières questions est «non». 6.1.1.1
Fréquence du marquage initial
Vérifions que les tendances sont bien générales (→a) avant de traiter l’opposition comme si le corpus ne constituait qu’un seul grand texte (→b). Voyons enfin ce qui
5
Voir →3.2.3.
232
Début de phrase.0 Début de phrase.1
PPD.0
PPD.1
2287 344 2631
240 1380 1620
2527 1724 4251
PPD.0
PPD.1
334.23 -489.91
-542.82 795.65
θ
38.2
χ2 = 2159.62, ddl = 1, p = 0 ★★★
TAB . 6.1 – Tri croisé début de phrase × PPD
Début de phrase.0 Début de phrase.1
PPD.0
PPD.1
1994 336 2330
216 1173 1389
2210 1509 3719
PPD.0
PPD.1
268.22 -392.82
-449.93 658.95
θ
32.2
2
χ = 1767.02, ddl = 1, p = 0 ★★★
TAB . 6.2 – Tri croisé début de phrase × PPD, (sans les documents126505b, 1272-03, 1283-02-13a, 1289-01-12)
se passe lorsque l’on considère les proportions prises pour chaque document indépendamment (→c).6 a. Tendances par document. Le test de décomposition est un test ultérieur à la constatation que les phrases sont marquées au début: il vise à voir uniquement si certains documents privilégient davantage ce type de marque. Le tri croisé sur l’ensemble du corpus confirme sans surprise que la position initiale de la phrase attire effectivement PPD.1 (table 6.1). Reste à savoir si cette tendance n’est pas spécifique à un petit nombre de documents. Si nous croisons la modalité PPD des individus en tête de phrase avec la référence de la charte dans laquelle on les trouve, nous voyons comment les tendances d’attraction (figure 6.1) et de répulsion (figure 6.2) du marquage initial se décomposent. Le premier graphique montre quels documents seraient susceptibles de déstabiliser les effectifs, de sorte qu’en ignorant la répartition des phrases entre les textes, on aurait l’impression que le marquage est un phénomène général, alors qu’il ne serait limité qu’à un nombre restreint de textes. Du fait qu’il met en évidence le phénomène opposé – quelles chartes se distinguent de l’ensemble par l’absence de marquage initial de la phrase –, le second tableau nous intéresse nettement moins. On voit ainsi qu’un ensemble de quatre documents se distingue du reste du corpus – par précaution, nous considérons de la même manière les individus significatifs après correction. Que se passerait-il si nous refaisions le même tri croisé que ci-dessus (tableau 6.1), après avoir enlevé de la tabulation tous les individus relevés dans ces documents? Le nouveau χ2 (table 6.2) montre un écart significatif orienté exactement dans le même sens que le précédent. Le rapport de chances, bien qu’inférieur, reste très élevé. En conclusion, les quatre documents repérés ne déséquilibrent pas le corpus. Appliquons le même procédé aux propositions argumentales pour voir si la répulsion repérée par le tri croisé suivant est spécifique à quelques documents (table 6.3). Il est déjà visible que, par rapport à la phrase, les écarts sont orientés dans la direction opposée. Le θ est par ailleurs beaucoup plus petit. Par rapport aux documents, 6
Les structures ignorées à cause de la récursivité sont énumérées dans l’annexe dep6.1.1.1.removed-PPD.
233
Attractions (seuil adapté 0.0754%)
62/62 (100%) 49/51 (96%) 63/68 (93%) 33/34 (97%) 18/18 (100%) 14/14 (100%) 13/13 (100%) 13/13 (100%) 18/19 (95%) 18/19 (95%) 11/11 (100%) 11/11 (100%) 17/18 (94%) 10/10 (100%) 10/10 (100%) 10/10 (100%) 10/10 (100%) 10/10 (100%) 10/10 (100%) 10/10 (100%) 16/17 (94%) 15/16 (94%) 14/15 (93%) 14/15 (93%) 14/15 (93%) 19/21 (90%) 18/20 (90%) 12/13 (92%) 17/19 (89%) 17/19 (89%) 20/23 (87%) 15/17 (88%) 15/17 (88%) 23/27 (85%) 9/10 (90%) 9/10 (90%) 9/10 (90%) 9/10 (90%) 22/26 (85%) 17/20 (85%) 9/11 (82%) 9/11 (82%) 13/16 (81%) 13/16 (81%) 17/21 (81%) 10/12 (83%) 15/18 (83%)
1272−03 1289−01−12 1283−02−13a 1265−05b 1273−05−12 1272−06−22 1265−05a 1270−06−06a 1266−06−13 1270−05−10 1263−05 1275−08 1265−11−13 1263−05−27a 1267−10−22 1270−09−29 1271−07−25 1276−02−24 1282−12−22 1288−02b 1276−06−10b 1277−05−04 1263−11 1271−04−20 1289−07−19 1278−04−06 1263−03−31 1265−07−04 1271−05−22 1271−12−09 1278−08−01 1270−03−24 1280−05−04 1267−08−28 1243−07−09 1265−04−15 1275−01−10a 1288−02a 1277−06−12 1260−05−09 1260−02−21b 1271−03−18 1271−12−22 1289−04−19 1270−11−26 1242−05−02 1289−03−05
0.000122
1
F IG . 6.1 – Attractions entre PPD et la phrase par charte
Répulsions (seuil adapté 0.0754%)
0/15 (0%) 2/13 (15%) 12/30 (40%) 10/23 (43%) 3/10 (30%) 5/11 (45%) 5/11 (45%) 5/11 (45%) 7/14 (50%) 18/29 (62%) 12/20 (60%) 6/11 (55%) 24/33 (73%) 10/14 (71%) 8/10 (80%) 8/10 (80%) 11/15 (73%) 8/11 (73%) 11/14 (79%) 12/16 (75%) 12/16 (75%)
1278−10−17 1289−04−05 1244−01−19 1280−07−20 1289−08−01 1280−05−05 1280−08−09 1284−05−11 1283−12−26 1268−03−10 1276−07−22 1270−04−16 1247−06 1260−05−30b 1276−06−10a 1278−04−04a 1236−05 1260−02−21a 1274−05−31b 1252−03−01a 1274−05−31a
8.22e−14
1
F IG . 6.2 – Répulsions entre PPD et la phrase par charte
234
Début de prop. arg..0 Début de prop. arg..1
PPD.0
PPD.1
2076 555 2631
1503 117 1620
PPD.0
PPD.1
-8.73 46.52
14.18 -75.54
θ
3.43
3579 672 4251
χ2 = 143.94, ddl = 1, p = 3.67e − 33 ★★★
TAB . 6.3 – Tri croisé début de prop. argumentale × PPD Attractions (seuil adapté 0.465%) 1263−05−27b 1263−05−27a 1272−03
3/11 (27%) 2/10 (20%) 7/38 (18%) 0.639
1
F IG . 6.3 – Attractions entre PPD et la proposition argumentale par charte Répulsions (seuil adapté 0.465%) 1283−02−13a 1289−01−12 1242−05−02 1271−04−20 1278−08−01 1247−06 1243−07−09 1265−05b
2/35 (5.7%) 2/32 (6.2%) 0/11 (0.0%) 0/11 (0.0%) 1/13 (7.7%) 2/19 (10.5%) 1/11 (9.1%) 2/15 (13.3%) 0.0999
1
F IG . 6.4 – Répulsions entre PPD et la proposition argumentale par charte
Début de prop. imm..0 Début de prop. imm..1
PPD.0
PPD.1
899 1732 2631
1497 123 1620
2396 1855 4251
PPD.0
PPD.1
-229.92 296.98
373.41 -482.32
θ
23.4
2
χ = 1380.27, ddl = 1, p = 4.08e − 302 ★★★
TAB . 6.4 – Tri croisé début de prop. immédiate × PPD
on construit donc les tableaux de décomposition des figures 6.3 et 6.4, qui montrent qu’aucun document ne se distingue particulièrement – notons cependant que très peu de chartes attestent suffisamment la construction pour pouvoir être évaluées. Quant aux propositions en syntaxe immédiate, le tri croisé montre également qu’elles repoussent la ponctuation initiale (table 6.4). La répulsion est encore plus forte qu’au niveau de la proposition argumentale. On observera donc le graphique des répulsions par rapport aux documents (figure 6.6). On y remarque immédiatement que la structure est bien attestée dans de nombreux textes, mais qu’aucun d’eux ne se distingue par une répulsion particulière du marquage. En fin de compte, les tendances générales peuvent être considérées comme telles: aucun document ou groupe de documents ne paraît déstabiliser à lui seul les attractions ou répulsions du marquage. b. Dépouillements généraux. Le fait que les tris croisés ci-dessus soient orientés différemment (attraction de PPD.1 pour la phrase et répulsion pour les autres modalités) est l’indice d’une différence entre les fréquences, mais ne suffit pas à confirmer la si-
235
Attractions (seuil adapté 0.0666%) 1236−12−15 1273−05−12 1280−08−14 1274−02−24 1236−07 1265−11−13 1276−02−24 1263−03−31 1286−03 1236−05 1268−03−01 1270−04−07 1247−06 1275−08 1237−12 1267−07−06 1281−03 1283−12−26 1289−07−19 1264−09−07 1270−05−10 1263−05−27b 1243−07−09 1263−05−27a 1270−06−06a 1266−06−13 1263−11 1276−06−10b
7/11 (63.6%) 8/20 (40.0%) 5/13 (38.5%) 5/14 (35.7%) 4/10 (40.0%) 7/28 (25.0%) 4/13 (30.8%) 3/13 (23.1%) 3/14 (21.4%) 3/15 (20.0%) 3/19 (15.8%) 2/10 (20.0%) 3/20 (15.0%) 3/21 (14.3%) 2/12 (16.7%) 2/13 (15.4%) 2/13 (15.4%) 2/13 (15.4%) 2/13 (15.4%) 1/14 (7.1%) 2/16 (12.5%) 1/13 (7.7%) 1/12 (8.3%) 1/12 (8.3%) 1/12 (8.3%) 1/11 (9.1%) 2/25 (8.0%) 2/21 (9.5%) 2.32e−12
1
F IG . 6.5 – Attractions entre PPD et la proposition immédiate par charte
phrase prop. arg. prop. imm.
0
1
344 555 1732 2631
1380 117 123 1620
1724 672 1855 4251
0
1
−489.91 ★★★ 46.52 ★★★ 296.98 ★★★
795.65 ★★★ −75.54 ★★★ −482.32 ★★★
χ2 = 2186.92, ddl = 2, p = 0 ★★★
TAB . 6.5 – Tri croisé types de propositions × PPD
gnificativité du contraste. Pour ce faire, il est nécessaire de rassembler les trois types de propositions en un seul tri croisé. Commençons l’analyse en faisant une tabulation. Les individus en sont les mots en début de proposition. Les variables décrivant ces derniers sont: 1/ le type de construction au début de laquelle ils se trouvent; 2/ la présence ou l’absence d’une ponctuation initiale. On obtient le tableau de contingence suivant (à gauche dans la table 6.5). Il est absolument clair que la phrase se démarque fortement des autres structures par une ponctuation beaucoup plus fréquente. Le χ2 reste extrêmement élevé pour un tableau à deux degrés de liberté. Les propositions qui ne sont pas des phrases sont, comme le sens des attractions permet de le voir, caractérisées par un rejet important de la ponctuation à l’initiale: on est déjà assuré qu’un χ2 opposant la première ligne aux deux autres serait significatif à un seuil inférieur au millième. La question est à présent de savoir si la ponctuation distingue également les subordonnées entre elles. À ce propos, aucun des tests effectués jusqu’à présent n’apporte la moindre information. Il est légitime d’effectuer plusieurs tests consécutifs sur des sous-tables (Agresti
236
Répulsions (seuil adapté 0.0666%) 1280−07−20 1278−08−01 1277−06−12 1278−04−06 1271−12−09 1244−01−19 1260−05−09 1268−03−10 1252−03−01a 1280−05−04 1274−05−31a 1276−07−22 1290−08−24 1265−04−15 1271−04−20 1270−03−24 1278−04−04a 1242−05−02 1274−05−31b 1283−02−13a 1271−05−22 1260−05−14 1264−04 1271−03−18 1275−01−10a 1282−12−22 1289−03−05 1289−08−01 1271−12−22 1271−07−25 1277−03−23 1277−05−04 1278−10−17 1278−12−03 1284−02−12 1284−05−11 1285−02−24 1285−07−04 1287−09−08 1289−04−19 1265−05b 1253−03−01 1260−02−21a 1260−10−02 1284−06−09 1272−03 1267−08−28 1270−11−26 1289−01−12
0/36 (0.0%) 0/32 (0.0%) 0/30 (0.0%) 0/29 (0.0%) 0/28 (0.0%) 0/27 (0.0%) 0/23 (0.0%) 0/22 (0.0%) 0/20 (0.0%) 0/20 (0.0%) 0/18 (0.0%) 0/18 (0.0%) 0/18 (0.0%) 0/17 (0.0%) 0/17 (0.0%) 0/16 (0.0%) 0/16 (0.0%) 0/15 (0.0%) 0/15 (0.0%) 3/67 (4.5%) 0/14 (0.0%) 0/13 (0.0%) 0/13 (0.0%) 0/13 (0.0%) 0/13 (0.0%) 0/13 (0.0%) 0/13 (0.0%) 0/12 (0.0%) 1/29 (3.4%) 0/11 (0.0%) 0/11 (0.0%) 0/11 (0.0%) 0/11 (0.0%) 0/11 (0.0%) 0/11 (0.0%) 0/11 (0.0%) 0/11 (0.0%) 0/11 (0.0%) 0/11 (0.0%) 1/19 (5.3%) 2/33 (6.1%) 0/10 (0.0%) 0/10 (0.0%) 0/10 (0.0%) 0/10 (0.0%) 3/48 (6.2%) 1/26 (3.8%) 1/20 (5.0%) 3/49 (6.1%) 0.202
1
F IG . 6.6 – Répulsions entre PPD et la proposition immédiate par charte
2002, 82–84), en groupant ou en supprimant les lignes et les colonnes de manière à respecter les règles suivantes.7 Comme le présente Alan Agresti (2002, 84): «1. The df8 for the subtables must sum to df for the full table. Each cell count in the full table must be a cell count in one and only one subtable. 2. Each marginal total of the full table must be a marginal total for one and only one subtable.» 7
8
Ces règles de décomposition sont basées sur le rapport de vraisemblance, statistique proche du χ2 noté G2 , dont la formule (cf. Howell 1998, 179) est (o et e ont la même signification que dans la formule du χ2 (voir note 14, p. 178): X o G2 = 2 o × ln (6.1) e Le rapport de vraisemblance calculé sur la table initiale correspond à la somme des rapports de vraisemblance de toutes les sous-tables obéissant aux critères cités. C’est-à-dire le nombre de degrés de liberté.
237
phrase prop.
0
1
344 2287 2631
1380 240 1620
1724 2527 4251
0
1
-489.91 334.23
795.65 -542.82
θ
38.2
χ2 = 2159.62, ddl = 1, p = 0 ★★★ Après ajustement de Šidàk pour 2 comparaisons: ★★★ (seuils: 0.0253, 0.00501, 5e-04)
TAB . 6.6 – Tri croisé phrases et autres prop. × PPD
prop. arg. prop. imm.
0
1
555 1732 2287
117 123 240
672 1855 2527
0
1
-4.65 1.68
44.31 -16.05
θ
2.97
χ2 = 65.44, ddl = 1, p = 5.98e − 16 ★★★ Après ajustement de Šidàk pour 2 comparaisons: ★★★ (seuils: 0.0253, 0.00501, 5e-04)
TAB . 6.7 – Tri croisé prop. argumentales ou non × PPD
En construisant la table de contingence correspondant au contraste que nous venons de relever, on obtient la table 6.6, où la dernière ligne du tri correspond à la somme, colonne par colonne, des deux dernières lignes de la table de contingence précédente. L’écart est extrêmement important et le rapport de chances est énorme. Nous sommes dans une situation où le contraste est tellement évident qu’il ne serait pas nécessaire de faire un test pour l’admettre. La simple lecture des documents inviterait n’importe quel lecteur attentif à la même conclusion. Ce test prouve à quel point les exceptions à la tendance générale sont insignifiantes. D’autre part, nous pouvons opérer un nouveau test opposant exclusivement les subordonnées entre elles, c’est-à-dire sur la base d’un tableau de contingence ne comportant que les deux dernières lignes de la tabulation donnée au début de cette section (tableau 6.5). La nouvelle table de contingence (table 6.7) montre à nouveau une différence remarquable, les deux probabilités étant infimes. Les propositions de type argumental sont donc plus fréquemment marquées. Pour des raisons mathématiques dont l’exposé n’a pas sa place ici,9 il est préférable de faire l’économie d’un test supplémentaire – par rapport aux conditions de décomposition,10 le test initial a 2 ddl et chacun des deux tests ultérieurs en a un seul (ou bien les comparaisons ne seraient plus indépendantes). On ne peut éliminer toutes les propositions qui ne sont pas des phrases et n’ont pas une fonction argumentale et faire un test sur la nouvelle tabulation. Néanmoins, ses résultats sont impliqués par ceux des deux tests précédents. Il ne serait de toute manière pas utile de comparer a posteriori le marquage de la phrase et celui des propositions immédiates: la première 9
«It might seem more natural to compute G2 for the (J − 1) separate 2 × 2 tables that pair each column with a particular one, say the last. However, these component statistics are not independent and do not sum to G2 for the full table. This is beyond our scope at this stage but relates to the contrasts of log probabilities that form the log odds ratios for the two tables not being orthogonal.» (Agresti 2002, 82). 10 Voir page 237.
238
0.00
0.02
0.04
Densité
0.06
0.08
phrase prop. arg. prop. imm.
0
20
40
60
80
100
100
80
60
40
20
0
148
147
146
prop. imm.
prop. arg.
phrase
F IG . 6.7 – Graphiques des fréquences de marquage initial des propositions
tabulation montrait déjà que la ligne correspondant à ces dernières s’opposait au reste du tableau. On peut donc synthétiser les résultats de l’analyse de la fréquence du marquage initial en une série de conclusions relatives: la phrase a un taux élevé de ponctuation initiale, la proposition en syntaxe argumentale a un taux moyen de ponctuation initiale et la proposition en syntaxe immédiate a un taux bas de ponctuation initiale. c. Proportions par document. Une autre manière d’aborder la question consiste à considérer les documents comme des individus définis par trois variables continues: le pourcentage de phrases marquées qu’ils contiennent, le pourcentage de propositions argumentales marquées et le pourcentage de propositions immédiates marquées – en ne conservant que les individus non ambigus. Cette approche n’est évidemment possible que parce qu’un grand nombre d’individus sont à notre disposition pour chaque charte. La distribution des valeurs de chacune de ces trois variables peut alors être repré-
239
PRB Kruskal-Wallis Wilcoxon: phrase et p. arg. Wilcoxon: phrase et prop. imm. Wilcoxon: prop. arg. et prop. imm.
8.68e − 56 ★★★ 5.19e − 36 ★★★ 1.19e − 46 ★★★ 5.01e − 02 ✩✩✩
seuil ajusté ★★★ ★★★ ✩✩✩
TAB . 6.8 – Probabilités de différence de marquage initial des propositions
sentée sous la forme d’une courbe ou d’une boîte à moustache (figure 6.7).11 Les courbes montrent que la ponctuation de la phrase se caractérise par une tendance inverse très prononcée par rapport à celle des autres propositions: comme les χ2 le montraient, la phrase attire manifestement plus le marquage. Par contre, les courbes concernant les propositions subordonnées décroissent dans la même direction. Le fait que les encoches des boîtes correspondantes se recouvrent indique que si l’on considère les taux de chaque charte, la différence entre les subordonnées s’estompe. Néanmoins, la dispersion des données autour des médianes est différente: les boîtes montrent des propositions immédiates ne dépassant 30% de marquage initial que dans des cas exceptionnels, alors que les pourcentages sont répartis de manière beaucoup plus lâche dans le cas des propositions argumentales; les courbes de densité sont tout aussi limpides. Il est possible de calculer les probabilités de l’absence de différence (H0 ) entre les médianes des trois distributions à l’aide de tests non paramétriques – qui n’imposent pas que les distributions aient une forme particulière (Howell 1998, ch. 18). Malheureusement, le test de Wilcoxon12 ne suffit plus à évaluer H0 en présence de plus de deux échantillons. On utilise alors le test de Kruskal-Wallis (Howell 1998, 740–741), dont H1 stipule qu’au moins un des échantillons a une médiane différente des autres. On effectue ensuite un test a posteriori en comparant les échantillons deux à deux – test de Wilcoxon ajusté par la correction de Šidàk (Abdi 2007). Les statistiques calculées confirment tout à fait ce que l’examen des encoches pouvait nous apprendre (table 6.8).13 Les médianes des proportions de marquage des deux types de subordonnées ne sont pas significativement différentes. La probabilité non modifiée par l’ajustement de Šidàk était déjà à la limite de la significativité. Cela pourrait signifier que la différence observée dans les χ2 est en réalité caractéristique de quelques documents comprenant un grand nombre des constructions, alors que la situation de chaque charte prise isolément est beaucoup plus floue. Les conclusions sont donc différentes suivant qu’on envisage tous les documents comme s’ils constituaient un seul texte ou qu’on préserve leur individualité. De manière générale, il y a un écart très net entre les fréquences de marquage des trois types de propositions, mais le contraste entre les subordonnées est certainement caractéristique d’un nombre limité de documents. Si l’on considère tous les documents comme participant à la construction du même texte, on perd complètement cette particularité. 11 Voir les dépouillements en annexe: 6.1.1.1.c.proportions-phrase, 6.1.1.1.c.proportions-
proparg et 6.1.1.1.c.proportions-propimm. 12 Déjà employé ci-dessus (→5.3.3.1). 13 Bien entendu, le test de Kruskal-Wallis ne doit pas être ajusté, puisqu’il porte sur l’ensemble
des échantillons.
240
PPF.0
PPF.1
568 191 759
553 753 1306
Fin de phrase.0 Fin de phrase.1
1121 944 2065
PPF.0
PPF.1
59.04 -70.11
-34.31 40.75
θ
4.05
χ2 = 202.91, ddl = 1, p = 4.85e − 46 ★★★
TAB . 6.9 – Tri croisé fin de phrase × PPF Attractions (seuil adapté 0.171%) 1272−03 1283−02−13a 1265−05b 1265−05a 1276−06−10b 1289−03−05 1289−01−12 1270−05−10 1266−06−13 1271−05−22 1263−03−31 1265−07−04 1270−03−24 1271−12−09 1271−12−22 1280−05−04 1289−07−19 1278−04−06 1277−06−12 1267−08−28
38/38 (100%) 22/23 (96%) 18/19 (95%) 11/11 (100%) 11/11 (100%) 11/11 (100%) 17/18 (94%) 10/10 (100%) 13/14 (93%) 12/13 (92%) 11/12 (92%) 10/11 (91%) 10/11 (91%) 9/10 (90%) 9/10 (90%) 9/10 (90%) 9/10 (90%) 8/10 (80%) 12/14 (86%) 14/17 (82%) 0.00305
1
F IG . 6.8 – Attractions entre PPF et la phrase par charte
6.1.1.2
Fréquence du marquage final
La même procédure s’applique sans encombre à la ponctuation finale. Appliquons ainsi les mêmes χ2 sur l’ensemble des individus retenus, en considérant la fin des structures, ainsi que la présence ou non d’un ponctogramme à leur suite. Les effectifs sont beaucoup plus faibles que ceux qui étaient mobilisés pour la ponctuation initiale. Un grand nombre d’individus ont en effet dû être retirés du fait qu’ils cumulaient plusieurs positions.14 a. Tendances par document. Vérifions tout d’abord globalement l’association entre la position à la finale d’une phrase et le marquage (table 6.9). L’attraction est assurée, mais on voit qu’elle est moins forte que pour PPD. Un seul document se démarque de l’ensemble par une ponctuation remarquablement régulière (figures 6.8 et 6.9). Notons qu’en raison du retranchement de nombreuses structures pour éviter de considérer les propositions s’achevant au même endroit, peu de chartes rassemblent suffisamment de données pour être testées. Retirer les phrases de ce document de l’échantillon ne change pas la tendance générale, comme en témoigne la table 6.10. De même, le lien entre PPF et les propositions de fonction argumentale peut être testé à l’aide du tri de la table 6.11, qui laisse voir que
14 Les structures ignorées à cause de la récursivité sont énumérées dans l’annexe dep-
6.1.1.2.removed-PPF.
241
Répulsions (seuil adapté 0.171%) 1278−10−17 1283−12−26 1268−03−10 1244−01−19 1270−11−26 1252−03−01a 1247−06 1260−05−30b 1260−05−09 1278−08−01
0/10 (0%) 4/11 (36%) 8/17 (47%) 9/18 (50%) 10/14 (71%) 7/10 (70%) 15/20 (75%) 10/13 (77%) 9/12 (75%) 9/12 (75%) 3.28e−09
1
F IG . 6.9 – Répulsions entre PPF et la phrase par charte
Fin de phrase.0 Fin de phrase.1
PPF.0
PPF.1
562 191 753
523 715 1238
1085 906 1991
PPF.0
PPF.1
56.04 -67.12
-34.09 40.82
θ
4.02
2
χ = 196.77, ddl = 1, p = 1.06e − 44 ★★★
TAB . 6.10 – Tri croisé fin de phrase × PPF, (sans le document 1272-03)
Fin de prop. arg..0 Fin de prop. arg..1
PPF.0
PPF.1
684 75 759
1182 124 1306
1866 199 2065
PPF.0
PPF.1
-0.01 0.05
0 -0.03
θ
1.05
χ2 = 0.04, ddl = 1, p = 0.834 ✩✩✩
TAB . 6.11 – Tri croisé fin de prop. argumentale × PPF
Fin de prop. imm..0 Fin de prop. imm..1
PPF.0
PPF.1
266 493 759
877 429 1306
1143 922 2065
PPF.0
PPF.1
-56.54 70.09
32.86 -40.73
θ
3.79
2
χ = 198.91, ddl = 1, p = 3.61e − 45 ★★★
TAB . 6.12 – Tri croisé fin de prop. immédiate × PPF
la tendance ne peut être déterminée avec certitude. Peu soumise aux extrêmes, cette absence de tendance ne peut être imputée à un seul document.15 Le même test effectué sur les propositions immédiates donne à voir une tendance à la répulsion, nette cette fois, entre cette structure et le marquage final (table 6.12). Le petit tableau décomposant les écarts par document ne nous apprend pas grand-chose, nous l’avons reporté en annexe.16 b. Dépouillements généraux. En croisant le type de structure à la présence de la ponctuation finale, on obtient les résultats de la table 6.13. Une opposition est apparente 15 Voir l’annexe 6.1.1.2.table-propargRBxPPF-all, où l’on voit que la construction ne compte
généralement pas assez d’attestations par document pour que l’écart puisse être testé. 16 Voir 6.1.1.2.figure-propimmxPPF.
242
phrase prop. arg. prop. imm.
0
1
191 75 493 759
753 124 429 1306
944 199 922 2065
0
1
−70.11 ★★★ 0.05 ✩✩✩ 70.09 ★★★
40.75 ★★★ −0.03 ✩✩✩ −40.73 ★★★
χ2 = 221.75, ddl = 2, p = 7.03e − 49 ★★★
TAB . 6.13 – Tri croisé types de propositions × PPF
phrase autre proposition
0
1
191 568 759
753 553 1306
944 1121 2065
0
1
-70.11 59.04
40.75 -34.31
θ
4.05
2
χ = 202.91, ddl = 1, p = 4.85e − 46 ★★★ Après ajustement de Šidàk pour 2 comparaisons: ★★★ (seuils: 0.0253, 0.00501, 5e-04)
TAB . 6.14 – Tri croisé phrases et autre proposition × PPF
prop. arg. prop. imm.
0
1
75 493 568
124 429 553
199 922 1121
0
1
-6.62 1.43
6.8 -1.47
θ
1.9
2
χ = 15.68, ddl = 1, p = 7.48e − 05 ★★★ Après ajustement de Šidàk pour 2 comparaisons: ★★★ (seuils: 0.0253, 0.00501, 5e-04)
TAB . 6.15 – Tri croisé propositions argumentales ou non × PPF
entre le marquage de la phrase et celui des autres propositions, dont les contributions sont assez proches, alors que la direction de l’écart est opposée. Les contributions de la deuxième ligne sont annulées par la présence de ces deux scores antagonistes. La table réduite (6.14, qui groupe donc les lignes en fonction de l’orientation de l’écart) oppose à nouveau les phrases aux subordonnées. Il n’y a pas vraiment de surprise, mais on voit que le rapport de chances est beaucoup plus petit qu’il ne l’était dans le rapport ci-dessus, entre le marquage des propositions et le marquage initial (tableau 6.4). Pour compléter ce tableau, il faut examiner la manière dont les propositions argumentales s’opposent aux propositions immédiates (table 6.15). La différence entre les deux types de subordonnées émerge de ce test, qui nous montre un écart toujours significatif entre les fréquences. L’ajustement de Šidàk n’invalide pas le résultat. En conséquence, la gradation de la fréquence de ponctuation finale est donc similaire à celle de la ponctuation initiale, mais moins prononcée. Exprimées relativement, les tendances de marquage sont: les phrases s’opposent aux subordonnées et les deux types de subordonnées sont distincts. c. Proportions par document. Considérons, comme nous l’avons fait pour la ponctuation initiale, les documents comme des individus définis par trois variables continues (pourcentage de phrases marquées à la finale, pourcentage de propositions argumentales et pourcentage de propositions immédiates).
243
0.005
Densité
0.015
phrase p. arg. p. imm.
0
20
40
60
80
100
100
80
60
40
20
0
147
67
144
p. imm.
p. arg.
phrase
F IG . 6.10 – Graphiques des fréquence de marquage final des propositions
Les courbes et boîtes à moustaches se rapportant à ces distributions sont visibles dans la figure 6.10.17 Les renseignements que les graphiques fournissent à propos des propositions argumentales sont particulièrement intéressants. La courbe comporte deux modes (sommets), localisés à 0 et un peu moins de 100%. La présence de deux modes signifie généralement que la distribution étudiée rassemble deux échantillons issus de populations distinctes. En l’occurrence, certaines chartes ont tendance à marquer toutes les propositions argumentales, alors que d’autres n’en marquent aucune. La dispersion des fréquences est de ce fait très large, ce qui est particulièrement visible quand on regarde la boîte centrale du graphique au bas de la figure 6.10. Les tests de Kruskal-Wallis et les tests a posteriori ajustés donnent des résultats concordant aux conclusions amenées par les graphiques (table 6.16). Il y a donc bien au moins une différence significative entre les trois distributions: celle qui oppose 17 Voir les dépouillements 6.1.1.2.c.proportions-phrase, 6.1.1.2.c.proportions-proparg et
6.1.1.2.c.proportions-propimm en annexe.
244
PRB Kruskal-Wallis Wilcoxon: phrase et p. arg. Wilcoxon: phrase et p. imm. Wilcoxon: p. arg. et p. imm.
1.69e − 14 ★★★ 3.85e − 02 ✩✩★ 1.56e − 17 ★★★ 2.77e − 02 ✩✩★
seuil ajusté ✩✩✩ ★★★ ✩✩✩
TAB . 6.16 – Probabilités de différence de marquage final des propositions
les phrases aux propositions personnelles immédiates. Les autres contrastes sont trop peu marqués pour être exploitables: même sans ajustement, ils sont beaucoup moins significatifs (phrase vs p. arg. est d’ailleurs à la limite du seuil de 5%). d. Deux populations. L’hétérogénéité de la distribution bimodale invite à relativiser les résulats ne permettant pas de rejeter H0 : puisqu’il y a probablement deux populations mêlées, la solution raisonnable consisterait à les considérer comme disjointes. Divisons l’échantillon en quatre sous-échantillons, en fonction de la proportion de marquage des subordonnées argumentales: 0%, 100%, entre 0% et 100% (non inclu, cet intervalle se note ]0; 100%[) et un dernier groupe comprenant les chartes dont aucune proposition argumentale n’a pu être retenue (NA). En effet, nous n’avons pas la possibilité d’expliquer par une autre variable la différence entre les chartes des deux populations. De ce fait, tous les pourcentages intermédiaires posent problème. De même, les chartes dont nous n’avons pas pu retirer la moindre proposition personnelle argumentale font partie de l’échantillon total, mais n’entrent évidemment dans aucune catégorie; la donnée est considérée comme manquante. En réalité, la situation est difficile à évaluer, parce que les effectifs des constructions différentes des phrases sont souvent limités à quelques unités, voire à une seule par charte.18 On peut cependant garder la répartition en quatre groupes comme hypothèse de travail. Si l’on construit donc les boîtes à moustaches correspondant d’une part au pourcentage de marquage des phrases dans les chartes de chacun des groupes, d’autre part au marquage des propositions immédiates, on obtient les graphiques de la 246 (les données manquantes sont séparées des autres par une ligne verticale). Observons les graphiques avant d’effectuer le moindre test. De manière générale dans les deux ensembles, les médianes laissent apparaître une gradation: plus le pourcentage de marquage des propositions argumentales augmente, plus la médiane se rapproche de 100%. Le groupe NA présente toujours une dispersion qui couvre toutes les valeurs. Si l’on regarde les encoches, pour les phrases, le groupe NA n’est distinct que du groupe 100%. En n’analysant que les documents des groupes associés à un pourcentage, on voit que seul le groupe 0% se distingue bien des deux autres. La situation est similaire pour les propositions immédiates, mais le groupe 0% semble distinct du groupe intermédiaire. Les calculs de probabilités (test de Kruskal-Wallis et tests de Wilcoxon non pairés ajustés) correspondent tout à fait au graphique 6.11 pour ce qui est de la phrase, comme on le voit dans la table 6.17. On constate en outre que les ajustements de Šidàk ne modifient pas excessivement la significativité des tests. 18 Voir les dépouillements complets en annexe: dep-6.1.1.2.proparg-PPF.
245
100 80 60 40 20
Fréquence de marquage des phrases
0
81
20
17
30
NA
0%
]0,100%[
100%
60 40 0
20
Fréquence de marquage des p. imm.
80
100
Fréquence de marquage des p. arg.
81
20
17
30
NA
0%
]0,100%[
100%
Fréquence de marquage des p. arg.
F IG . 6.11 – Graphiques des fréquences de marquage final de la phrase (haut) et de la p. imm. (bas) par rapport à p. arg.
246
PRB Kruskal-Wallis Wilcoxon: 0% et ]0,100%[ Wilcoxon: 0% et 100% Wilcoxon: ]0,100%[ et 100% Wilcoxon: NA et 0% Wilcoxon: NA et 100% Wilcoxon: NA et ]0,100%[
PRB ajustée
0.00286 ✩★★ 0.01035 ✩✩★ 0.00100 ✩★★ 0.60992 ✩✩✩ 0.57453 ✩✩✩ 0.00442 ✩★★ 0.05692 ✩✩✩
✩✩✩ ✩★★ ✩✩✩ ✩✩✩ ✩✩★ ✩✩✩
TAB . 6.17 – Probabilités de différence de fréquence de marquage final de la phrase par rapport à p. arg. PRB Kruskal-Wallis Wilcoxon: 0% et ]0,100%[ Wilcoxon: 0% et 100% Wilcoxon: ]0,100%[ et 100% Wilcoxon: NA et 0% Wilcoxon: NA et 100% Wilcoxon: NA et ]0,100%[
PRB ajustée
6.88e − 04 ★★★ 2.85e − 02 ✩✩★ 7.48e − 05 ★★★ 5.86e − 02 ✩✩✩ 1.84e − 02 ✩✩★ 6.58e − 03 ✩★★ 9.55e − 01 ✩✩✩
✩✩✩ ★★★ ✩✩✩ ✩✩✩ ✩✩★ ✩✩✩
TAB . 6.18 – Fréquence de marquage final de la p. imm. par rapport à p. arg.: statistiques
Les mêmes tests appliqués aux fréquences de marquage des propositions immédiates donnent la table 6.18. L’ajustement oblige à rejeter les distinctions entre NA et 0% (cela est visible dans la figure p. 246 si l’on observe les encoches des boîtes), ainsi qu’entre 0% et ]0, 100%[. Les chartes qui marquent toujours les p. arg. ont une nette tendance à marquer d’autant plus les phrases et les p. imm. On retiendra que le contraste fondamental oppose nettement les groupes 0% et 100%. Le fait que la subdivision en quatre classes mène à la constatation de ce contraste, parfaitement cohérent, est un sérieux argument en faveur de la distinction réelle entre les chartes qui marquent et celles qui ne marquent pas les propositions argumentales. Bien entendu, la non-significativité des contrastes (en particulier avec des tests non paramétriques et des ajustements sévères19 ) ne signifie pas pour autant que ces contrastes n’existent pas – il subsiste un risque de commettre l’erreur β –, mais le fait qu’ils soient nettement moins importants permet tout de même de leur reconnaître une position intermédiaire. Ainsi, le groupe des NA et celui des ]0, 100%[ se trouvent à mi-chemin entre les deux autres, ce qui confirme l’intuition selon laquelle il fallait distinguer deux populations. En généralisant ces dernières conclusions, il semblerait donc qu’il existe une cohérence interne à chaque charte, qui fait que les tendances de ponctuation sont, pour les propositions au moins, orientées dans le même sens. 6.1.1.3
Synthèse de l’analyse sur la ponctuation de la phrase
Que retenir de cet examen? Les différents tests ont mené à la conclusion que les phrases étaient toujours beaucoup plus marquées que les subordonnées.
19 Voir note 45.
247
a. Cohérence à travers le corpus. Trois tendances ont pu être décelées, en fonction de la structure impliquée. Les phrases sont les unités les plus stables et l’attraction qu’elles manifestent vis-à-vis du marquage semble répandue dans presque tout le corpus. L’inverse est vrai de la part des propositions immédiates, qui rejette au contraire fortement la présence de ponctuation, en particulier à l’initiale. Par ailleurs, les derniers tests effectués sur les proportions de marquage final par document ont montré que non seulement les propositions de fonction argumentale ne sont pas nécessairement toujours moins marquées que les phrases, mais surtout que leur marquage se fait de manière différente suivant le document dans lequel on les rencontre. La présence de ponctuation est d’autre part visiblement liée au reste des tendances concernant les autres propositions, puisque la proportion de phrases et de subordonnées de fonction immédiate marquées augmente avec celle des subordonnées argumentales. Cela a d’importantes conséquences sur la manière dont nous devrions, à l’avenir, considérer l’élaboration du corpus: pour classer les documents et tenter d’expliquer cette variation, il serait nécessaire d’avoir à notre disposition un ensemble de variables supplémentaires, définissant les documents de manière plus externe. Il est possible qu’on puisse décrire les chartes émanées de certaines autorités ou datant d’une certaine époque comme étant plus ou moins marquées que la moyenne. Malheureusement, cette démarche n’est pas possible à l’heure actuelle, où le corpus exploitable est encore bien maigre. b. La phrase comme «unité de lecture». Quoi qu’il arrive, la phrase est toujours nettement distinguée des autres propositions par le fait qu’elle attire plus systématiquement un ponctogramme à chacune de ses bornes. Cette observation est extrêmement importante: elle montre que l’unité phrase, telle que nous l’avons définie empiriquement et telle que l’ont conçue intuitivement les philologues jusqu’à présent, constituait réellement une unité de lecture pour les scribes. Ces derniers ressentaient le besoin d’en marquer le début et la fin plus souvent qu’ils ne marquaient les limites des propositions n’ayant pas le statut d’énoncé. Au delà de la significativité de la différence, l’intensité montre à quel point elle était présente: nous avons remarqué que les rapports de chances, notamment ceux impliqués dans l’étude de PPD (→6.1.1.1), étaient énormes. La distinction entre les différents types de subordonnées est plus floue. L’étude répond donc à une question fondamentale à laquelle les premiers travaux sur la ponctuation médiévale avaient mené: «[Selon Hélène Naïs 1979, dans le ms. B de la Conqueste de Constantinople, l]a ponctuation n’a pas de caractère grammatical, elle vise plutôt à mettre en valeur les qualités esthétiques des pages et à souligner les éléments intéressants du texte (les sous-titres étant absents), de sorte qu’il est difficile de repérer les éléments initiaux de la phrase – ce qui pose la question de savoir à quelle réalité correspond la notion de phrase en ancien français.» (Gruaz 1980, 9, nous soulignons).
Comment les scribes médiévaux concevaient-ils la phrase d’un point de vue morphosyntaxique? Au regard de ce que la ponctuation des chartes peut nous apprendre, il y a tout lieu de croire que leurs conceptions ne différaient pas grandement des nôtres. c. Proportions expliquées. Il est dès lors utile d’examiner les tendances sous un autre angle, en observant non plus les mots, mais les positions entre les mots. Ces positions sont alors considérées comme des individus et permettent de ne plus distinguer 248
Phrase.0 Phrase.1
P.0
P.1
57615 420 58035
4572 1462 6034
62187 1882 64069
P.0
P.1
29.3 -968.23
-281.83 9312.43
θ
43.9
χ2 = 10583.54, ddl = 1, p = 0 ★★★
TAB . 6.19 – Proportions de marquage expliqué par la ponctuation de la phrase
0 1
FAB
FRE
57615 420 58035
99.28 0.72 100
0 1
0
10000
20000
30000
40000
50000
TAB . 6.20 – Tri à plat de la position (limite de phrase ou non) pour les positions non ponctuées
0 1
FAB
FRE
4572 1462 6034
75.77 24.23 100
0 1
0
1000
2000
3000
4000
TAB . 6.21 – Tri à plat de la position (limite de phrase ou non) pour les positions ponctuées
la ponctuation initiale de la ponctuation finale. Chaque individu est défini par deux variables aux modalités dichotomiques: la première variable spécifie si la position est remplie par un ponctogramme ou non; la valeur de la deuxième variable répond à la question: «Cette position correspond-elle à la limite d’une phrase?». En répondant à ces questions pour toutes les positions entre les mots, on construit la table de contingence 6.19. Il est à peine nécessaire de commenter le rapport de chances. La valeur de ce dernier est si élevée qu’elle autorise à extrapoler: non seulement le lecteur habitué à parcourir des chartes sait que les phrases sont plus fréquemment marquées que les autres propositions, mais, en plus, il s’attend à ce que la plupart, sinon toutes les phrases qu’il rencontrera soient délimitées clairement par l’emploi de la ponctuation. Observons à présent séparément les deux colonnes du tableau de contingence au travers des tris à plats correspondants. La première colonne (table 6.21), qui reprend les positions non marquées, montre que la proportion de phrases est effectivement infime. La deuxième colonne (table 6.20) indique que la description de la ponctuation médiévale ne pourrait se limiter à la définition de la seule tendance selon laquelle la phrase attire le marquage. Les limites des phrases «expliquent» un peu moins du quart des ponctogrammes. d. Relation avec d’autres tendances. D’autre part, il y a lieu de remarquer que le rejet qui caractérise l’association entre MF.Rl et PPD.1 trouve ici une illustration concrète: les subordonnées commencent en effet presque toujours par un relateur – à l’exception des cas de parataxe et des incidentes, que nous traiterons plus loin (→6.1.4.1). Les relateurs seront étudiés de manière détaillée ci-dessous (→6.3).
249
0 1
FAB
FRE
7547 190 7737
97.54 2.46 100
0 1
0
1000
2000
3000
4000
5000
6000
7000
TAB . 6.22 – Tri à plat de PPD pour les prédicats non initiaux
6.1.2
Prédicat
Les tris croisés généraux nous ont appris que les prédicats rejetaient massivement le marquage, à moins qu’ils ne se trouvent en position initiale ou finale (→5.3.3.3 b). Nous allons étudier la ponctuation initiale (→6.1.2.1) et la ponctuation finale (→6.1.2.2) des prédicats qui ne se trouvent pas aux bornes des structures dans lesquelles ils sont intégrés. Nous verrons ensuite le cas particulier du lien entre PPD.1 et les prédicats qui sont les premiers consituants de subordonnées de mode non personnel (1,0,P0,0,0 avec MI.¬pers, →6.1.2.3). 6.1.2.1
P0 et PPD de manière générale
Si nous sélectionnons tous les prédicats qui ne figurent pas en position initiale du constituant qui les contient et que nous faisons le tri à plat de la variable PPD pour ces individus, nous obtenons la table 6.22, qui manifeste clairement la conséquence de la répulsion du marquage initial: la proportion de constituants marqués est minime. a. Tendances par document. Employons à nouveau le même procédé que ci-dessus (→6.1.1.1 a) pour vérifier si la tendance à la répulsion, que nous avons observée en considérant que tous les documents étaient identiques, n’est pas caractéristique d’une ou plusieurs chartes particulières. Dans un premier temps, seul le graphique des répulsions nous retiendra: c’est en effet une tendance à ne pas marquer le prédicat que nous avons pu souligner ci-dessus. Si celle-ci est caractéristique d’un petit ensemble de chartes, il se pourrait bien que la tendance générale observée soit en réalité limitée à ce nombre restreint. Or, il n’en est rien: aucun document ne repousse significativement les ponctogrammes devant P0, comme l’indique la figure 6.13. Il faut noter que ce procédé vise à révéler l’absence de lien significatif, c’est-à-dire H0 . Or, comme on l’a vu plus haut en exposant les concepts de base de la description et de l’inférence statistiques, il n’est pas légitime d’essayer de prouver l’hypothèse nulle (→4.1.3.1). Il importe donc de bien se rendre compte que ces tests, dans la mesure où ils ne mettent pas en évidence d’associations entre les documents et le (non-)marquage, ne prouvent pas l’absence d’attraction ou de répulsion, mais se contentent de dire que les écarts observés ne suffisent pas à se persuader de leur présence. Dans un cas comme celui-là, on peut adopter la position pragmatique suivante: jusqu’à preuve du contraire, étant donné que rien ne prouve qu’il y ait une association, nous estimerons qu’elle n’existe pas. b. Examen du contexte immédiat: tri général. À présent que nous avons admis que la tendance à rejeter PPD.1 est commune à l’ensemble des chartes, interrogeons-nous sur l’environnement de P0. Si le rejet est en effet une tendance bien nette, il n’en est pas pour autant une tendance absolue. Il souffre donc des exceptions. Peut-on remarquer que ces exceptions sont liées à un type de constituant particulier précédant le prédicat?
250
Attractions (seuil adapté 0.0351%)
6/47 (12.8%) 4/33 (12.1%) 12/205 (5.9%) 4/35 (11.4%) 4/37 (10.8%) 3/23 (13.0%) 5/76 (6.6%) 3/36 (8.3%) 4/65 (6.2%) 3/41 (7.3%) 2/20 (10.0%) 3/44 (6.8%) 5/104 (4.8%) 4/78 (5.1%) 4/82 (4.9%) 3/55 (5.5%) 2/28 (7.1%) 2/28 (7.1%) 3/61 (4.9%) 2/34 (5.9%) 3/66 (4.5%) 2/35 (5.7%) 7/203 (3.4%) 3/68 (4.4%) 3/74 (4.1%) 2/41 (4.9%) 1/40 (2.5%) 1/40 (2.5%) 3/75 (4.0%) 1/39 (2.6%) 2/42 (4.8%) 2/42 (4.8%) 1/38 (2.6%) 1/38 (2.6%) 1/37 (2.7%) 1/37 (2.7%) 1/36 (2.8%) 1/36 (2.8%) 1/36 (2.8%) 2/44 (4.5%) 1/35 (2.9%) 1/35 (2.9%) 1/35 (2.9%) 1/12 (8.3%) 1/34 (2.9%) 1/34 (2.9%) 1/33 (3.0%) 1/32 (3.1%) 2/79 (2.5%) 2/48 (4.2%) 2/48 (4.2%) 4/123 (3.3%) 2/75 (2.7%) 1/28 (3.6%) 1/28 (3.6%) 2/51 (3.9%) 1/27 (3.7%) 1/27 (3.7%) 2/52 (3.8%) 3/92 (3.3%) 2/64 (3.1%) 2/64 (3.1%) 2/60 (3.3%) 1/21 (4.8%)
1237−12 1283−02−13b 1272−03 1280−08−14 1281−03 1237−09−16 1270−05−10 1241−09 1268−03−01 1287−09−08 1260−02−03 1288−02b 1263−11 1265−11−13 1275−08 1289−07−19 1236−07 1271−07−07a 1289−04−19 1282−03−03 1263−03−31 1277−07−01 1289−01−12 1290−08−24 1263−05−27a 1277−05−19 1259−01−16 1270−04−07 1271−05−22 1281−03−03 1277−03−23 1288−02a 1274−02−24 1283−05−02 1281−06−06 1286−05−15 1249−06−25 1271−12−03a 1282−02−01a 1265−05a 1271−12−03b 1274−09−06 1275−01−10b 1243−08−15 1286−03−23 1287−10 1271−09−17 1274−06−30 1271−04−20 1273−12 1275−01−10a 1267−08−28 1274−05−31b 1260−10−02 1287−06−24 1286−03 1260−02−21b 1268−03−25 1264−04 1247−06 1263−05−27b 1289−03−05 1270−06−06a 1267−10−29
3.99e−05
1
F IG . 6.12 – Attractions entre PPD et le prédicat par document
251
Répulsions (seuil adapté 0.0351%) 1283−02−13a 1278−08−01 1274−05−31a 1276−06−10b 1252−03−01a 1280−05−04 1260−05−09 1280−07−20 1260−02−21a 1273−05−12 1264−09−07 1265−04−15 1278−04−06 1242−05−02 1236−05 1283−12−26 1243−07−09 1270−04−16 1282−12−22 1263−05 1268−08−02a 1268−03−10 1270−09−29 1284−06−09 1289−08−01 1278−12−03 1284−02−12 1285−02−24 1263−05−27c 1260−05−30b 1265−07−04 1270−11−26 1276−02−24 1268−08−02b 1267−07−06 1236−12−15 1276−09−16 1280−05−05 1285−07−04 1289−04−05 1271−12−22 1272−06−22 1265−05b 1267−03−23 1280−08−09 1276−07−22 1270−06−06b 1284−05−11 1276−06−10a 1260−05−14 1263−07−15 1271−03−18 1266−06−13 1260−05−30a 1267−10−22 1271−07−07b 1271−07−25 1271−12−09 1278−10−17 1237−10−12 1253−03−01 1269−02−23 1277−06−12 1270−03−24 1263−07−19 1268−05−31 1272−07−08 1278−04−04a 1252−03−01b 1264−11−29 1275−05−27 1284−10−04 1271−12−03c 1283−02−21 1277−05−04 1244−01−19 1263−07−20 1268−08−02c 1279−03−10 1285−07−21 1255−05−21 1260−06−09
2/292 (0.68%) 0/135 (0.00%) 0/77 (0.00%) 0/76 (0.00%) 0/73 (0.00%) 0/71 (0.00%) 0/70 (0.00%) 1/126 (0.79%) 0/68 (0.00%) 0/68 (0.00%) 0/63 (0.00%) 0/62 (0.00%) 1/116 (0.86%) 0/60 (0.00%) 0/54 (0.00%) 0/51 (0.00%) 0/50 (0.00%) 0/48 (0.00%) 0/48 (0.00%) 0/45 (0.00%) 0/44 (0.00%) 1/95 (1.05%) 0/42 (0.00%) 0/41 (0.00%) 0/41 (0.00%) 1/41 (2.44%) 1/41 (2.44%) 1/41 (2.44%) 0/40 (0.00%) 0/39 (0.00%) 0/39 (0.00%) 1/87 (1.15%) 1/43 (2.33%) 1/44 (2.27%) 1/45 (2.22%) 0/34 (0.00%) 0/33 (0.00%) 0/32 (0.00%) 0/32 (0.00%) 0/32 (0.00%) 1/78 (1.28%) 1/48 (2.08%) 3/165 (1.82%) 0/30 (0.00%) 1/49 (2.04%) 1/76 (1.32%) 0/29 (0.00%) 1/50 (2.00%) 0/28 (0.00%) 1/51 (1.96%) 1/51 (1.96%) 1/51 (1.96%) 1/73 (1.37%) 0/27 (0.00%) 0/27 (0.00%) 0/27 (0.00%) 1/52 (1.92%) 2/90 (2.22%) 1/53 (1.89%) 0/26 (0.00%) 0/26 (0.00%) 0/16 (0.00%) 2/112 (1.79%) 1/69 (1.45%) 0/25 (0.00%) 0/25 (0.00%) 0/25 (0.00%) 1/55 (1.82%) 0/17 (0.00%) 0/24 (0.00%) 0/18 (0.00%) 0/18 (0.00%) 0/23 (0.00%) 0/23 (0.00%) 1/57 (1.75%) 2/107 (1.87%) 0/22 (0.00%) 0/22 (0.00%) 0/22 (0.00%) 0/22 (0.00%) 0/20 (0.00%) 0/20 (0.00%) 0.0718
1
F IG . 6.13 – Répulsions entre PPD et le prédicat par document
252
Attractions (seuil adapté 0.205%) 0,0,C5,0,1 0,0,S1,0,0 1,0,C5,0,1 1,0,A4,0,0 0,0,R3,0,1 0,0,R2,0,0 1,0,A4,¬pers,1 0,0,A4,0,0
38/235 (16.2%) 69/1575 (4.4%) 5/32 (15.6%) 4/23 (17.4%) 2/13 (15.4%) 16/486 (3.3%) 2/34 (5.9%) 2/75 (2.7%) 2.24e−42
1
F IG . 6.14 – Attractions entre PPD et le prédicat par construction précédente Répulsions (seuil adapté 0.205%) 1,0,C5,0,0 0,0,P0,0,0 1,0,S1,0,0 1,0,Rl,0,0 0,0,Co,0,0 0,0,R3,0,0 1,0,C6,0,0 0,0,C6,0,0 0,0,A4,0,1 1,0,R3,0,0 1,0,P0,0,0 0,0,Rl,0,0 0,0,C5,0,0 0,0,R2,¬pers,0 0,0,A4,¬pers,1 1,0,A4,0,1 1,0,R2,0,0
4/1240 (0.32%) 6/778 (0.77%) 4/640 (0.62%) 0/374 (0.00%) 0/351 (0.00%) 0/176 (0.00%) 0/138 (0.00%) 0/124 (0.00%) 0/110 (0.00%) 0/10 (0.00%) 0/11 (0.00%) 0/35 (0.00%) 17/767 (2.22%) 0/17 (0.00%) 0/18 (0.00%) 0/23 (0.00%) 2/105 (1.90%) 2.02e−07
1
F IG . 6.15 – Répulsions entre PPD et le prédicat par construction précédente
En croisant les deux variables (PPD et MMP) pour le premier échantillon,20 nous pouvons décomposer le tableau de contingence (figures 6.14 et 6.15). c. Examen du contexte immédiat: attractions. En observant les attractions, nous essayons de repérer quels environnements permettent à la ponctuation d’apparaître malgré la répulsion manifeste entre PPD.1 et la fonction P0. Ce sont essentiellement les circonstants relatés de nature non propositionnelle qui se démarquent. On peut citer, en guise d’exemples:21 «·/ et a la requeſte mon ſeıgnor · jehan [19] deuant dıt / auonſ noſ míſ noſtre seel auuec le ſíen seel a ceſ preſenteſ lettreſ» (Document 1264–04, 18). «/ et tel hyretage por ces · ıııj · muís et tel cens ke dıt eſt / reportat johans deuant dıs en [14] maíns de maıoírs deuant díſ» (Document 1271–12–09, 13). «¶ je wel ke deſ pluſ aparıllıeſ meules com trouera entourſ mı · ſoıent paıeſ les˘couſtengeſ de me ſepulture» (Document 1272–03, 2). ˘
Dans ces cas, les constituants formant le contexte direct du prédicat font partie de ceux pour lesquels nous avions repéré une tendance au marquage final dans le chapitre précédent (→5.3.3.3). Nous y reviendrons quand nous traiterons les circonstants (→6.1.4). 20 Voir la table de contingence en annexe, 6.1.2.1.table-P0-MMPxPPD. 21 Le P0 est souligné. Voir le relevé complet dep-6.1.2.1.P0-PPD. On y voit que ces constituants
C5, s’ils ne sont pas initiaux, se rencontrent immédiatement après un C6.
253
Les autres types de constituants précédant P0 sont moins faciles à commenter. Ainsi, les formes de 0,0,S1,0,0 sont assez hétéroclites et inattendues,22 étant donné que ce type de constituant est censé rejeter massivement le marquage final. Malgré les difficultés qu’on éprouve à y repérer quelque régularité, on trouve néanmoins la formule _qui le vesture/l’afaitement/. . . fist_ attestée quinze fois – mais on ne peut faire autre chose que simplement relever le phénomène: ’ «· la quele conıſſanche johans condıſt delle roſe cıtaíns [13] de lıege kı lafaıtıſon en fıſt · míſt ens elle warde des homes delle chıſe díeu kí [14] la furent preſens» (Document 1281–06–06, 12).
Par ailleurs, le S1 contient une subordonnée qui s’achève en sa fin dans de nombreux cas; par exemple: «· conute [2] choſe ſoıt a˘chaſcun et a˘tos / que damoıſelle sýbılle fılhe mon ſaıngnor leone cheualır de˘n˙yuelle kı ıa fut / vínt par deuant [3] noſ et par deuant leſ hommeſ de˘le chıeſe deu / entre ſaınte maríe et ſaınt lambert» (Document 1260–05–14, 1). ˘
˘
˘
˘
«· et ſı eſt a ſauoır ke ſe lı doı preudome deuant dıt / v´ cıl kı [13] pour lun v´ pour eaus deus ſeroıent prıs v´ enuoıe au ıour de le taxatıon faıre par lokıſon deuant dıte / preſıſcent [14] vn tıerch pour ce kıl ne ſe porroıent acorder / lı dıs et le taxatıons des deus de ces troıs ſeroıt tenus» (Document 1263–05–27b, 12).
Le seul moyen de traiter efficacement ces attestations serait de prendre en considération tous les niveaux d’intégration syntaxique pour vérifier si ce détail vaut la peine d’être pris en compte. Comme nous l’avons déjà dit, la démarche n’est pas envisageable (→4.2.3). Les A4 simples initiaux sont peu nombreux, ce qui nous donne la possibilité de les énumérer: ’ « · [. . .] foemenſ de touteſ leſ choſeſ deſeure eſcrıteſ · fach ıou mon ſıgneur ıehan de hodege [. . .] et mon ſıgneur ernol de begıenler [. . .]» (Document 1272–03, 43).
«· la ou cıs íugement fut faıs et rendus par˘deuant [22] nos · furent noſtre uoír íureít · et íugeor [. . .]» (Document 1265–11–13, 21). ˘
«[22] · la ov cıſte reconıſſanche fut faíte et cís recors · fut [. . .] radeles dıle» (Document 1275–01–10, 22). «· la ov totes ces choſes deſoíreſcrıtes furent faıtes / furent homes de le cıſe deu» (Document 1274–05–31a, 23).
Il est remarquable que ces constituants soient du type _la ou ces choses furent faites_ dans trois cas sur quatre. Or, pour avoir acquis l’habitude de parcourir des chartes de l’époque, nous savons que la structure en question – tout comme la formule relevée pour S1 – fait partie du style formulaire des documents. Il est évidemment impossible de dépasser la simple constatation, mais nous verrons que ce type de correspondance éventuelle entre une formule et la ponctuation n’est pas limité aux alentours de P0 (par exemple, →6.1.3.9). 22 Voir le dépouillement complet dep-6.1.2.1.P0-MMP00S100-PPD.
254
Les autres attractions dans le contexte immédiat MMP.0,0,R3,0,1 n’atteignent pas le seuil corrigé et ne nous apprennent pas grand-chose: «· nos faıſons ſauoír a˘tous ke nos a damme agnes hubıne de ho˙y / auons en donírs conteís rechıes / quarante˘set · ma rs [4] de˘lıegoıs» (Document 1288–02b, 3). ˘
˘
˘
«[. . .] par la cıteıt [6] ſı que lı banſ dure · a toteſ laıeſ perſones · prendra om vn eſcot par proudomeſ por ceſte dette paıer et [7] anıtır» (Document 1260–02–03, 5).
d. Examen du contexte immédiat: répulsions. Quant au rejet du marquage, il s’agit de la tendance la plus régulière, mais un certain nombre de constituants lui sont particulièrement liés. Seuls les C5 non relatés initiaux s’opposent significativement au marquage. Cela ne concerne en fait que les propositions non personnelles en syntaxe immédiate, du type _devant dit_. «· et [20] ceſ choſeſ deuant dıteſ ſunt faıteſ · lan del jncarnatıon jheſu crıſt · m · cc · et˘tren / [21]teſettíme · el moıs de decembre» (Document 1237–12, 19). ˘
«et auuec [5] ceſ choſeſ deuant díteſ deuonſ noſ reprende del eveske deuant dít sıſıante et dıs marchıeſ de terre ke noſ [6] deuonſ aſeneír a leueſke deuant dít · entre d˙ynant et franchíermont · et entre waromme et la roche» (Document 1242–05–02, 4).
Remarquons que tous les cas où il y a tout de même un ponctogramme sont en bout de ligne: «· [16] [. . .] noſ ıakemínſ maıreſ et lı eſceuín deſor / preſenſ lettreſ [. . .]» (Document 1272–06–22, 16).
[17]
eſcrít auonſ penduſ noſ saıaſ a ceſ
«/ le [29] queıl recor et le queıl temongnage · wılheames de ſaın loren deſeur dıs / míſt ens eno ſtre warde sı ke maíres» (Document 1290–08–24, 28).
[30]
«et par [13] · ce ke les changeſ et leſ conuenanceſ kı cı ſunt devıſeeſ ſoıent pluſ fermeſ et [14] mıelz conuteſ auonſ noſ faıt ſaeleır ceſte lettre del ſael les poures de ˘ſor ·· [15] nommeız» (Document 1260–10–02, 12). ˘
«· et fut deuıſeít la así ke mes ſıres corbeas et lj atre deſoırdít poíoent raquere cel cens deſoırdít dedens doıs ans prochaínement · [16] venant · apres la date de ces lettres preſens · [. . .]» (Document 1275–08, 15). «· et país comandames dant henon deſoír / [22] dít a oes de la maıſon de la ual ſaínt lambert deſoírnomeıe es · vínte boníer daluen deſoírnomez ſı ke [23] droís et loís porte» (Document 1274–05–31a, 21).
Les autres tendances ne dépassent pas le seuil corrigé, mais demeurent révélatrices. Comme on s’y attendait, le fait qu’un P0 en précède un autre ne favorise pas le marquage.23 Ce type de séquence correspond à la construction qui fait se suivre un auxiliaire et un participe:24 «· [13] et por ce que ce ſoít fermement tenut ·/ lı veſkeſ · et lı cuenſ · j ont pendut lorſ · sa˙yauſ» (Document 1236–12–15, 12). 23 Voir le dépouillement exhaustif dep-6.1.2.1.P0-MMP00P000-PPD en annexe. 24 Voir cependant le paragraphe Problèmes de la section Analyses syntaxiques dans les annexes.
255
0 1
FAB
FRE
5451 170 5621
96.98 3.02 100
0 1
0
1000
2000
3000
4000
5000
TAB . 6.23 – Tri à plat de PPF pour les prédicats non finaux «et por co que ce ſoıt ferme 1237–10–12, 6).
[7]
coze je aı pendu mon ſáal a ceſ lettreſ» (Document
Les rares cas marqués sont tous des coordinations: «· et moı prıa mes ſıres et mes freres ſı [29] com ılh auoet en couent a freres de la vaus ſaínt lambert ke ıe totes ces choſes kı deſoure ſunt dıtes [30] greaſſe / loaſſe / et conſentıſſe» (Document 1267–08–28, 28). «· et ceſt h˙yretage ne puet ılh ne ſeı hoır / vendre / deſchangıer / ne oblıgıer [10] ne trecenſer ſens laſſens de˘la maıſon» (Document 1271–05–22, 9). ˘
Les autres rejets pertinents avant correction du seuil sont cohérents avec ce que nous avions relevé: les S1 non propositionnels initiaux, ainsi que les relateurs (→6.3), imposent un rejet important du signe devant eux. 6.1.2.2
P0 et PPF de manière générale
Après avoir observé les relations entre P0 et PPD, voyons ce qu’il en est de la ponctuation finale. Changeons donc d’échantillon pour sélectionner les individus de fonction P0 qui ne se trouvent pas à la finale pour cette nouvelle sélection. Le tri à plat de la variable PPF (tri à plat pour PPF: voir table 6.23). a. Tendances par document. Le graphique des répulsions25 de la modalité PPF.1 par rapport à la référence du document où se trouve l’occurrence ne nous montre aucune tendance significative à repousser PPF.1. Ces ensembles de tests confirment que, jusqu’à preuve du contraire, aucune charte ne se distingue particulièrement des autres en ce qui concerne les répulsions. Il y a du reste un petit nombre de documents qui attirent le marquage plutôt qu’ils ne le rejettent (figure 6.16). Nous n’avons malheureusement pas pu tirer de conclusions à leur sujet. b. Examen du contexte immédiat. Suivant la même progression que pour PPD, nous croisons la présence d’un ponctogramme à la finale avec le type de constituant suivant directement le prédicat. La manière dont les répulsions et les attractions sont différenciées se dessine dans les graphiques 6.17 et 6.18. Il ne nous paraît pas nécessaire d’illustrer les attractions: on voit que les types de constituants attirant significativement le plus d’apparitions de la ponctuation sont les coordonnants et deux types de circonstants, sur lesquels nous reviendrons.26 Cela est clairement en accord avec les tendances générales. Les cas de répulsion les plus importants qui se démarquent statistiquement 25 Voir annexes. 26 Voir, respectivement, →6.1.5 et →6.1.4.
256
Attractions (seuil adapté 0.0351%)
10/44 (22.7%) 18/158 (11.4%) 6/26 (23.1%) 5/31 (16.1%) 4/28 (14.3%) 4/32 (12.5%) 4/35 (11.4%) 5/54 (9.3%) 4/44 (9.1%) 3/27 (11.1%) 2/17 (11.8%) 3/37 (8.1%) 2/19 (10.5%) 2/20 (10.0%) 3/41 (7.3%) 3/42 (7.1%) 4/66 (6.1%) 3/43 (7.0%) 3/43 (7.0%) 2/23 (8.7%) 2/23 (8.7%) 3/50 (6.0%) 5/103 (4.9%) 2/27 (7.4%) 3/53 (5.7%) 2/28 (7.1%) 2/30 (6.7%) 3/56 (5.4%) 2/31 (6.5%) 1/32 (3.1%) 3/62 (4.8%) 1/30 (3.3%) 1/30 (3.3%) 1/29 (3.4%) 1/27 (3.7%) 5/127 (3.9%) 2/39 (5.1%) 1/25 (4.0%) 1/23 (4.3%) 1/13 (7.7%) 2/55 (3.6%) 2/54 (3.7%) 1/19 (5.3%) 1/19 (5.3%) 1/19 (5.3%) 3/81 (3.7%) 1/16 (6.2%) 1/16 (6.2%) 1/17 (5.9%) 1/17 (5.9%) 1/17 (5.9%)
1270−06−06a 1289−01−12 1271−07−07a 1241−09 1287−10 1236−12−15 1272−06−22 1275−08 1237−12 1280−08−14 1260−02−03 1289−07−19 1283−05−02 1237−09−16 1267−07−06 1264−09−07 1263−11 1268−03−01 1290−08−24 1237−10−12 1277−03−23 1273−05−12 1267−08−28 1249−06−25 1263−03−31 1271−12−03a 1289−04−05 1265−11−13 1283−02−13b 1275−01−10a 1277−06−12 1287−09−08 1288−02b 1288−02a 1276−02−24 1265−05b 1286−03 1285−02−24 1274−09−06 1267−10−29 1271−05−22 1289−03−05 1264−11−29 1268−03−25 1277−07−01 1247−06 1252−03−01b 1260−02−21b 1271−12−03c 1283−02−21 1287−06−24
5.21e−13
1
F IG . 6.16 – Marquage final du prédicat par document (attractions)
Attractions (seuil adapté 0.205%)
47/379 (12.4%) 9/141 (6.4%) 6/86 (7.0%) 13/290 (4.5%) 6/119 (5.0%) 18/506 (3.6%) 14/422 (3.3%) 1/13 (7.7%) 2/54 (3.7%)
0,0,Co,0,0 0,1,C5,0,0 0,1,S1,0,0 0,1,C5,0,1 0,1,R2,pers,1 0,0,R2,0,0 0,0,S1,0,0 0,0,R2,pers,1 0,1,R3,0,1
2.65e−27
1
F IG . 6.17 – Attractions entre le prédicat et PPF par construction suivante
257
Répulsions (seuil adapté 0.205%) 0,1,A4,0,1 0,0,P0,0,0 0,1,P0,0,0 0,1,R2,¬pers,0 0,0,A4,0,1 0,0,C5,0,0 0,0,R3,0,1 0,0,R2,¬pers,0 0,1,A4,0,0 0,0,A4,¬pers,1 0,0,R3,0,0 0,0,A4,0,0 0,1,R2,0,0 0,1,A4,pers,1 0,1,A4,¬pers,1 0,0,C5,0,1
0/327 (0.00%) 6/628 (0.96%) 0/161 (0.00%) 0/155 (0.00%) 4/349 (1.15%) 7/396 (1.77%) 2/169 (1.18%) 0/72 (0.00%) 0/67 (0.00%) 0/60 (0.00%) 0/38 (0.00%) 0/37 (0.00%) 13/485 (2.68%) 0/11 (0.00%) 0/19 (0.00%) 10/345 (2.90%) 0.00167
1
F IG . 6.18 – Répulsions entre le prédicat et PPF par construction suivante
concernent d’une part les P0 à la suite d’un 0,1,A4,0,1. Tous les P0 marqués devant un autre P0 sont des coordinations: « [1] noſ [. . .] faıſonſ a ſauoír [. . .] ke noſ [. . .] auonſ · doneíe · ordeneíe · et deuíſeíe · a noſtre volente ceſte forme de paíſ · kı en ceſ letreſ [4] eſt eſcríte» (Document 1241–09, 1, deux formes). «· et sılh auıent en acun tens kı uenrat ke celle halle deuant˘dıte le que [16]le ılh ont fatte a leur propres coſt et aleur propres deſpens / chaet / ardet / v empíret en˘partıe u˘en˘tot / nos [. . .] por lemoıtıet des coſt et des deſpens [. . .] ſummes oblıgıet et aſtraínt» (Document 1263–11, 15). ˘
˘ ˘
˘
«· et ıe por deu et por la prıere mon saıngnor mon frere ce ke fut faıt des [31] vnze boníers par deuant luí et par mes homes / greıe / lou / et conferme» (Document 1267–08–28, 30). «· et moı prıa mes ſıres et mes freres ſı [29] com ılh auoet en couent a freres de la vaus ſaínt lambert ke ıe totes ces choſes kı deſoure ſunt dıtes [30] greaſſe / loaſſe / et conſentıſſe» (Document 1267–08–28, 28). «· et ceſt h˙yretage ne puet ılh ne ſeı hoır / vendre / deſchangıer / ne oblıgıer [10] ne trecenſer ſens laſſens de˘la maıſon» (Document 1271–05–22, 9). ˘
De plus, de nombreux contextes n’attirent jamais le ponctogramme. Ils ont donc une fréquence de marquage de 0%. Néanmoins, cette répulsion ne peut être jugée significative en raison du faible effectif évalué. Gardons à l’esprit que quelle que soit leur position dans les graphiques, ces différents constituants suivant P0 repoussent globalement la ponctuation de manière significative, puisqu’ils se trouvent à la suite d’un prédicat. Ce sont les tendances les plus extrêmes que nous venons de décrire. 6.1.2.3
1,0,P0,0,0 et PPD dans MI.¬pers
Présentons à présent brièvement le cas particulier des individus vérifiant à la fois MM.1,0,P0,0,0 et MI.¬pers, qui se démarquent des autres prédicats par leur attraction vis-à-vis de la ponctuation initiale. En sélectionnant l’échantillon comprenant les prédicats initiaux dans les propositions infinitives ou participiales (table 6.24), on voit qu’ il y a très peu d’attestations de ce lien. Si bien que notre examen doit se limiter à un simple relevé: 258
0 1
FAB
FRE
37 3 40
92.5 7.5 100
0 1
0
5
10
15
20
25
30
35
TAB . 6.24 – Tri à plat de PPD pour les 1,0,P0,0,0 dans ¬pers «[1] · noſ [. . .] faıſons connıſſant a touſ cıas kı verront ceſ preſens lettres · ke freſſens [. . .] acquıſt bıen et loıalment [. . .] víntequatre ſols [. . .] ſor leur maıſon kılh ont adınant [6] et ſor le cortılh deríerle maıſon · kı˘ſıet enle ruwe do couíert puíſh · joındant le maıſon jehan [. . .]» (Document 1255–05–21, 1). ˘
«· meſ ſıreſ gerars de hermeeıſ deman / [6]doít ſor leſ maſuıerſ labeſſe deuant dıtte et le couent · maınent a hermeeıs [. . .] forche et reſteal · et corrueıe» (Document 1263–03–31, 3). «· et se˘príe et requíer auſí a˘manbor de˘la˘moíne deſeur dítte quıl donent [19] et ſoíent tenuſ de doner a˘freres precheurs de˘lıege de ˘ſeur nomeít lettres de˘recogníſance · de · vıj · mars de˘cens deſeur dít / ſaelees de˘ſaeal de˘la˘moíne de˘poures de˘la˘cíteıt de˘lıege» (Document 1283–02–13b, 18). ˘
˘ ˘ ˘
˘
˘ ˘ ˘ ˘ ˘
˘
˘ ˘
˘
˘
˘
Les trois attestations sont tirées de documents différents et ne nous voyons pas quel point commun permettrait de les regrouper. 6.1.2.4
Synthèse
Tirons les premières conclusions de ces examens détaillés. Bien que le travail se soit jusqu’ici focalisé sur le marquage du prédicat, il paraît déjà profitable de généraliser les observations. Les faits relevés inclinent à penser que les tendances mises en évidence au chapitre précédent sont correctes et cohérentes, mais que le modèle qui a servi à les faire émerger souffre de limitations. a. Cohérence à travers tout le corpus. Nous avons pu constater que nous n’étions assuré de la significativité du marquage des P0 que pour un nombre très limité de documents, alors qu’aucune charte ne paraît rejeter particulièrement les ponctogrammes autour du prédicat. Le rejet est donc un phénomène général, qui caractérise très clairement une fonction. Nous en concluons que les scribes ne marquaient généralement pas le prédicat, à moins que quelque chose d’autre que la fonction de ce constituant ne les y pousse, comme le contexte immédiat. b. Examen du contexte immédiat. Le contexte influence manifestement la ponctuation du prédicat de manière très visible. La prise en considération du contexte permet de comprendre les «exceptions à la règle» qui voudraient qu’on ne place pas de ponctogramme devant ou à la suite d’un P0: s’il est présent, le ponctogramme marque très certainement une autre structure, qui attire sa présence par ailleurs. Ainsi, dans les phrases: «et la endroıt míſmeſ loeraí · et fera loer me femme et tenír le paíſ kı eſt fáte entre le glıze et mon / [5] ſegnor ernol de que ıl eſt faıſ eſcrıſ quı enſı encommence · jo ernoſ» (Document 1237–10–12, 4). ’ «· et ſı moıns ıauoıt · v rıenſ ne [17] venıſt · nos deuons del nostre en toz kas paıer les cınquante muís» (Document 1265–05a, 16).
259
il est raisonnable de penser que la présence du ‹·› qui suit loeraí et auoıt est liée au coordonnant. La question de la coordination, que nous n’avions abordée qu’au travers des relateurs coordonnants au chapitre précédent, prend ici une dimension plus complète. Les attestations sont très claires: on ne rencontre de ponctogrammes entre deux P0 de même niveau d’intégration syntaxique que dans le cas d’une coordination. Le phénomène est important, puisque l’environnement, tant précédant que suivant la position en question, est particulièrement réfractaire à la présence du marquage. Nous verrons plus loin comment la relation de coordination, qu’elle soit spécifiée ou non, est liée à la présence d’un ponctogramme (→6.1.5). Malheureusement, les analyses morphosyntaxiques du contexte des prédicats que nous avons pu élaborer ne permettent pas toujours de poser avec autant d’assurance une conclusion de ce type quand le marquage ne correspond pas aux tendances générales. Dans ce cas, il est possible que la ponctuation soit explicable par des structures qui dépassent le cadre du point de vue morphosyntaxique. c. Formules. Le style formulaire des documents n’a pas été pris en considération pour élaborer le modèle d’analyse syntaxique employé. En conséquence, nous n’avons encore aucun moyen de retrouver et de comparer ces formules et de vérifier nos hypothèses à l’aide de tests adéquats. Remarquons simplement leur présence et posons la question (qui restera ouverte) de leur rapport à la ponctuation. Jusqu’à présent, nous avons ainsi repéré (le symbole ‹⊗› représente l’endroit où on peut trouver un ponctogramme): – _x [= représentant de l’autorité] qui l’afaitement fit ⊗ mit en la garde de. . . _; – _la ou ces vestures furent faites ⊗ furent x [= témoins]_. d. Priorité du marquage. Toutes ces constatations sont soutenues par un fait: bien que la force de la répulsion soit considérable et qu’on puisse quasiment parler de règle, le marquage semble prioritaire par rapport au non-marquage. Admettre que la présence d’un ponctogramme peut être liée à une partie seulement de son environnement revient à hiérarchiser ce dernier. Il faut dépasser ce que nous disions plus haut au sujet de: «et la endroıt míſmeſ loeraí · et fera loer me femme et tenír le paíſ kı eſt fáte entre le glıze et mon / [5] ſegnor ernol de que ıl eſt faıſ eſcrıſ quı enſı encommence · jo ernoſ» (Document 1237–10–12, 4).
Le ponctogramme ‹·› n’est pas seulement attiré par le coordonnant: il y a lieu d’ajouter que seul ce dernier conditionne sa présence. Poser la priorité du marquage sur le non-marquage nous met en mesure de répondre à la question posée par la possibilité qu’un phénomène d’absorption (→5.1.3.2 a) soit présent. Lorsque la répulsion est régulière, il n’y a pas d’absorption: le signe présent ne marque pas le constituant qui rejette la présence d’un ponctogramme, mais celui qui le suit ou le précède. On peut d’ores et déjà s’attendre à ce que cette explication convienne à tout ce qui rejette quasi systématiquement la ponctuation, comme c’est le cas des relateurs. Nous aurons l’occasion de le montrer ci-dessous (→6.3).
260
0 1
FAB
FRE
1073 331 1404
76.42 23.58 100
0 1
0
200
400
600
800
1000
TAB . 6.25 – Tri à plat de PPD, pour les constituants de type 0,0,S1,0,0 (niveau: phrase)
6.1.3
Actants et A4
Comme nous allons le voir, les conclusions amenées par l’examen du marquage du prédicat sont loin d’être contredites pas les observations concernant la ponctuation gravitant autour des actants S1, R2, R3 et A4 que nous allons examiner successivement. À partir de cette section et jusqu’à la fin du chapitre, les dépouillements et tableaux qui n’apparaissent pas dans le texte peuvent être consultés dans les annexes.27 Nous les y avons rangés suivant une clef de classement correspondant à leur numéro de section,28 la modalité de MM concernée (sans les virgules de séparation29 ) et la variable ponctuationnelle étudiée. Les différentes tables sont identifiées par la clef table, et les figures par la clé figure. Les tableaux de contingence sont généralement au nombre de deux: un tableau complet (clef all) et un tableau reprenant les modalités dont les effectifs marginaux sont inférieurs à dix (clef fqlt10).30 Quant aux dépouillements, ils sont identifiés par la clef dep. Nous ne renverrons pas systématiquement à ces annexes. Par contre, lorsque le traitement d’un type de constituant aura nécessité des dépouillements et des tests complémentaires mais non reportés dans le texte, nous donnerons le nom de l’annexe correspondante. 6.1.3.1
0,0,S1,0,0 (phrase): PPD
Au niveau d’intégration MI.phrase, lorsqu’il n’est ni initial, ni relaté, ni propositionnel, le sujet attire le marquage initial. Les proportions des modalités de PPD pour ce type de constituant sont représentées dans la table 6.25. En sélectionnant les 0,0,S1,0,0 et en croisant la variable PPD avec la variable correspondant à la référence du document où l’individu apparaît, on obtient les probabilités des figures 6.19 et 6.20. Il est possible que les quelques documents auxquels est associée une probabilité significative d’attraction soient les seuls où le marquage est effectivement attiré – les effectifs sont assez élevés. Si nous retirons de l’échantillon les documents ne dépassant pas le seuil non corrigé (5%) et que nous croisons à nouveau MM et PPD pour les constituants qui n’apparaissent pas à l’initiale, la relation entre 0,0,S1,0,0 et l’attraction reste stable, avec une probabilité de 6.324188e − 23. En d’autres termes, la tendance estbel et bien de portée générale. Observons à présent la manière dont l’environnement influence le marquage ini27 Ces dernières contiennent également tous les tableaux employés dans la présente étude. 28 Parfois, pour des raisons techniques, le numéro est à un niveau hiérarchique supérieur; par
exemple, les tableaux correspondant à la section 6.1.3.1 sont référencés en 6.1.3. 29 Pour des raisons techniques également, le signe ‹¬› est remplacé par not. 30 L’ordre des clefs n’est pas nécessairement fixe.
261
Attractions (seuil adapté 0.0967%)
20/27 (74%) 11/18 (61%) 9/14 (64%) 9/16 (56%) 9/21 (43%) 10/25 (40%) 9/22 (41%) 7/16 (44%) 7/16 (44%) 6/13 (46%) 5/12 (42%) 4/10 (40%) 11/36 (31%) 4/11 (36%) 4/11 (36%) 7/25 (28%) 4/13 (31%) 12/46 (26%) 6/25 (24%) 4/15 (27%) 5/19 (26%)
1274−02−24 1276−06−10a 1268−03−25 1265−05a 1278−08−01 1272−03 1274−05−31a 1260−05−30b 1265−11−13 1263−03−31 1237−12 1243−07−09 1283−02−13a 1242−05−02 1289−07−19 1278−04−06 1265−07−04 1289−01−12 1265−05b 1289−04−19 1276−07−22
1.82e−09
1
F IG . 6.19 – Attractions significatives entre RB et PPD, pour les constituants de type 0,0,S1,0,0 (niveau: phrase)
Répulsions (seuil adapté 0.0967%)
0/28 (0.0%) 1/26 (3.8%) 1/25 (4.0%) 0/15 (0.0%) 1/18 (5.6%) 0/11 (0.0%) 0/11 (0.0%) 0/11 (0.0%) 2/23 (8.7%) 0/10 (0.0%) 0/10 (0.0%) 2/22 (9.1%) 2/21 (9.5%) 1/15 (6.7%) 2/20 (10.0%) 1/14 (7.1%) 2/18 (11.1%) 1/12 (8.3%) 1/12 (8.3%) 3/20 (15.0%) 1/10 (10.0%) 2/15 (13.3%) 2/15 (13.3%) 3/19 (15.8%) 2/14 (14.3%) 2/13 (15.4%) 3/16 (18.8%) 3/14 (21.4%) 2/10 (20.0%) 2/10 (20.0%) 2/10 (20.0%) 2/11 (18.2%)
1244−01−19 1268−03−10 1247−06 1271−03−18 1277−06−12 1263−05−27c 1274−05−31b 1289−03−05 1280−07−20 1259−01−16 1263−05 1271−05−22 1280−05−04 1252−03−01a 1271−12−09 1266−06−13 1271−12−22 1270−03−24 1270−04−16 1267−08−28 1289−04−05 1236−05 1270−05−10 1278−10−17 1265−04−15 1285−07−04 1260−05−09 1276−06−10b 1260−02−21a 1263−11 1264−11−29 1271−04−20
0.00607
1
F IG . 6.20 – Répulsions significatives entre RB et PPD, pour les constituants de type 0,0,S1,0,0 (niveau: phrase)
262
Attractions (seuil adapté 0.394%) 0,0,S1,0,0 1,0,R3,0,1 0,0,C5,pers,1 0,0,C5,0,1 0,0,A4,0,1
88/105 (84%) 74/107 (69%) 55/78 (71%) 46/110 (42%) 7/12 (58%) 1.16e−49
1
F IG . 6.21 – Attractions significatives entre MMP et PPD, pour les constituants de type 0,0,S1,0,0 (niveau: phrase) Répulsions (seuil adapté 0.394%) 0,0,P0,0,0 1,0,C6,0,0 0,0,Co,0,0 1,0,P0,0,0 1,0,R2,0,0 1,0,C5,0,0 1,0,C5,0,1 0,0,C5,0,0
9/343 (2.62%) 2/217 (0.92%) 6/135 (4.44%) 0/41 (0.00%) 2/42 (4.76%) 7/49 (14.29%) 14/74 (18.92%) 5/29 (17.24%) 2.14e−26
1
F IG . 6.22 – Répulsions significatives entre MMP et PPD, pour les constituants de type 0,0,S1,0,0 (niveau: phrase)
tial. Les attractions et répulsions entre le contexte immédiat précédent et la ponctuation initiale sont représentées dans les figures 6.21 et 6.22. Les attractions visibles sont de deux types: soit le contexte immédiat est un autre sujet, soit il est d’un type pour lequel nous avons déjà repéré une tendance à attirer le marquage final. Dans le premier cas, qui rejette H0 avec la probabilité la plus basse, nous avons affaire à une relation de coordination, comme dans: «· et ſı furent auſı sıres [26] gıles de jehagnhe chevalıers · rıgaz de la nouevılhe · et wılheames kon dıſt wıloıe ſes freres · et [27] albers de vıous et pluſour autre teſmoıng» (Document 1266–06–13, 25).
Déjà observé en analysant la ponctuation du prédicat, le lien entre le marquage initial et la coordination apparaît comme de plus en plus plausible. Les autres contextes, comme on le verra ci-dessous au sujet des circonstants (→6.1.4), suffisent généralement à expliquer la présence de ponctuation. À ce stade, il faut conclure que l’attraction observée entre le marquage initial et 0,0,S1,0,0 n’est probablement pas intrinsèquement liée à ce type de constituant, mais plutôt à une série de contextes spécifiques où ces sujets sont attestés. Quant aux répulsions, elle n’ont rien d’étonnant, puisqu’elles correspondent aux répulsions observées entre la ponctuation finale et les prédicats, les C6 et les coordonnants. 6.1.3.2
0,0,S1,0,0 (phrase): PPF
D’après les tendances repérées, les sujets non relatés et non propositionnels attirent également le marquage final. Les proportions sont celles de la table 6.26. Vérifions à nouveau l’association entre le marquage final de 0,0,S1,0,0 et les différents documents du corpus (figures 6.23 et 6.24). Comme pour le marquage initial, un certain nombre de documents ressortent de l’ensemble. En comparant la colonne de gauche du dernier graphique à celle du graphique 6.19, on voit que les documents qui sont significative-
263
0 1
FAB
FRE
1147 257 1404
81.7 18.3 100
0 1
0
200
400
600
800
1000
TAB . 6.26 – Tri à plat de PPF, pour les constituants de type 0,0,S1,0,0 (niveau: phrase) Attractions (seuil adapté 0.0967%) 1274−02−24 1265−05a 1237−12 1276−06−10a 1265−11−13 1268−03−25 1274−05−31a 1265−07−04 1260−05−30b 1278−04−06 1289−04−19 1271−12−09 1276−07−22 1259−01−16 1263−05 1271−05−22 1263−03−31 1266−06−13
25/27 (93%) 11/16 (69%) 9/12 (75%) 11/18 (61%) 8/16 (50%) 7/14 (50%) 9/22 (41%) 6/13 (46%) 6/16 (38%) 8/25 (32%) 5/15 (33%) 6/20 (30%) 5/19 (26%) 2/10 (20%) 2/10 (20%) 5/22 (23%) 3/13 (23%) 3/14 (21%) 8.52e−23
1
F IG . 6.23 – Attractions significatives entre RB et PPF, pour les constituants de type 0,0,S1,0,0 (niveau: phrase) Répulsions (seuil adapté 0.0967%) 1289−01−12 1272−03 1268−03−10 1265−05b 1260−05−09 1280−07−20 1270−04−16 1274−05−31b 1289−03−05 1243−07−09 1260−02−21a 1289−04−05 1236−05 1252−03−01a 1271−03−18 1278−08−01 1265−04−15 1271−12−22 1277−06−12 1283−02−13a 1242−05−02 1263−05−27c 1289−07−19 1271−04−20 1244−01−19 1263−11 1264−11−29 1270−03−24 1280−05−04 1270−05−10 1267−08−28 1285−07−04 1276−06−10b 1247−06 1278−10−17
2/46 (4.3%) 0/25 (0.0%) 1/26 (3.8%) 1/25 (4.0%) 0/16 (0.0%) 1/23 (4.3%) 0/12 (0.0%) 0/11 (0.0%) 0/11 (0.0%) 0/10 (0.0%) 0/10 (0.0%) 0/10 (0.0%) 1/15 (6.7%) 1/15 (6.7%) 1/15 (6.7%) 2/21 (9.5%) 1/14 (7.1%) 2/18 (11.1%) 2/18 (11.1%) 5/36 (13.9%) 1/11 (9.1%) 1/11 (9.1%) 1/11 (9.1%) 2/11 (18.2%) 4/28 (14.3%) 1/10 (10.0%) 1/10 (10.0%) 2/12 (16.7%) 3/21 (14.3%) 2/15 (13.3%) 3/20 (15.0%) 2/13 (15.4%) 2/14 (14.3%) 4/25 (16.0%) 3/19 (15.8%) 0.0217
1
F IG . 6.24 – Répulsions significatives entre RB et PPF, pour les constituants de type 0,0,S1,0,0 (niveau: phrase)
264
Attractions (seuil adapté 0.341%) 0,0,S1,0,0 0,0,Co,0,0 0,1,S1,0,0 0,0,R2,0,0 0,1,A4,0,1 0,0,A4,0,1
88/105 (84%) 41/124 (33%) 7/10 (70%) 25/109 (23%) 2/10 (20%) 5/25 (20%) 2.61e−70
1
F IG . 6.25 – Attractions significatives entre MMS et PPF, pour les constituants de type 0,0,S1,0,0 (niveau: phrase) Répulsions (seuil adapté 0.341%) 0,0,P0,0,0 0,0,C5,0,1 0,0,C5,0,0 0,0,R3,0,1 0,1,R2,¬pers,0 0,1,R2,pers,1 0,1,C5,0,1 0,0,R3,0,0 0,1,R2,0,0
34/440 (7.7%) 13/162 (8.0%) 2/57 (3.5%) 3/46 (6.5%) 1/26 (3.8%) 6/55 (10.9%) 1/13 (7.7%) 2/19 (10.5%) 4/25 (16.0%) 4.87e−13
1
F IG . 6.26 – Répulsions significatives entre MMS et PPF, pour les constituants de type 0,0,S1,0,0 (niveau: phrase)
ment liés au marquage final sont tous observés dans le groupe de ceux qui attiraient le marquage initial. Malgré ces ressemblances, une fois les quelques documents attirant le marquage retirés de l’effectif, les constituants 0,0,S1,0,0 n’attirent plus le marquage au niveau d’intégration MI.phrase. Le graphique des attractions vis-à-vis du contexte immédiat montre que la relation de coordination a un poids particulièrement important, puisque seuls les coordonnants ou d’autres S1 se démarquent effectivement (figures 6.25 et 6.26). Il semble que seules les constructions coordonnées soient particulièrement propices au marquage. Nous concluons donc à nouveau que l’attraction entre 0,0,S1,0,0 et PPF, limitée à quelques chartes, est certainement due au contexte d’occurrence de ces sujets dans une relation de coordination, dont nous avons constaté à plusieurs reprises l’influence sur la ponctuation. La répulsion liée à un contexte immédiat prenant la forme d’un prédicat est cohérente avec l’analyse de ce dernier, tandis que les répulsions propres aux C5 correspondent à ce qui avait été repéré dans l’analyse ci-dessus (→5.3.2.1 b). 6.1.3.3
0,1,S1,pers,1 (phrase): PPD
D’après le tri à plat, l’effectif des actants de fonction sujet qui prennent la forme d’une subordonnée et s’achèvent en fin de phrase est assez réduit, mais les proportions dévoilent une ponctuation relativement fréquente (table 6.27). Aucune charte ne regroupe un effectif suffisant d’attestations pour qu’on puisse tester la distribution du marquage entre les documents.31 Nous ne nous attarderons pas sur la question, pas plus que sur l’examen contrastif du contexte, étant donné la limpide ventilation du tri croisé entre PPD et la forme de la structure précédente (table 6.28). Dans les faits, les 0,1,S1,pers,1 correspondent à un nombre restreint de structures stéréotypées: les 31 Voir annexes.
265
0 1
FAB
FRE
35 14 49
71.43 28.57 100
0 1
0
5
10
15
20
25
30
35
TAB . 6.27 – Tri à plat de PPD, pour les constituants de type 0,1,S1,pers,1 (niveau: phrase)
MMP.0,0,A4,0,1 MMP.0,0,A4,¬pers,1 MMP.0,0,C5,0,0 MMP.0,0,P0,0,0 MMP.0,0,R3,0,1
PPD.0
PPD.1
2 3 2 2 26 35
0 0 0 0 14 14
2 3 2 2 40 49
TAB . 6.28 – Tri croisé entre MMP et PPD, pour les constituants de type 0,1,S1,pers,1 (niveau: phrase)
types _conute chose soit que. . . _ et _est a savoir que. . . _.32 Les exemples sont tous très semblables pour le premier de ces types: «· conute choſe ſoıt a˘chaſcun et atos · que g˙yleſ maıreſ [3] de n˙yuelle et lı eſcheuín de n˙yuelle vınrent par deuant noſ alıege» (Document 1260–05–30b, 2). ˘
«· conute choſe ſoıt achaſcun et atoſ ke lı maıreſ et lı eſcheuín de n˙yuelle deuant noſ a˘lıege» (Document 1260–05–30a, 2).
[3]
vınrent par
˘
Cependant, l’affinité avec le marquage ne concerne que les constructions directement précédées d’un R3, ce qui exclut les attestations impliquées dans la formule du type _est a savoir que. . . _: «et eſt [13] aſauoır aſſı ke parmí ceſte amoíne doıtons faıre ſon anıuerſare · ıııj · foıſ lan a quatre temporas delan» (Document 1284–05–11, 12).
De même, les autres cas – qui ne correspondent pas à des formules – ne sont pas marqués: «· com enſı ſoıt ke nos aıenſ entendut par le verrıteıt de prodomeſ / ke [3] vns beſtens / et vne querele eſtoıt eſmute» (Document 1273–05–12, 2). «· et ſeſt auſı de ma volente et de mon conſentement ke mes ſıres [7] deſor dıs lor a quıtte et done en almoıne sılh auoıt nul droıt de mettre peſchor enſ es eaıwes» (Document 1268–08–02a, 6 et sa copie Document 1268–08–02b, 6).
Nous voyons reparaître ici, de manière encore plus nette qu’à propos du prédicat, une tendance autant liée à la fonction syntaxique du constituant qu’à son emploi dans un style formulaire.
32 Voir le dépouillement exhaustif en annexe.
266
0 1
FAB
FRE
594 154 748
79.41 20.59 100
0 1
0
100
200
300
400
500
TAB . 6.29 – Tri à plat de PPD, pour les constituants de type 0,0,R2,0,0 (niveaux: phrase, ¬pers) Attractions (seuil adapté 0.301%) 1272−03 1283−02−13a 1289−01−12 1247−06 1280−05−05 1274−05−31b
41/63 (65%) 22/34 (65%) 15/36 (42%) 6/11 (55%) 6/11 (55%) 7/17 (41%) 3.14e−19
1
F IG . 6.27 – Attractions significatives entre RB et PPD, pour les constituants de type 0,0,R2,0,0 (niveaux: phrase, ¬pers) Répulsions (seuil adapté 0.301%) 1267−08−28 1260−05−09 1277−06−12 1280−07−20 1265−05b 1276−07−22 1268−03−10 1244−01−19 1270−11−26 1252−03−01a 1263−03−31
0/13 (0.0%) 0/11 (0.0%) 0/11 (0.0%) 0/11 (0.0%) 0/10 (0.0%) 0/10 (0.0%) 1/17 (5.9%) 1/14 (7.1%) 1/12 (8.3%) 1/10 (10.0%) 1/10 (10.0%) 0.132
1
F IG . 6.28 – Répulsions significatives entre RB et PPD, pour les constituants de type 0,0,R2,0,0 (niveaux: phrase, ¬pers)
6.1.3.4
0,0,R2,0,0 (phrase, ¬pers): PPD
Après avoir traité les attractions liées aux constituants de fonction sujet, voyons comment se comportent les régimes. Les proportions de marquage initial de 0,0,R2,0,0 sont représentées dans la table 6.29. Comme nous allons le voir, l’association entre 0,0,R2,0,0 et le marquage initial est soumise à des conditions très limitées. Tout d’abord, un certain nombre de documents manifestent tout particulièrement cette tendance (figure 6.27). Parmi ces six documents, quatre ont la particularité d’être des testaments, comme le protocole de trois d’entre eux33 le montre clairement: «· jou heluís dıtte daıſ [. . .] fach en me boen ſenſ teſtament de˘ touſ meſ bıenſ meuleſ et hıretage · et ordenance [2] enſı com eſcrít˘eſt cı apres» (Document 1272–03, 1). ˘
˘
«· je lambers dele foſſe [. . .] de tos mes bíens [2] que ıe˘aí en mueble et en híretage · a champ et a vılhe˘faı˘deuíſe» (Document 1283–02–13b, 1). ˘
˘ ˘
«· ju baſtíens apeles dawans [. . .] ordenne deuíſe · et faís mon teſtament [. . .] de tos [2] meſ bıens mobles et hıretages enſı ke chí par deſos eſt eſcrıt» (Document 1289–01–12, 1). 33 Voir note 76.
267
Attractions (seuil adapté 0.465%) 0,0,R3,0,1 1,0,R3,0,1 0,0,R3,0,0 0,0,R2,0,0 0,0,C5,0,0 0,0,C5,0,1 0,0,S1,0,0
45/61 (74%) 12/12 (100%) 12/15 (80%) 9/10 (90%) 9/26 (35%) 13/44 (30%) 26/118 (22%) 7.52e−26
1
F IG . 6.29 – Attractions significatives entre MMP et PPD, pour les constituants de type 0,0,R2,0,0 (niveaux: phrase, ¬pers) Répulsions (seuil adapté 0.465%) 0,0,P0,0,0 1,0,C6,0,0 0,0,Co,0,0 0,0,A4,0,1
7/216 (3.2%) 1/88 (1.1%) 5/73 (6.8%) 4/48 (8.3%) 1.19e−13
1
F IG . 6.30 – Répulsions significatives entre MMP et PPD, pour les constituants de type 0,0,R2,0,0 (niveaux: phrase, ¬pers)
De même, la charte 1247–06 constitue une liste de legs: «· s˙yreſ wılheameſ · lı preſtreſ de ſaınt albıer [etc.] funt conıſance · ke damoıſeelhe lıeıarſ fılhe saıngnor t˙yrı de jace at laıſſıet [3] az dammeſ de robermont le moıtıe dum molín kelle tenoıt vltre lez monſ le jardín et les cenſ et lez chaponſ et lez t˙yerchenſ ky já˘partínent [4] al molín ſaz che kelle jat laıſſıet ſus marothe la fılhe ſon antaín dalor · ııj · muj de muture ſa vıe» (Document 1247–06, 1). ˘
En refaisant les tests croisant la variable MM et la variable PPD à tous les niveaux concernés, nous constatons que l’attraction ne subsiste qu’au niveau MI.¬pers (figures 6.29 et 6.30).34 Observons quelques attestations représentatives de ces R2 à l’intérieur des testaments (on repère aisément les R2 qui expriment les legs dans les exemples qui suivent): ’ ’ «¶ je laıſ aſ ponſ de lıege refaere et retenír · x ſols · [27] ¶ al baſ cornıllon · xx ſols en ’pıtance ’ ¶ al hoſpıtal nouıal de’ ſaınt crıſtofle · x ſols et vn lıt · a celuí de ſaınt ıehan baptıste · dıſ ſ · a celuí de tıenlemont ’ [28] ou promıer íuíer ’ · x ſ ¶ pour doner en couteſ’en chemíſeſ et en ſollerſ apres me mort · dız mars ¶ a jehan me frere · xl ſ · a henrıon ſe fıl · xx ſ ¶ a mon ſıgneur ernol preſtre de begıenler · sıgneur gılon provost · aſ deuſ preſtres del hoſpıtal · a ſıgneur wıll de begıenler · [29] sıgneur henrí de lens · sıgneur morıal de lantremengeſ · ’a ceſcun des preſtres de ſaınt denıs et deſ perrochıenſ dou · ’¶ ’ chapıtle nostre damme’ de lıege ·’vn trentel ’ a ceſcune encluſe de líege ’ ’ et ’dou forborc · vj d’ ¶ a ’meſ [30] necıenſ · vaedane · x ſ · adıle ’ · v’ ernol · x ſ · ſ · florette de begıenler · x ſ · agneſ de prıceı · x ſ · auaen le ſereur mon ’ ’ ſıgneur ’ emíſſe de lens · x ſ ¶ a ceſcun deſ enfanſ jehan daıſ · ſens henrıon · xx ſ · et ſıl [31] muerent ’ · voıſent de lun a lautre ¶ a heluıt fılle ıadıſ robın me marıt · dız ſols et’le huge kı fu ſe pere ’ ¶’ a caterıne fılle me frere · vn lıt˘’ et íj´ lıncheıeſ ¶ a damme oſſımont · x ſ · a robın ſe frere · x ſ ¶ ’a [32] heluít fílle me frere · le lıt kı fu damme maghın me ſereur ’¶ a caterıne fılle me frere · lx ſols ſele bıen ſe prveue al dít de meſ foemenſ · et ſe ce non · ſe ſoıent’ donet pour ’ deu ¶ a aelıſ me dammíſele · xx · ſ [33] ¶ a frere ıehan de waremme deſ croıſıeſ · x ſols ſe mí
˘
34 Voir la probabilité dans la première colonne de 6.1.3.00R200PPDstable.
268
0 1
FAB
FRE
1356 254 1610
84.22 15.78 100
0 1
0
200
400
600
800
1000
1200
TAB . 6.30 – Tri à plat de PPF, pour les constituants de type 0,0,R2,0,0 (niveaux: phrase, pers-arg, ¬pers-arg, pers) ’ foement le voıent en ceſt ’ paıſ deuens le promıer demí’ an apres me mort · autrement níent ¶ a mahíllon me nechıen · v ſ · waſſemuet et’ vedelette · [34] ceſcune v ſ ¶ pour querre les orızonſ enſı com boen ſamblera a meſ foemenſ · xl ſ» (Document 1272–03, 26).
«· je˘laís auſí a˘ceſcun preſtre parrochíen de˘lıege enteıl · et por requerre les orıſons a˘ual ſaín creſtofle · v · ma rs · et en˘la˘parroche ſaínt albíer / [47] · ııj · ma rs · a˘labeíe de˘ſolıere · x · ſ · et a maron le fılhe thírí de˘ſaín mort · x · ſ» (Document 1283–02–13b, 46). ˘
˘
˘
˘
˘
˘
˘ ˘
˘
La simple observation de ces attestations laisse voir que les chiffres sont souvent délimités par un ponctogramme les précédant, voire un ponctogramme de part et d’autre. Il est par ailleurs clair, lorsque l’on inspecte les attestations de niveau MI.¬pers,35 qu’une fois les documents les plus fortement marqués retirés de l’échantillon, l’attraction implique surtout les chiffres. Nous avons déjà constaté ci-dessus (→6.1.2.1 ou →6.1.3.3) que le marquage ne pouvait toujours être expliqué à l’aide de l’analyse syntaxique à cause de l’influence que les formules faisaient peser sur les tendances observées. Dans le cas présent, nous sommes à nouveau amené à constater que l’analyse morphosyntaxique ne suffit pas, mais pour une tout autre raison, d’ordre sémantique cette fois: les chiffres ont la particularité d’exprimer une valeur numérique – apparemment, que cette valeur soit exprimée en chiffres «romains» ou non ne change rien à la situation. 6.1.3.5
0,0,R2,0,0 (phrase, pers-arg, ¬pers-arg, pers): PPF
Nous avons remarqué que les constituants 0,0,R2,0,0 étaient liés à la ponctuation finale. Lorsqu’on regarde quelles proportions sont marquées, on obtient: a. Tendances par document. En effectuant les tris croisés (figure 6.31) entre les références des documents et le marquage de ce type de constituant, on voit que trois documents comportent nettement plus d’attestations de 0,0,R2,0,0 que les autres et que la majorité des occurrences qu’ils contiennent sont suivies d’un ponctogramme. Les trois documents qui se démarquent sont trois des testaments attirant également le marquage initial (→6.1.3.4). Si on les retire du corpus et qu’on croise à nouveau MM et PPF, la significativité de l’attraction entre PPF.1 et MM.0,0,R2,0,0 ne subsiste pas au niveau de la phrase.36 b. Examen du contexte immédiat. N’arrêtons pas là. Si nous conservons l’échantillon complet (incluant les trois testaments), nous pouvons voir comment se distribuent les types de constituants qui suivent le plus souvent ces régimes marqués (figures 6.33 et 6.34). Deux des trois types attirant significativement le marquage (les Co et les R2) font 35 Voir dep-6.1.3.4.00R200. 36 Voir 6.1.3.00R200PPFstable.
269
Attractions (seuil adapté 0.0855%)
22/54 (41%) 30/91 (33%) 24/77 (31%) 6/16 (38%) 6/18 (33%) 4/11 (36%) 4/13 (31%) 5/18 (28%) 4/15 (27%) 3/10 (30%) 5/21 (24%) 5/21 (24%) 4/18 (22%) 3/13 (23%) 3/13 (23%) 3/13 (23%) 4/19 (21%) 3/19 (16%) 3/19 (16%) 2/12 (17%) 2/12 (17%) 2/12 (17%) 3/18 (17%) 2/11 (18%) 2/11 (18%) 2/11 (18%) 4/24 (17%) 4/24 (17%) 3/15 (20%) 2/10 (20%) 2/10 (20%)
1289−01−12 1272−03 1283−02−13a 1278−04−06 1274−05−31b 1288−02b 1265−05a 1275−08 1263−07−15 1281−03 1247−06 1263−11 1270−05−10 1263−03−31 1271−12−03b 1289−03−05 1272−06−22 1265−11−13 1271−04−20 1241−09 1263−05 1268−03−01 1278−08−01 1271−12−03a 1288−02a 1290−08−24 1263−05−27a 1273−05−12 1260−05−14 1270−03−24 1277−05−04
8.25e−07
1
F IG . 6.31 – Attractions significatives entre RB et PPF, pour les constituants de type 0,0,R2,0,0 (niveaux: phrase, pers-arg, ¬persarg, pers)
Répulsions (seuil adapté 0.0855%)
0/21 (0.0%) 0/18 (0.0%) 1/27 (3.7%) 0/17 (0.0%) 0/11 (0.0%) 0/11 (0.0%) 0/11 (0.0%) 0/11 (0.0%) 1/20 (5.0%) 0/10 (0.0%) 0/10 (0.0%) 0/10 (0.0%) 0/10 (0.0%) 1/16 (6.2%) 2/23 (8.7%) 1/15 (6.7%) 1/15 (6.7%) 2/21 (9.5%) 2/13 (15.4%) 3/25 (12.0%) 2/14 (14.3%) 2/14 (14.3%) 1/11 (9.1%) 3/21 (14.3%) 2/15 (13.3%) 1/10 (10.0%) 1/10 (10.0%) 1/10 (10.0%) 4/29 (13.8%)
1276−07−22 1260−05−09 1244−01−19 1280−05−05 1259−01−16 1265−04−15 1275−01−10b 1276−06−10b 1268−03−10 1236−05 1243−07−09 1270−09−29 1275−01−10a 1266−06−13 1270−11−26 1260−02−21a 1270−06−06a 1280−07−20 1264−09−07 1267−08−28 1277−06−12 1280−05−04 1274−05−31a 1252−03−01a 1271−12−09 1237−12 1265−07−04 1287−09−08 1265−05b
0.09
1
F IG . 6.32 – Répulsions significatives entre RB et PPF, pour les constituants de type 0,0,R2,0,0 (niveaux: phrase, pers-arg, ¬persarg, pers)
270
Attractions (seuil adapté 0.394%) 0,0,R2,0,0 0,0,Co,0,0 0,1,C5,0,0 0,1,R3,0,1
15/17 (88%) 59/208 (28%) 12/46 (26%) 3/21 (14%) 2.30e−19
1
F IG . 6.33 – Attractions significatives entre MMS et PPF, pour les constituants de type 0,0,R2,0,0 (niveaux: phrase, pers-arg, ¬persarg, pers) Répulsions (seuil adapté 0.394%) 0,1,P0,0,0 0,0,P0,0,0 0,0,C5,0,0 0,0,R3,0,0 0,0,A4,0,1 0,1,C5,0,1 0,0,R3,0,1 0,1,A4,0,1 0,0,C5,0,1
1/154 (0.65%) 15/291 (5.15%) 8/104 (7.69%) 0/18 (0.00%) 2/32 (6.25%) 18/171 (10.53%) 4/41 (9.76%) 4/41 (9.76%) 11/92 (11.96%) 2.81e−06
1
F IG . 6.34 – Répulsions significatives entre MMS et PPF, pour les constituants de type 0,0,R2,0,0 (niveaux: phrase, pers-arg, ¬persarg, pers)
directement penser qu’il y a, de la même manière que pour P0 et S1, une tendance au marquage en cas de coordination. Sur le plan sémantique, ces contextes dans les testaments montrent de longues listes associant des patients (legs) à leur bénéficiaire (légataire), ce qui se traduit morphosyntaxiquement par l’emploi de paires de R2 et R3. En analysant le corpus, nous avons choisi de considérer que les différentes paires associant l’expression des legs à celle des légataires étaient coordonnées,37 ce qui fait de chaque patient un R2 non initial, non propositionnel et non relaté. Il est en effet possible – c’est même la solution qui malmène le moins le modèle38 – de dire, pour le premier des contextes cités, par exemple, que le prédicat principal laıſ est complémenté par chacun des groupes de R2 et R3 qui le suivent. Il faut donc rapprocher cette attraction de celle que nous avons déjà observée plus haut pour les P0 et S1 coordonnés: la relation de coordination est liée à la présence des ponctogrammes. Une autre façon de voir la situation serait de considérer que cet enchaînement de paires (qui peut, comme le premier exemple ci-dessus l’atteste, être très long) défie les contraintes habituelles de taille des constituants grâce à son caractère conventionnel très marqué: dans un testament, on s’attend à rencontrer ce genre de liste. De ce point de vue, on aurait ainsi affaire à une sorte de formule, moins stéréotypée que celles rencontrées aux articulations fondamentales des actes, mais tout de même suffisamment figée pour permettre l’expression d’un message raccourci. Nous parlerons plus des R3 impliqués dans la section qui leur sera dédiée cidessous (→6.1.3.11). Quant à la seule répulsion statistiquement significative, on voit qu’elle concerne 37 Voir le paragraphe Problèmes dans la section Analyses syntaxiques des annexes. 38 Dans l’analyse que nous avions donnée de Document 1272–03 (voir Mazziotta à paraître),
nous avions estimé que les associations en question étaient des énoncés non phrastiques, avec «ellipse du prédicat».
271
0 1
FAB
FRE
6 4 10
60 40 100
0 1
0
1
2
3
4
5
6
TAB . 6.31 – Tri à plat de PPD, pour les constituants de type 0,0,R2,pers,1 (niveau: pers)
1 0
FAB
FRE
17 12 29
58.62 41.38 100
1 0
0
5
10
15
TAB . 6.32 – Tri à plat de PPF, pour les constituants de type 0,0,R2,pers,1 (niveaux: phrase, pers)
MMS.0,0,Co,0,0 MMS.0,0,P0,0,0 MMS.0,1,C5,0,1 MMS.0,1,C5,pers,1
PPF.0
PPF.1
10 1 0 1 12
15 0 1 1 17
25 1 1 2 29
TAB . 6.33 – Tri croisé entre MMS et PPF, pour les constituants de type 0,0,R2,pers,1 (niveaux: phrase, pers)
un environnement correspondant à un P0, ce qui suit la tendance générale et s’écarte des cas que nous venons d’aborder. 6.1.3.6
0,0,R2,pers,1 (pers): PPD
Les quelques attestations relevées ne suffisent pas à effectuer la moindre analyse L’observation des contextes d’occurrence39 n’apporte aucune information que nous ayons pu exploiter40 . 6.1.3.7
0,0,R2,pers,1 (phrase, pers): PPF
Comme on le voit dans le tri à plat (table 6.32), ce type de constituant est très peu attesté, mais fréquemment marqué.41 Aucun document ne peut, à cause des faibles fréquences, être distingué des autres.42 Un tri croisé impliquant les constituants rencontrés à la suite de la structure montre de manière très claire que la coordination joue ici un rôle prépondérant (table 6.33). Le marquage est donc certainement dû à des causes extérieures à l’analyse du constituant en lui-même. 39 Voir les annexes. 40 Voir les tables en annexe. 41 Voir les annexes. 42 Voir les annexes.
272
0 1
FAB
FRE
217 60 277
78.34 21.66 100
0 1
0
50
100
150
200
TAB . 6.34 – Tri à plat de PPD, pour les constituants de type 0,1,R2,0,0 (niveau: phrase) Attractions (seuil adapté 1.70%) 1272−03 1283−02−13a 1289−01−12
12/18 (67%) 10/19 (53%) 6/11 (55%) 6.86e−06
1
F IG . 6.35 – Attractions significatives entre RB et PPD, pour les constituants de type 0,1,R2,0,0 (niveau: phrase) Attractions (seuil adapté 0.73%) 0,0,R3,0,1 0,0,C5,0,1 0,0,C5,0,0
14/25 (56%) 15/34 (44%) 4/11 (36%) 0.00043
1
F IG . 6.36 – Attractions significatives entre MMP et PPD, pour les constituants de type 0,1,R2,0,0 (niveau: phrase) Répulsions (seuil adapté 0.73%) 0,0,P0,0,0 0,0,Co,0,0 0,0,S1,0,0 0,0,A4,0,1
4/80 (5%) 3/27 (11%) 5/26 (19%) 3/14 (21%) 8.38e−07
1
F IG . 6.37 – Répulsions significatives entre MMP et PPD, pour les constituants de type 0,1,R2,0,0 (niveau: phrase)
6.1.3.8
0,1,R2,0,0 (phrase): PPD
Les proportions: indiquent un marquage important, dont on peut voir, d’après le graphique 6.35,43 que seules ressortent quelques attractions, qui concernent deux des testaments relevés quand nous avons étudié 0,0,R2,0,0 (→6.1.3.4). La probabilité44 que l’attraction entre PPD.1 et cette modalité de MM est due à des causes aléatoires est trop forte si l’on retire ces documents du corpus. D’autre part, si l’on examine les constituants qui se rencontrent devant les R2 étudiés (figure 6.36), nous constatons que les tendances sont très proches de celles dans lesquelles les constituants 0,0,R2,0,0 sont impliqués. Au vu de ces similitudes, nous concluons que le marquage initial de 0,1,R2,0,0 n’est, lui non plus, pas dû au régime lui-même, mais à une combinaison de facteurs impliquant son contexte immédiat et le type d’acte juridique enregistré par le document où le constituant est attesté.
43 Aucune répulsion ne se manifeste dans les modalités de RB retenues; voir les annexes. 44 Voir annexe 6.1.3.01R200PPDstable.
273
1 0
FAB
FRE
8 7 15
53.33 46.67 100
1 0
0
2
4
6
8
TAB . 6.35 – Tri à plat de PPD, pour les constituants de type 0,1,R2,pers,1 (niveau: ¬pers-arg)
faisons
h
R2
[savoir]
R2
que. . .
i
F IG . 6.38 – Structure de savoir faisons que. . .
[a savoir]
A4
faisons
R2
relation attributive
que. . .
F IG . 6.39 – Structure de a savoir faisons que. . . (rappel)
6.1.3.9
0,1,R2,pers,1 (¬pers-arg): PPD
Cette structure n’est pas très fréquente, mais plus de la moitié des occurrences sont marquées (table 6.35). Comme cela apparaît nettement dans la table croisant les références au marquage – reléguée aux annexes –, on ne peut pas dire que l’attraction soit cantonnée à certains documents. Un dépouillement complet45 révèle que cette structure correspond en fait à une formule stéréotypée dans nos documents: la construction _savoir faisons que. . . _. Par exemple: «[1] ·· ge jehanſ aínſnes fıs le conte de los faſ ſauoır a touſ ceuls quí ceſ lettres [2] verront et oíront / que la terre que meſ ſıres meſ peres · arnols cuenſ de loſ et de [3] chín˙y a donee et aſſenee en maríage a moí et a ma feme y˙ ſabeau dont ele eſt doé que [4] ge aı promíſ au deuant dıt mon ſeıgnor mon pere par ma foı creantee loıau / [5]ment / deuant mon ſeıgnor · henrí par la grace de díeu eueſque de lıege / que tant [6] come ge víuraí / ıl receura et prendra leſ fruíſ et leſ renteſ» (Document 1264–04, 1). «[4] nos faıſons ſauoír a˘tous / ke nos a damme agnes hubíne de ho˙y auons en donıers conteıs rechıes / quarante set · mars de˘lıe / [5]goıs» (Document 1288–02a, 3). ˘
˘
Malgré le petit nombre d’attestations, la significativité de l’écart, couplée à la possibilité d’observer toutes les occurrences, nous permet de dépasser la simple constatation d’une affinité possible entre une formule et une structure morphosyntaxique: dans ce cas précis, ces deux plans (énonciatif et grammatical) coïncident exactement. Cependant, on trouve des constructions formulaires proches (apparaissant aux mêmes endroits dans les documents ou formées sur les mêmes lexèmes), mais syntaxiquement décrites de manière très différente. Par exemple, si la structure _savoir faisons que. . . _ s’analyse effectivement comme indiqué dans la figure 6.38. La structure _a savoir faisons que. . . _ est par contre décrite dans la figure 6.39.46 45 Voir le dépouillement complet en annexe. 46 Voir →3.4.4.6, où nous justifions cette différence.
274
0 1
FAB
FRE
76 22 98
77.55 22.45 100
0 1
0
10
20
30
40
50
60
70
TAB . 6.36 – Tri à plat de PPF, pour les constituants de type 0,0,R2,¬pers,0 (niveaux: phrase, pers) Attractions (seuil adapté 1.70%) 0,0,Co,0,0 0,1,C5,0,1
6/12 (50%) 10/34 (29%) 0.0382
1
F IG . 6.40 – Attractions significatives entre MMS et PPF, pour les constituants de type 0,0,R2,¬pers,0 (niveaux: phrase, pers) Répulsions (seuil adapté 1.70%) 0,0,C5,0,0
1/12 (8.3%) 0.378
1
F IG . 6.41 – Répulsions significatives entre MMS et PPF, pour les constituants de type 0,0,R2,¬pers,0 (niveaux: phrase, pers)
Or, du point de vue énonciatif, on voit que l’information est portée à la connaissance du récepteur de manière similaire dans les deux cas: le thème (formule) précède le propos. De même, en limitant l’analyse morphosyntaxique au lexique mobilisé pour construire les deux formules, il faut conclure que ce sont les mêmes unités qui sont utilisées. Il y aurait donc lieu de s’interroger sur la cohérence entre les deux formules par rapport à la ponctuation. Malheureusement, il n’est pas possible, faute d’un encodage adéquat, de retrouver toutes les attestations de la deuxième forme (avec un relateur devant savoir), ce qui empêche toute comparaison. 6.1.3.10
0,0,R2,¬pers,0 (phrase, pers): PPF
Le tri à plat est donné dans la table 6.36. Les tests habituels montrent que l’attraction n’est pas spécifique à un petit groupe de documents particuliers.47 L’examen des formes à la suite d’un de ces R2 marqués doit se limiter aux attractions (figure 6.40). Deux observations ressortent de ce graphique. D’une part, les coordonnants occupent à nouveau une position prédominante en matière d’attraction du marquage. Quelques exemples illustrent bien ce genre de cas: «· et noſ lı arbıtre deſor ˘ nomeıt preſıenſ ennoſ le faís del arbıtre [. . .] ke noſ deuıenſ enquerre droıturıerement entre lune parole et lautre · et oír le uerteít a cheſcun» (Document 1263–03–31, 6). ˘
’ «· [16] ¶ ’je laıſ al deſeure dıt henrıon [. . .] v mars · par enſı [. . .] quıl nen puıſt faere don ne deuıſe · aínſ reuıngnent a meſ foemens [. . .]» (Document 1272–03, 15).
D’autre part, bien que l’attraction les concernant de manière indépendante n’atteigne 47 Voir les annexes.
275
0 1
FAB
FRE
347 157 504
68.85 31.15 100
0 1
0
50
100
150
200
250
300
TAB . 6.37 – Tri à plat de PPF, pour les constituants de type 0,0,R3,0,1 (niveaux: phrase, pers-arg, ¬pers-arg, pers) Attractions (seuil adapté 1.70%) 1272−03 1283−02−13a 1289−01−12
29/37 (78%) 43/69 (62%) 8/13 (62%) 3.85e−10
1
F IG . 6.42 – Attractions significatives entre RB et PPF, pour les constituants de type 0,0,R3,0,1 (niveaux: phrase, pers-arg, ¬persarg, pers) Attractions (seuil adapté 0.73%) 0,1,S1,pers,1 0,0,R2,0,0 0,1,R2,pers,1 0,1,R2,0,0
14/40 (35%) 8/21 (38%) 7/32 (22%) 2/10 (20%) 0.00444
1
F IG . 6.43 – Attractions significatives entre MMS et PPF pour les constituants de type 0,0,R3,0,1 (niveau: phrase), réduit
pas le seuil de probabilité de 5%, les autres constituants participant à l’attraction du marquage sont tous des circonstants; les deux types les plus fortement liés à PPF.1 font partie de ceux qui ont été relevés dans le cadre de la recherche de tendances générales (→5.3.3.3). Cette combinaison de facteurs (coordonnant ou circonstant à la suite) «explique» presque toutes les occurrences de ponctogrammes derrière 0,0,R2,¬pers,0. On peut donc se permettre de conclure que ce dernier n’attire pas la ponctuation. 6.1.3.11
0,0,R3,0,1 (phrase, pers-arg, ¬pers-arg, pers): PPF
Certains régimes R3 attirent également PPF; pour les 0,0,R3,0,1, le tri à plat de PPF est dans la table 6.37. a. Tendances par document. La tabulation que nous avons déjà effectuée plusieurs fois est éloquente (le manque d’effectifs empêche de se prononcer à propos des répulsions): quand on regarde les décomptes de près (figure 6.42), on voit que trois documents apparaissent dans les attractions. Ces trois documents sont exactement les mêmes que ceux qui attiraient le marquage à la fin de 0,0,R2,0,0. De fait, en retirant les deux textes significatifs du corpus avant de croiser MM et PPF, on voit que les R3 n’attirent plus significativement PPF.1 qu’au niveau de la phrase.48 Le graphique évaluant les relations entre les contextes immédiats et la ponctuation à ce niveau prend la forme de la figure 6.43.49 Qu’elles attirent ou repoussent la 48 Voir les probabilités 6.1.3.00R301PPFstable. 49 Voir le relevé des attestations en annexe: dep-6.1.3.00R301reduced-PPF.
276
Répulsions (seuil adapté 0.73%) 0,0,C5,0,1 0,0,Co,0,0 0,1,C5,0,1
2/31 (6.5%) 6/57 (10.5%) 2/21 (9.5%) 0.126
1
F IG . 6.44 – Répulsions significatives entre MMS et PPF pour les constituants de type 0,0,R3,0,1 (niveau: phrase), réduit
1 0
FAB
FRE
96 37 133
72.18 27.82 100
1 0
0
20
40
60
80
TAB . 6.38 – Tri à plat de PPF, pour les constituants de type 1,0,R3,0,1 (niveau: phrase)
MMS.0,0,C5,0,0 MMS.0,0,P0,0,0 MMS.0,0,S1,0,0
PPF.0
PPF.1
1 1 33 35
0 0 74 74
1 1 107 109
TAB . 6.39 – Tri croisé MMS × PPF, pour les constituants de type 1,0,R3,0,1 (niveau: phrase, Document 1272-03 retiré)
ponctuation à la suite d’un 0,0,R3,0,1, toutes les constructions suffisamment attestées pour être soumises à un χ2 sont propices à la présence du marquage initial. C’est du moins ce qui est ressorti de la conclusion du chapitre précédent. Par ailleurs, quand le constituant suivant est un R2 non propositionnel, il s’agit la plupart du temps d’un chiffre.50 Pour les niveaux autres que la phrase, il faut donc conclure, comme nous l’avions déjà fait pour la ponctuation finale de 0,0,R2,0,0 (→6.1.3.4) que l’attraction manifestée par 0,0,R3,0,1 vis-à-vis du marquage final est liée à une toute petite partie seulement du corpus, composée de textes d’un type énonciatif tout à fait spécifique (testaments). Au niveau de la phrase, les ponctogrammes sont vraisemblablement dus à une combinaison de facteurs impliquant le contexte immédiat de 0,0,R3,0,1. 6.1.3.12
1,0,R3,0,1 (phrase): PPF
La proportion de présence de ponctuation est ici exceptionnellement élevée (table 6.38). Aucune charte ne contient suffisamment d’attestations pour qu’il soit possible de calculer si elle se distingue particulièrement de l’ensemble. L’examen du contexte immédiat montre que la construction est particulièrement attestée devant un sujet (table 6.39). Par ailleurs, quand le marquage précède systéma-
50 Voir la liste des attestations en annexe: dep-6.1.3.00R301reduced-PPF.
277
0 1
FAB
FRE
327 74 401
81.55 18.45 100
0 1
0
50
100
150
200
250
300
TAB . 6.40 – Tri à plat de PPF, pour les constituants de type 0,0,A4,0,1 (niveaux: pers-arg, ¬pers-arg, pers)
tiquement un sujet,51 la construction se rencontre tout au début de la charte. Elle en constitue ce que les diplomatistes nomment adresse:52 «[1] a tos cheaz kı ces lettres veront / lı maıres et lı eſkeuín de nandren / saluz en deu» (Document 1270–03–24, 1). «[1] a˘ toz ceaz kı ces lettres veront et oront / henrıs cheualıers sıres de hermale saluz et conıſance [2] de verıte» (Document 1271–04–20, 1). ˘
«[1] a toſ cheauſ kı ceſ preſens lettreſ verront et oront ·· lı homme dele chıſe deu font conoıſtre verıteıt» (Document 1274–02–24, 1).
Cependant, la forme de l’adresse est codée dans le type discursif qu’est la charte, et le fait qu’elle précède immédiatement la suscription invite à hésiter: que marque le ponctogramme, en fin de compte? marque-t-il l’adresse? marque-t-il la suscription? D’autant que certains cas non marqués reportent visiblement le signe devant le deuxième mot de la suscription: «[1] atous cheas kı ches preſens lettres vıeront et oront lı ·· homes delle chıſe dıeu / ſalus et conoıſtre verıteít» (Document 1287–06–24, 1).
La fréquence et la cohérence du marquage sont telles que nous devons souligner à nouveau l’importance du style formulaire, bien que nous soyons obligé de le négliger pour l’instant. Du fait que la structure syntaxique correspond presque toujours à la formule d’adresse, il reste envisageable de ne considérer que l’aspect grammatical du constituant et d’en tirer une tendance de ponctuation: 1,0,R3,0,1 attire bien le marquage. 6.1.3.13
0,0,A4,0,1 (pers-arg, ¬pers-arg, pers): PPF
Une importante proportion de 0,0,A4,0,1 sont marqués à la finale (table 6.40). Alors que les effectifs demeurent trop réduits pour qu’on puisse vérifier si un document se démarque particulièrement, on peut par contre observer les contextes immédiats les plus liés au marquage. Selon la figure 6.45, le contexte attirant le marquage final est MMS.0,0,S1,0,0, type de constituant qui attire apparemment le marquage (au niveau de la phrase seulement), mais dont l’examen approfondi révèle que cette tendance est due à des causes 51 En réalité, bien souvent, l’énoncé n’est pas phrastique, mais correspond à un de ceux que
nous avons assimilés à la phrase pour simplifier le traitement (→5.3.2.1). 52 Voir le dépouillement complet en annexe.
278
Attractions (seuil adapté 0.465%) 0,0,S1,0,0 0,1,C5,0,1 0,0,Co,0,0 0,1,C5,0,0 0,0,R2,0,0
26/43 (60%) 9/25 (36%) 13/50 (26%) 3/11 (27%) 3/13 (23%) 3.72e−13
1
F IG . 6.45 – Attractions significatives entre MMS et PPF, pour les constituants de type 0,0,A4,0,1 (niveaux: pers-arg, ¬pers-arg, pers) Répulsions (seuil adapté 0.465%) 0,0,A4,0,1 0,0,P0,0,0 0,1,P0,0,0 0,1,R2,0,0 0,0,C5,0,1 0,1,A4,0,1
3/112 (2.7%) 0/29 (0.0%) 0/13 (0.0%) 1/15 (6.7%) 3/17 (17.6%) 5/29 (17.2%) 6.92e−07
1
F IG . 6.46 – Répulsions significatives entre MMS et PPF, pour les constituants de type 0,0,A4,0,1 (niveaux: pers-arg, ¬pers-arg, pers)
extérieures (→6.1.3.1). Un certain nombre de 0,0,A4,0,1 sont l’expression du lieu dans la partie de la charte que les diplomatistes nomment exposé.53 6.1.3.14
Synthèse
À ce stade, et avant de passer à l’étude des circonstants, on peut synthétiser les découvertes en enrichissant les conclusions auxquelles avait mené l’examen du marquage du prédicat (→6.1.2.4). En règle générale, les faits détaillés complètent cette première synthèse ou mettent en évidence des phénomènes différents. Sans revenir sur les questions de priorité du marquage, nous passerons en revue les autres points abordés à propos du prédicat. a. Cohérence à travers le corpus. La question de la cohérence des liens entre les constituants et la ponctuation à l’intérieur de l’ensemble du corpus prend toute sa dimension lorsque nous étudions les actants. Parfois, nous avons constaté qu’à l’instar des tendances manifestées autour du prédicat, il n’était pas possible de reléguer certaines tendances à un petit groupe de documents, puisque l’intensité des liens (probabilités) restait grosso modo identique, que ces documents soient présents ou non. Dans d’autres cas,54 par contre, les tendances observées sont cantonnées à un très petit nombre de documents, partageant qui plus est une caractéristique commune: il s’agit de testaments. Ce type d’action juridique est d’une telle singularité que sa mise à l’écrit55 rend possible (voire oblige) l’emploi de structures particulières, lesquelles attirent à leur tour une ponctuation spécifique. Dans ce cas, la ponctuation se fait l’indice d’un type discursif particulier. Soyons néanmoins prudent: trois testaments ressortent ainsi du lot, non l’ensemble d’entre eux. . . On pourrait par ailleurs disséquer les différentes attractions et répulsions négligées jusqu’ici pour éventuellement mettre en évidence des groupements de chartes, mais 53 Voir note 78. 54 Par exemple, R2, cf. →6.1.3.4, ou R3, cf. →6.1.3.11. 55 D’après la conception de Marie-Guy Boutier, exposée ci-dessus, sous →3.1.2.1 b.
279
une étude sérieuse à ce sujet nécessiterait que soit clairement défini un protocole de description extralinguistique des documents du corpus, fondé, par exemple, sur un classement en fonction des protagonistes impliqués dans l’acte juridique. De la même manière que P0, le marquage des actants semble associé à des conditions qui les dépassent, de sorte que la plupart des ponctogrammes pourraient être liés à l’environnement des actants plutôt qu’à leurs caractéristiques propres. b. Contexte immédiat. La plupart des constituants attirant le marquage (final) peuvent être mis en relation avec le constituant de même niveau d’intégration qui se trouve directement à leur suite: – 0,0,S1,0,0 est suivi d’un autre sujet ou d’un coordonnant; – 0,0,R2,0,0 (dans certains testaments) est suivi d’un coordonnant, d’un autre R2 ou d’un autre groupe exprimant le patient et le bénéficiaire; – 0,0,R2,¬pers,0 et 0,0,R2,pers,1 sont suivis d’un coordonnant ou d’un circonstant. Il est à présent très clair que les environnements morphosyntaxiques attirant le marquage peuvent être rangés en deux catégories: 1/ ceux qui sont impliqués dans une relation de coordination; 2/ ceux qui sont à proximité d’un circonstant. Presque toutes les attractions mettent en évidence ces mêmes affinités. À ce stade, on voit donc combien il est nécessaire de décrire la ponctuation autour des circonstants et celle qui apparaît en cas de coordination. c. Relations avec les autres points de vue. Aux deux formules semblant attirer le marquage devant le prédicat, il faut ajouter celles qui interviennent aux alentours des actants: – 0,1,R2,pers,1 (→6.1.3.9): _savoir faisons ⊗ que x [= exposé ou dispositif de l’acte]_; – 1,0,R3,0,1 (→6.1.3.12): _a tous ceux qui ces lettres verront . . . ⊗ x [= auteur de l’acte] fait savoir. . . _. Ces formules paraissent liées au marquage et sont de portée générale. On peut dire que les suites d’associations entre les legs et les légataires dans les testaments ont également une forme conventionnelle prévisible, qui attire le marquage – voir les sections sur 0,0,R2,0,0 (→6.1.3.4) et 0,0,R3,0,1 (→6.1.3.11): _a y [= un légataire] ⊗ z [= legs]_
où le ponctogramme marque en quelque sorte l’élision du prédicat (→6.1.3.5). À nouveau, ce recensement de formules remarquables ne peut dépasser la simple constatation, faute de dépouillements exhaustifs. D’autre part, l’examen des attestations de la ponctuation initiale des 0,0,R2,0,0 (→6.1.3.4) mène à considérer le cas du marquage des chiffres (romains ou non), qui paraissent attirer la ponctuation – bien qu’aucun test ne puisse être fait. Si ce lien existe, le marquage ne porte pas sur une structure syntaxique, ni sur une formule propre aux chartes, mais sur un certain contenu, relevant du point de vue sémanticoréférentiel. d. Unités de lecture. Au bout de l’examen du marquage des actants, nous sommes à même d’ajouter un petit nombre de positions supplémentaires à celles qui attirent la ponctuation. Une petite proportion de ponctogrammes «expliqués» complète ainsi la première synthèse que nous avons pu faire au sujet de la phrase (→6.1.1.3). La 280
Act.0 Act.1
P.0
P.1
57158 457 57615
4297 275 4572
61455 732 62187
P.0
P.1
0.86 -72.14
-10.83 909.05
θ
8
χ2 = 988.39, ddl = 1, p = 6e − 217 ★★★
TAB . 6.41 – Proportions de marquage expliqué par la ponctuation des actants
0 1
FAB
FRE
57158 457 57615
99.21 0.79 100
0 1
0
10000
20000
30000
40000
50000
TAB . 6.42 – Tri à plat de la position (limite d’actant ou non) pour les positions non ponctuées
0 1
FAB
FRE
4297 275 4572
93.99 6.01 100
0 1
0
1000
2000
3000
4000
TAB . 6.43 – Tri à plat de la position (limite d’actant ou non) pour les positions ponctuées
liste des actants considérés comme propices à l’apparition d’un ponctogramme est la suivante pour PPD: – 0,1,S1,pers,1, au niveau MI.phrase (→6.1.3.3); – 0,1,R2,pers,1, au niveau MI.¬pers-arg (→6.1.3.9). Pour PPF, la liste est: – 0,0,R3,0,1, uniquement pour Document 1272–03 et Document 1283–02–13b (→6.1.3.11); – 1,0,R3,0,1 (→6.1.3.12); – 0,0,A4,0,1, aux niveaux MI.pers, MI.pers-arg et MI.¬pers-arg (→6.1.3.13). Une fois les limites d’énoncés retirées de l’effectif des positions entre les mots, ces dernières peuvent être définies par deux variables dichotomiques: la ponctuation est attirée à cet endroit par un actant de la liste (oui ou non); la ponctuation est présente ou non. On peut dès lors construire le tri croisé de la table 6.41. Le test du χ2 confirme que les actants sélectionnés attirent bel et bien la ponctuation. On voit toutefois que le rapport de chances est ici plus petit qu’il ne l’était pour les positions aux limites des énoncés (→6.1.1.3 c). Comme en témoignent les effectifs, parmi les constituants non marqués, peu font partie de la catégorie des actants attirant le marquage. Le fait est encore plus perceptible présenté sous la forme d’un tri à plat (table 6.42). Si nous observons les constituants marqués, le tri à plat de la table 6.43, révèle que très peu de ponctogrammes sont expliqués par les tendances de marquage des actants. Néanmoins, bien
281
que peu fréquentes, ces constructions n’en demeurent pas moins régulièrement marquées. Le fait qu’elles ne suffisent même pas à expliquer 10% des occurrences de ponctogrammes n’apparaissant pas aux limites des énoncés ne signifie pas qu’elles soient insignifiantes, mais que l’analyse ne doit pas s’arrêter là: dans la section suivante nous allons voir que l’examen du marquage des circonstants permet d’enrichir substantiellement cet inventaire des positions liées à la ponctuation. 6.1.4
Circonstants
Jusqu’à présent, la position marginale des circonstants d’un point de vue morphosyntaxique se répercute sur leur ponctuation: dans de nombreux cas ci-dessus, le marquage peut être «expliqué» par la proximité directe des constituants avec un circonstant attirant particulièrement la ponctuation. Les configurations morphosyntaxiques qui ont été jugées dignes d’intérêt au terme de l’examen général (→5.3.3.3) seront abordées ci-dessous dans l’ordre suivant: – – – – – – – – – – –
0,0,C5,pers,0; 0,0,C5,0,0 (phrase, ¬pers-arg, ¬pers): PPF; 0,0,C5,0,1 (pers, ¬pers): PPD; 0,0,C5,0,1 (phrase, pers-arg, ¬pers-arg, pers, ¬pers): PPF; 0,0,C5,¬pers,1 (phrase): PPF; 0,0,C5,pers,1 (phrase, pers-arg, pers): PPF; 1,0,C5,pers,1 (phrase): PPF; 0,1,C5,0,0 (phrase, ¬pers-arg, pers, ¬pers): PPD; 0,1,C5,0,1 (phrase, pers-arg, pers): PPD; 0,1,C5,¬pers,1 (phrase, pers): PPD; 0,1,C5,pers,1 (phrase): PPD.
6.1.4.1
0,0,C5,pers,0
De toutes les structures prises par les circonstants, les incidentes prennent la forme la plus susceptible d’une analyse contrastive: nous avons défini l’incidente comme une proposition de mode personnel qui assume la fonction C5 sans être relatée (→3.4.4.5 b). Il faut donc poser la question de la fréquence du marquage de ces structures par rapport à la fréquence du marquage de la phrase. Ces unités, si proches des énoncés, mais dont l’enchâssement trahit la dépendance, sont-elles aussi bien délimitées que le sont les phrases? D’autre part, la seule différence morphosyntaxique entre une subordonnée circonstancielle et une incidente est la présence d’un relateur. Cette proximité a-t-elle un écho dans la ponctuation? Suivant notre modèle, une incidente ne se trouve jamais à la fin ou au début de la phrase, ce qui simplifie la sélection des individus, puisque nous ne sommes pas confronté au phénomène de récursivité, comme c’était le cas lorsqu’il était question de comparer la phrase aux autres subordonnées (→6.1.1). On concevra donc facilement une variable à deux modalités, distinguant les propositions qui sont des phrases d’une part et les incidentes d’autre part. Cependant, lorsque nous avons exposé les choix posés afin de déterminer le niveau d’intégration des C5 (→3.4.7.4 a), nous avons vu qu’en cas de doute, nous avons
282
phrase incidente (phrase) incidente (autre)
0
1
8655 8 15 8678
2675 13 15 2703
11330 21 30 11381
0
1
0.03 ✩✩✩ −4.01 ✩✩★ −2.71 ✩✩✩
−0.09 ✩✩✩ 12.87 ★★★ 8.7 ✩★★
Test exact de Fisher, p = 3.08e − 06 ★★★ Valeur attendue minimale = 4.99
TAB . 6.44 – Tri croisé phrases et incidentes × PPD
considéré que les C5 se trouvaient au niveau le plus élevé de la hiérarchie syntaxique à chaque fois que cela était possible. Certaines incidentes ne peuvent être «remontées» au niveau de la phrase, et leur enchâssement dans un constituant de niveau inférieur à la phrase est manifeste; par exemple: «· je weılh et ordene ke se johans meſ freres v lambon seſ fıls · weılent et puıſſent aſſenner · vı mars [4] de cens híretablement bíen aſſís a eſtímatíon de˘preusdommes / a manbors de ˘lamoíne de˘poures de la cíteít delíege · que [5] lı · vj · mars de˘cens les queís ıaı laſſíes en me teſtament ſor˘ma maıſon dele˘foſſe dont lí manbor de˘lamone ſont rechí [6]ueurſ ’ · et rendeurs a˘ríre a freres precheurs delıege · le ıor de mon annıuerſare cheſcun an · ſoıent quíttes et paıſueles [7] a ıohan me˘frere et a˘lambon ſe˘fılh · et a˘ceas kí apres eaus tenront híretablement le˘maıſon deſeur dítte» (Document 1283–02–13a, 3). ˘ ˘
˘
˘
˘
˘
˘
˘
˘
˘
˘
˘
˘
Pour notre examen, nous avons donc séparé les incidentes qu’il était possible d’analyser comme des C5 de la phrase des autres, ce qui nous permet de créer une variable à trois modalités, suivant le type de structure auquel nous sommes confronté: phrase, incidente (phrase) et incidente (autre). Nous allons donc croiser ces dernières avec les valeurs des modalités PPD et PPF. Nous séparons derechef l’étude de la ponctuation initiale de celle de la ponctuation finale. Pour chacune d’elles, nous examinons d’abord s’il y a une différence entre le marquage de la phrase et celui des deux types d’incidentes, avant d’observer la manière dont se comportent les circonstants propositionnels relatés par rapport aux phrases et aux incidentes. Ces dernières étant peu représentées, il n’est pas possible de s’assurer qu’aucune charte ou contexte immédiat particulier ne correspond à ce type de structure.56 a. Fréquence du marquage initial. En guise de première tabulation, croisons le type de proposition considéré et PPD. On obtient un tableau de six cases (table 6.44). Le test sur l’ensemble du tableau est significatif, mais le contraste entre les cases n’est pas particulièrement marqué. Les deux types d’incidentes se distinguent des phrases par leur attraction vis-à-vis du marquage initial. Si l’on regroupe les incidentes en additionnant les totaux des colonnes des deux dernières lignes en une seule, on obtient la tabulation 6.45, qui indique clairement que les phrases et les incidentes sont globalement distinctes. Le rapport de chances nous apprend que les phrases sont environ quatre fois moins marquées que les incidentes. Qu’en est-il de l’écart entre les différentes sortes d’incidentes? L’analyse du soustableau ne tenant pas compte de la phrase donne la table 6.46. Malgré un rapport de 56 On voit dans les tableaux figurant en annexe qu’il n’y a pas de charte ou de structure parti-
culière qui se retrouve dans l’environnement des incidentes marquées.
283
phrase incidente
0
1
8655 23 8678
2675 28 2703
11330 51 11381
0
1
0.03 -6.49
-0.09 20.84
θ
3.94
χ2 = 25.75, ddl = 1, p = 3.88e − 07 ★★★ Après ajustement de Šidàk pour 2 comparaisons: ★★★ (seuils: 0.0253, 0.00501, 5e-04)
TAB . 6.45 – Tri croisé phrases et incidentes (groupées) × PPD
incidente (phrase) incidente (autre)
0
1
8 15 23
13 15 28
21 30 51
0
1
-0.23 0.16
0.19 -0.13
θ
1.63
χ2 = 0.31, ddl = 1, p = 0.579 ✩✩✩ Après ajustement de Šidàk pour 2 comparaisons: ✩✩✩ (seuils: 0.0253, 0.00501, 5e-04) Valeur attendue minimale = 9.47
TAB . 6.46 – Tri croisé incidentes × PPD
phrase incidente (phrase) C5,pers,1
0
1
8655 8 142 8805
2675 13 16 2704
11330 21 158 11509
0
1
−0.02 ✩✩✩ −4.05 ✩✩★ 3.69 ✩✩✩
0.06 ✩✩✩ 13.19 ★★★ −12.02 ✩★★
Test exact de Fisher, p = 5.91e − 08 ★★★ Valeur attendue minimale = 4.93
TAB . 6.47 – Tri croisé phrases, incidentes et autres circonstants propositionnels × PPD
chances relativement élevé, il n’est absolument pas possible d’inférer un lien entre les variables. Il est vrai que si un test ne parvient pas à rejeter H0 cela ne signifie pas pour autant qu’il faut considérer que cette hypothèse est démontrée (→4.1.3.1), mais les contributions sont si faibles qu’on ne pourrait ignorer la faiblesse du contraste. Il y a donc bien une gradation, qui distingue la phrase de l’incidente, mais aucun moyen de s’assurer que le comportement de la ponctuation varie en fonction de l’insertion syntaxique des incidentes. Examinons à présent le tableau de contingence croisant les phrases, incidentes et autres propositions personnelles subordonnées à la phrase avec PPD (sans tenir compte de celles qui se trouvent en début de phrase, pour lesquelles le marquage interférerait bien évidemment avec celui de la phrase) – il ne paraît pas pertinent d’intégrer les incidentes de niveau inférieur, puisqu’elles constituent des unités qui ne pourraient être comparées aux C5 de phrase. Au niveau de la phrase, les attractions montraient déjà que les incidentes se distinguaient des autres C5 propositionnels de mode personnel. Les tests sur l’échantillon limité confirment cette tendance (table 6.47). Les incidentes sont apparemment
284
incidente (phrase) C5,pers,1
0
1
8 142 150
13 16 29
21 158 179
0
1
-5.23 0.7
27.08 -3.6
θ
14.4
Test exact de Fisher, p = 3.23e − 07 ★★★ Après ajustement de Šidàk pour 2 comparaisons: ★★★ (seuils: 0.0253, 0.00501, 5e-04) Valeur attendue minimale = 3.4
TAB . 6.48 – Tri croisé incidentes et autres circonstants propositionnels × PPD
phrase incidente (phrase) incidente (autre)
0
1
8637 6 11 8654
2702 17 16 2735
11339 23 27 11389
0
1
0.05 ✩✩✩ −7.54 ✩★★ −4.41 ✩✩★
−0.16 ✩✩✩ 23.85 ★★★ 13.97 ★★★
χ2 = 49.98, ddl = 2, p = 1.40e − 11 ★★★ Valeur attendue minimale = 5.52
TAB . 6.49 – Tri croisé phrases et incidentes × PPF
à considérer comme des structures plus proches des phrases que des autres subordonnées circonstancielles. Ensuite, au vu du dernier sous-tableau, on ne pourrait confondre les incidentes et les subordonnées circonstancielles relatées au point de vue de leur marquage initial (table 6.48). La probabilité est également très faible et θ atteint à nouveau une valeur intuitivement perceptible. On peut synthétiser cette description de la ponctuation initiale par une gradation: la phrase est plus marquée que les incidentes, qui sont plus marquées que l’ensemble des autres circonstancielles. b. Fréquence du marquage final. Remarquons tout d’abord que les effectifs sont trop faibles pour pouvoir vérifier si quelque document serait significativement différent de la majorité. Qu’en est-il du marquage final? Si nous construisons un tableau de contingence similaire à celui que nous avons obtenu en croisant les phrases et les différents types d’incidentes avec PPD, remplaçant ce dernier par PPF, nous obtenons la table 6.49. Le résultat de l’analyse statistique de la tabulation est similaire à celui que nous avons observé pour PPD: les incidentes se distinguent des autres propositions étudiées, par une tendance à attirer le marquage. Par ailleurs, la différence de marquage entre les phrases et l’ensemble des incidentes paraît plus forte qu’avec PPD (table 6.50). Enfin, il n’est à nouveau pas possible de distinguer les incidentes entre elles (table 6.51): la valeur du χ2 est si faible qu’il paraît raisonnable de considérer que l’hypothèse nulle n’est certainement pas loin de la réalité. Passons à présent à la comparaison des phrases, incidentes et autres subordonnées circonstancielles qui ne se trouvent pas en fin de phrase. Ces dernières sont, d’après la décomposition de l’écart de la table 6.52, nettement moins marquées que les autres modalités. Par contre, comme on peut le voir dans la table 6.53, la distinction entre les incidentes et les autres subordonnées circonstancielles est très floue. 285
phrase incidente
0
1
8637 17 8654
2702 33 2735
11339 50 11389
0
1
0.05 -11.6
-0.16 36.7
θ
6.2
χ2 = 46.23, ddl = 1, p = 1.05e − 11 ★★★ Après ajustement de Šidàk pour 2 comparaisons: ★★★ (seuils: 0.0253, 0.00501, 5e-04)
TAB . 6.50 – Tri croisé phrases et incidentes × PPF
incidente (phrase) incidente (autre)
0
1
6 11 17
17 16 33
23 27 50
0
1
-0.42 0.36
0.22 -0.19
θ
1.95
χ2 = 0.63, ddl = 1, p = 0.429 ✩✩✩ Après ajustement de Šidàk pour 2 comparaisons: ✩✩✩ (seuils: 0.0253, 0.00501, 5e-04) Valeur attendue minimale = 7.82
TAB . 6.51 – Tri croisé phrases et incidentes (phrase) × PPF
phrase incidente (phrase) C5,pers,1
0
1
8637 6 53 8696
2702 17 85 2804
11339 23 138 11500
0
1
0.46 ✩✩✩ −7.46 ✩★★ −25.27 ★★★
−1.42 ✩✩✩ 23.14 ★★★ 78.37 ★★★
χ2 = 136.13, ddl = 2, p = 2.76e − 30 ★★★ Valeur attendue minimale = 5.61
TAB . 6.52 – Tri croisé phrases, incidentes et circonstants propositionnels × PPF
incidente (phrase) C5,pers,1
0
1
6 53 59
17 85 102
23 138 161
0
1
-0.7 0.12
0.4 -0.07
θ
1.77
2
χ = 0.81, ddl = 1, p = 0.367 ✩✩✩ Après ajustement de Šidàk pour 2 comparaisons: ✩✩✩ (seuils: 0.0253, 0.00501, 5e-04) Valeur attendue minimale = 8.43
TAB . 6.53 – Tri croisé incidentes et circonstants propositionnels × PPF
286
0 1
FAB
FRE
564 134 698
80.8 19.2 100
0 1
0
100
200
300
400
500
TAB . 6.54 – Tri à plat de PPF, pour les constituants de type 0,0,C5,0,0 (niveaux: phrase, ¬pers-arg, ¬pers) Attractions (seuil adapté 0.366%) 1289−01−12 1267−08−28 1247−06 1278−08−01 1265−05b
9/21 (43%) 4/12 (33%) 6/25 (24%) 3/12 (25%) 3/13 (23%) 0.0119
1
F IG . 6.47 – Attractions significatives entre RB et PPF, pour les constituants de type 0,0,C5,0,0 (niveaux: phrase, ¬pers-arg, ¬pers) Répulsions (seuil adapté 0.366%) 1280−07−20 1271−05−22 1270−03−24 1244−01−19 1270−11−26 1272−03 1280−05−04 1283−02−13a 1271−12−09
0/14 (0.0%) 0/10 (0.0%) 1/12 (8.3%) 1/11 (9.1%) 1/11 (9.1%) 3/22 (13.6%) 1/10 (10.0%) 8/42 (19.0%) 2/12 (16.7%) 0.134
1
F IG . 6.48 – Répulsions significatives entre RB et PPF, pour les constituants de type 0,0,C5,0,0 (niveaux: phrase, ¬pers-arg, ¬pers)
c. Synthèse. L’analyse du comportement des incidentes par rapport à ce qui leur ressemble le plus (d’une part les phrases proprement dites, d’autre part les propositions personnelles C5 relatées au niveau de la phrase) montre que les 0,0,C5,pers,0 sont des unités que l’on peut qualifier d’intermédiaires, clairement distinctes des deux autres types de structures. Par contre, il n’est pas possible de distinguer des tendances différentes quant au marquage des différents types d’incidentes. Cette position correspond tout à fait au problème que soulèvent intrinsèquement les 0,0,C5,pers,0: bien que n’étant pas tout à fait des phrases indépendantes, elles sont perçues comme des unités plus autonomes que les subordonnées. À notre avis, devenant l’indice de la conscience linguistique du scribe, la ponctuation reflète cette perception. 6.1.4.2
0,0,C5,0,0 (phrase, ¬pers-arg, ¬pers): PPF
Les proportions de marquage des 0,0,C5,0,0 sont celles de la table 6.54; et l’on peut constater qu’une seule charte attire ce marquage (figure 6.47). En retirant cette charte de l’échantillon, la probabilité que les 0,0,C5,0,0 soient liés à PPF.1 ne change à aucun niveau.57 Comme en témoignent les figures 6.49 et 6.50, peu de contextes immédiats res57 Voir l’annexe 6.1.4.00C500PPFstable.
287
Attractions (seuil adapté 0.366%) 0,1,C5,0,0 0,1,C5,0,1 0,0,R2,0,0 0,0,Co,0,0 0,1,R2,0,0 0,0,C5,0,0 0,1,R2,pers,1 0,0,C5,0,1
38/59 (64%) 21/45 (47%) 12/34 (35%) 8/26 (31%) 5/18 (28%) 10/43 (23%) 3/11 (27%) 10/48 (21%) 2.02e−19
1
F IG . 6.49 – Attractions significatives entre MMS et PPF, pour les constituants de type 0,0,C5,0,0 (niveaux: phrase, ¬pers-arg, ¬pers) Répulsions (seuil adapté 0.366%) 0,0,P0,0,0 0,1,P0,0,0 0,1,R2,¬pers,0 0,0,A4,0,1 0,0,R3,0,1 0,0,S1,0,0
4/181 (2.2%) 0/51 (0.0%) 0/11 (0.0%) 2/18 (11.1%) 5/33 (15.2%) 5/29 (17.2%) 1.65e−11
1
F IG . 6.50 – Répulsions significatives entre MMS et PPF, pour les constituants de type 0,0,C5,0,0 (niveaux: phrase, ¬pers-arg, ¬pers)
0 1
FAB
FRE
294 25 319
92.16 7.84 100
0 1
0
50
100
150
200
250
TAB . 6.55 – Tri à plat de PPD, pour les constituants de type 0,0,C5,0,1 (niveaux: pers, ¬pers)
sortent. En observant les dépouillements,58 on remarque que les attestations relevées au niveau de la phrase sont souvent aux alentours de chiffres. Par exemple: « · ce choſes ſont faıteſ lan del jncarna / [13]tıon noſtre sangeor · mılhe · doıſ cens et trete ſıs · el moıſ de ma˙y» (Document 1236–05, 12). «· cıſte [24] choze et ceſ lettreſ furent faıteſ lan noſtre ſaíngnor · mılh · deucenſ et quarante troız · le londı apreſ leſ otaueſ de le treme» (Document 1244–01–19, 23). «et de cez xa l · ıııj · denıers · revat arríre · j · denıers · al trefonſ» (Document 1247–06, 20).
Toutefois, cette correspondance n’est pas systématique. En outre, aux autres niveaux, les chiffres n’interviennent pas. 6.1.4.3
0,0,C5,0,1 (pers, ¬pers): PPD
Cette construction n’est pas souvent attestée (voir table 6.55). Le seul document qui ressort (figures 6.51 et 6.52) ne perturbe pas les attractions, qui restent identiques si on l’ignore. Quant à l’environnement attirant le marquage, il est essentiellement formé de circonstants (figure 6.53). En observant les attestations, on voit que c’est la 58 Voir en annexe.
288
Attractions (seuil adapté 0.73%) 1270−04−07 1265−11−13 1255−05−21 1278−08−01 1283−02−13a
3/10 (30%) 2/12 (17%) 1/10 (10%) 2/16 (12%) 2/16 (12%) 0.0402
1
F IG . 6.51 – Attractions significatives entre RB et PPD, pour les constituants de type 0,0,C5,0,1 (niveaux: pers, ¬pers) Répulsions (seuil adapté 0.73%) 1265−05b 1271−12−22
0/11 (0%) 0/11 (0%) 0.679
1
F IG . 6.52 – Répulsions significatives entre RB et PPD, pour les constituants de type 0,0,C5,0,1 (niveaux: pers, ¬pers) Attractions (seuil adapté 0.73%) 0,0,C5,0,1 0,0,S1,0,0 0,0,R2,0,0
14/51 (27%) 2/10 (20%) 3/21 (14%) 8.23e−08
1
F IG . 6.53 – Attractions significatives entre MMP et PPD, pour les constituants de type 0,0,C5,0,1 (niveaux: pers, ¬pers) Répulsions (seuil adapté 0.73%) 0,0,P0,0,0 0,0,Co,0,0 1,0,S1,0,0 0,0,C5,0,0
2/102 (2.0%) 0/43 (0.0%) 0/38 (0.0%) 0/15 (0.0%) 0.0130
1
F IG . 6.54 – Répulsions significatives entre MMP et PPD, pour les constituants de type 0,0,C5,0,1 (niveaux: pers, ¬pers)
coordination qui ressort. Par exemple: «· de laterre [. . .] ke damme odıerne et ſez fıs ſıreſ gıles attenue a nodueſ a ramelhıes en dıme groſſe et menue · en patronage de glıse · en cenſ · en chaponſ en terreſ arables et en [4] toteſ atreſ renteſ ſıreſ gıles et ſa˘mere reconoıſent a le glıſe et claıment quıtte le quarte part [. . .]» (Document 1236–05, 2). ˘
«[1] · noſ [. . .] faıſons connıſſant a touſ cıas kı verront ceſ preſens lettres · ke freſſens lı beggíne com [4] dıſt lı dıegle acquıſt bıen et loıalment par nom dachat · a˘lambert vennıſon et a˘ge [5]luj´t ſe femme · víntequatre ſols [. . .] appaıer chaſcon an a˘touſ jourſ ceſ · vıntequatre ſols de cenſ [8] a · ıj´ · termíneſ · moıtíet a feſte ſaín jehan baptıſte · et moıtıet a noıel · par teılh droıt [9] et par teılh amende ke on paíet les atres cens en˘le vılhe de dínant» (Document 1255–05–21, 1). ˘
˘
˘
˘
«· [8] et lı abeſſe et lı couens de robıermont deſordıs reſpondírent encontre eauſ en tel maníere · ke cíls hírretage lor fut [9] doneíz en almoíne · de ıohan le boríoıs et de rau ſe fılh · ſı ke del droıt hoír kı ahíreteıſ en˘fut par le cuert et [10] par les íugeors · sı ke loıs et íugement portet · et ſı quılh aparoít par les lettreſ pendans quılh en˘auoıent de moı · [11] et par les lettres quılh auoıent de mon saıngnor rogıer de waſſenberge · cuí frere ıe ou · et par les oeureſ kı faıteſ en [12] furent par noſ · et par les íugeors kı a íugıer en orent · kı par íugement a˘le requeſte ˘
˘
˘
289
0 1
FAB
FRE
1162 474 1636
71.03 28.97 100
0 1
0
200
400
600
800
1000
TAB . 6.56 – Tri à plat de PPF, pour les constituants de type 0,0,C5,0,1 (niveaux: phrase, pers-arg, ¬pers-arg, pers, ¬pers) Attractions (seuil adapté 0.0777%) 1270−06−06a 1265−11−13 1268−03−01 1263−03−31 1236−12−15 1270−04−07 1275−01−10b 1273−05−12 1288−02a 1272−03 1270−09−29 1272−06−22 1271−07−07a 1275−08 1265−04−15 1288−02b 1255−05−21 1275−01−10a 1263−05−27b 1277−05−04 1270−05−10 1289−01−12 1265−05a 1290−08−24 1278−08−01 1242−05−02
17/22 (77%) 18/27 (67%) 16/24 (67%) 13/20 (65%) 8/11 (73%) 10/16 (62%) 10/16 (62%) 8/15 (53%) 8/15 (53%) 21/55 (38%) 5/10 (50%) 5/10 (50%) 6/13 (46%) 7/16 (44%) 9/22 (41%) 7/17 (41%) 8/22 (36%) 5/13 (38%) 4/10 (40%) 4/10 (40%) 3/10 (30%) 7/24 (29%) 5/15 (33%) 5/16 (31%) 10/33 (30%) 4/12 (33%) 1.66e−06
1
F IG . 6.55 – Attractions significatives entre RB et PPF, pour les constituants de type 0,0,C5,0,1 (niveaux: phrase, pers-arg, ¬persarg, pers, ¬pers) ·· labeſſe et le couent deuant˘dít [13] lor líurarent ceſte terre · par verge · et par meſure · et abonarent · et paıs commandarent par íugement · ſı ke loı porte» (Document 1265–11–13, 7). ˘
6.1.4.4
0,0,C5,0,1 (phrase, pers-arg, ¬pers-arg, pers, ¬pers): PPF
Les proportions de marquage de cette structure sont parmi les plus élevées (table 6.56). a. Tendances par document. La décomposition de la tabulation entre les références et PPF indique que l’attraction est caractéristique de trois documents (sept sans les ajustements, voir figure 6.55). Mais même si l’on retire les 0,0,C5,0,1 contenus dans ces sept chartes de l’échantillon, l’attraction reste du même ordre.59 b. Contexte immédiat. On peut se pencher sans crainte sur l’examen du contexte immédiat à la suite de ces constituants (figures 6.57 et 6.58). Les constructions qui suivent généralement un de ces circonstants marqués sont les coordonnants, les 0,0,S1,0,0 et, dans une moindre mesure, les incidentes et les 0,1,C5,0,0.
59 Les tests figurent en annexe.
290
Répulsions (seuil adapté 0.0777%)
0/18 (0.0%) 7/51 (13.7%) 0/13 (0.0%) 1/18 (5.6%) 2/22 (9.1%) 3/25 (12.0%) 2/20 (10.0%) 2/19 (10.5%) 2/18 (11.1%) 2/17 (11.8%) 3/20 (15.0%) 1/11 (9.1%) 1/10 (10.0%) 1/10 (10.0%) 2/14 (14.3%) 3/18 (16.7%) 4/22 (18.2%) 2/13 (15.4%) 2/13 (15.4%) 5/25 (20.0%) 3/17 (17.6%) 3/17 (17.6%) 3/16 (18.8%) 2/12 (16.7%) 2/12 (16.7%) 2/12 (16.7%) 8/33 (24.2%) 6/25 (24.0%) 3/14 (21.4%) 3/14 (21.4%) 5/21 (23.8%) 2/10 (20.0%) 2/10 (20.0%) 4/17 (23.5%) 4/17 (23.5%) 3/11 (27.3%) 3/13 (23.1%) 13/45 (28.9%) 4/15 (26.7%) 3/12 (25.0%)
1274−05−31b 1265−05b 1260−02−21a 1274−05−31a 1271−12−09 1267−08−28 1271−12−22 1270−04−16 1276−06−10b 1266−06−13 1280−07−20 1278−04−06 1263−05 1283−12−26 1260−05−09 1276−07−22 1270−11−26 1271−03−18 1271−07−07b 1271−04−20 1264−09−07 1270−03−24 1287−09−08 1247−06 1263−05−27c 1271−12−03a 1263−11 1263−05−27a 1236−05 1284−05−11 1271−05−22 1260−05−14 1283−02−13b 1244−01−19 1252−03−01a 1277−06−12 1264−04 1283−02−13a 1265−07−04 1276−06−10a
0.0138
1
F IG . 6.56 – Répulsions significatives entre RB et PPF, pour les constituants de type 0,0,C5,0,1 (niveaux: phrase, pers-arg, ¬persarg, pers, ¬pers)
Attractions (seuil adapté 0.270%)
130/327 (40%) 9/11 (82%) 51/121 (42%) 40/103 (39%) 6/10 (60%) 21/65 (32%) 7/22 (32%) 15/50 (30%)
0,0,Co,0,0 0,0,C5,pers,0 0,0,S1,0,0 0,1,C5,0,0 0,1,A4,pers,1 0,0,R2,0,0 0,0,R3,0,1 0,1,R2,0,0
1.43e−06
1
F IG . 6.57 – Attractions significatives entre MMS et PPF, pour les constituants de type 0,0,C5,0,1 (niveaux: phrase, pers-arg, ¬persarg, pers, ¬pers)
291
Répulsions (seuil adapté 0.270%) 0,0,P0,0,0 0,0,C5,pers,1 0,1,A4,0,1 0,1,P0,0,0 0,0,A4,0,1 0,1,C5,0,1 0,0,C5,0,1 0,0,C5,0,0 0,1,R3,0,1 0,0,C6,0,0 0,1,R2,pers,1
38/219 (17%) 0/16 (0%) 0/16 (0%) 0/16 (0%) 5/37 (14%) 34/144 (24%) 41/170 (24%) 24/101 (24%) 3/16 (19%) 8/33 (24%) 13/47 (28%) 7.43e−05
1
F IG . 6.58 – Répulsions significatives entre MMS et PPF, pour les constituants de type 0,0,C5,0,1 (niveaux: phrase, pers-arg, ¬persarg, pers, ¬pers)
0 1
FAB
FRE
11 7 18
61.11 38.89 100
0 1
0
2
4
6
8
10
TAB . 6.57 – Tri à plat de PPF, pour les constituants de type 0,0,C5,¬pers,1 (niveau: phrase)
1 0
FAB
FRE
115 66 181
63.54 36.46 100
1 0
0
20
40
60
80
100
TAB . 6.58 – Tri à plat de PPF, pour les constituants de type 0,0,C5,pers,1 (niveaux: phrase, pers-arg, pers)
6.1.4.5
0,0,C5,¬pers,1 (phrase): PPF
Nous ne pouvons dégager de tendances claires sur la base des attestations examinées, si ce n’est que deux d’entre elles figurent dans le document 1272–03 et sont marquées comme les 0,0,R3,0,1 que nous avons analysés ci-dessus (→6.1.3.11): ’ «¶ je laıſ aſ ponſ de lıege refaere et retenír · x ſols ’ [. . .] ¶ pour doner en couteſ en chemíſeſ et en ſollerſ [28] ou promıer íuíer apres ’me mort · dız mars ¶ [. . .] ¶ pour querre les orızonſ enſı com boen ſamblera a meſ foemenſ · xl ſ» (Document 1272–03, 26).
Il est plausible que la dimension sémantique prime dans ce contexte. 6.1.4.6
0,0,C5,pers,1 (phrase, pers-arg, pers): PPF
La structure est également très souvent marquée (table 6.58). L’attraction (figure 6.59) ne semble pas limitée à une charte en particulier60 et l’examen du contexte (figures 6.61 et 6.62) ne nous en apprend pas davantage.
60 Voir le tableau en annexe.
292
Attractions (seuil adapté 1.70%) 1272−03 1265−05b
16/19 (84%) 9/10 (90%) 0.0841
1
F IG . 6.59 – Attractions significatives entre RB et PPF, pour les constituants de type 0,0,C5,pers,1 (niveaux: phrase, pers-arg, pers) Répulsions (seuil adapté 1.70%) 1247−06
1/11 (9.1%) 0.000388
1
F IG . 6.60 – Répulsions significatives entre RB et PPF, pour les constituants de type 0,0,C5,pers,1 (niveaux: phrase, pers-arg, pers) Attractions (seuil adapté 1.70%) 0,0,S1,0,0 0,0,Rl,0,0
68/96 (71%) 7/10 (70%) 0.0474
1
F IG . 6.61 – Attractions significatives entre MMS et PPF, pour les constituants de type 0,0,C5,pers,1 (niveaux: phrase, pers-arg, pers) Répulsions (seuil adapté 1.70%) 0,0,C5,0,0
5/14 (36%) 0.048
1
F IG . 6.62 – Répulsions significatives entre MMS et PPF, pour les constituants de type 0,0,C5,pers,1 (niveaux: phrase, pers-arg, pers)
0 1
FAB
FRE
5 5 10
50 50 100
0 1
0
1
2
3
4
5
TAB . 6.59 – Tri à plat de PPF, pour les constituants de type 1,0,C5,pers,1 (niveau: phrase)
6.1.4.7
1,0,C5,pers,1 (phrase): PPF
Le peu d’attestations dans le corpus (voir table 6.59) ne nous laisse d’autre choix que de les citer: « · se vnſ hom dıſt laıt a autre · v ·» ſouſ doít (Document 1241–09, 4). «· ſe vnſ hom fıert autre ſanſ ſaínc [5] corant · xx · ſols doít» (Document 1241–09, 4). ’ «· ¶ sıl eſt deuenſ leſ deuſ promıers ans apres [14] me mort generauſ paſſageſ outre mer · je laıſ a˘le croíſ díx marſ de líeíoes» (Document 1272–03, 13).
˘
«¶ se ıe _ſuí _tenue_ pour mı v pour autrvı par promeſſe’ v par autre raıſon · a perſone v a˘líu a cuí ıe aıe laıſſıet v donet en ceſt eſcrıt v autrement · íe wel [37] que tout ſoet en paıement ·/ ſe ıe ne le deuıſe nommeement a paıer» (Document 1272–03, 36). ˘
293
0 1
FAB
FRE
303 106 409
74.08 25.92 100
0 1
0
50
100
150
200
250
300
TAB . 6.60 – Tri à plat de PPD, pour les constituants de type 0,1,C5,0,0 (niveaux: phrase, ¬pers-arg, pers, ¬pers) Attractions (seuil adapté 1.70%) 1265−05b
6/11 (55%) 0.0646
1
F IG . 6.63 – Attractions significatives entre RB et PPD, pour les constituants de type 0,1,C5,0,0 (niveaux: phrase, ¬pers-arg, pers, ¬pers) Répulsions (seuil adapté 1.70%) 1272−03 1283−02−13a
1/17 (5.9%) 5/20 (25.0%) 0.100
1
F IG . 6.64 – Répulsions significatives entre RB et PPD, pour les constituants de type 0,1,C5,0,0 (niveaux: phrase, ¬pers-arg, pers, ¬pers) Attractions (seuil adapté 0.639%) 0,0,C5,0,0 0,0,C5,0,1
39/64 (61%) 36/92 (39%) 9.76e−12
1
F IG . 6.65 – Attractions significatives entre MMP et PPD, pour les constituants de type 0,1,C5,0,0 (niveaux: phrase, ¬pers-arg, pers, ¬pers) «· quant chefut faít ·· lı homme dele chıſe deu / lı commandarent enſ país · et lı fıſent toteſ les droıtureſ / ſı com [15] ſuelt faıre atels veſtureſ» (Document 1274–02–24, 14).
Certains signes figurent devant des chiffres, mais les effectifs sont si faibles que nous ne pouvons nous prononcer. 6.1.4.8
0,1,C5,0,0 (phrase, ¬pers-arg, pers, ¬pers): PPD
Les proportions de marquage sont figurées dans la table 6.60. Pour peu qu’on puisse observer les associations entre PPD et certains documents (l’effectif est généralement insuffisant pour ce faire), elles sont toutes non significatives (figures 6.63 et 6.64).61 Quand on regarde de près quelles structures précèdent ces circonstants, on voit que ce sont principalement d’autres circonstants qui attirent significativement la présence du ponctogramme. Si l’on observe les attestations, on découvre que l’eschatocole revient fréquemment:62 61 Voir le tableau en annexe. 62 Voir le dépouillement complet en annexe.
294
Répulsions (seuil adapté 0.639%) 0,0,P0,0,0 0,0,Co,0,0 0,0,S1,0,0 0,0,R3,0,1 0,0,R2,0,0 0,0,A4,0,1
7/109 (6.4%) 0/12 (0.0%) 1/12 (8.3%) 2/16 (12.5%) 11/51 (21.6%) 4/21 (19.0%) 1.11e−07
1
F IG . 6.66 – Répulsions significatives entre MMP et PPD, pour les constituants de type 0,1,C5,0,0 (niveaux: phrase, ¬pers-arg, pers, ¬pers)
LCF.0 LCF.1
PPD.0
PPD.1
344 20 364
87 31 118
431 51 482
TAB . 6.61 – Tri croisé position finale ou non × PPD
0 1
FAB
FRE
697 132 829
84.08 15.92 100
0 1
0
100
200
300
400
500
600
TAB . 6.62 – Tri à plat de PPD, pour les constituants de type 0,1,C5,0,1 (niveaux: phrase, pers-arg, pers) «· cıſte [24] choze et ceſ lettreſ furent faıteſ lan noſtre ſaíngnor · mılh · deucenſ et quarante troız · le londı apreſ leſ otaueſ de le treme» (Document 1244–01–19, 23).
«· che fut faıt en lan del ıncarnatıon noſtre saıngnour ıhesucrıſt · mo · derrıen ıour de march» (Document 1263–03–31, 30).
[31]
· cco · lxııjo · le
«· chefut faıt et doneít · lan et les jours deſeur nomeís» (Document 1289–07–19, 22).
On peut vérifier cette association entre la fin de l’eschatocole et le marquage initial en tabulant une variable binaire indiquant si le constituant est ou non à la fin de la charte (LCF) avec la variable PPD (tableau 6.61). Le tri croisé est parlant (χ2 = 38.4907, p = 5.502e − 10): l’association entre la position en fin de charte et ce marquage est nette. Ce qu’on découvre ici est donc à la limite de la morphosyntaxe et fait à nouveau entrer en jeu le style formulaire. 6.1.4.9
0,1,C5,0,1 (phrase, pers-arg, pers): PPD
La proportion de 0,1,C5,0,1 marqués à l’initiale est appréciable (table 6.62). Elle ne paraît pas liée à un document en particulier (la probabilité de H0 est très élevée pour tous les documents, cf. figures 6.67 et 6.68). L’affinité du marquage et d’un contexte immédiat constitué d’un autre circonstant est à nouveau très claire (figure 6.69). Les 0,1,C5,0,1 prennent des formes très di295
Attractions (seuil adapté 0.270%) 1283−02−13a 1271−04−20 1270−05−10 1278−08−01 1270−11−26 1236−05 1272−03 1273−05−12
9/45 (20%) 3/12 (25%) 3/13 (23%) 3/13 (23%) 2/12 (17%) 2/11 (18%) 7/39 (18%) 2/10 (20%) 0.576
1
F IG . 6.67 – Attractions significatives entre RB et PPD, pour les constituants de type 0,1,C5,0,1 (niveaux: phrase, pers-arg, pers) Répulsions (seuil adapté 0.270%) 1267−08−28 1268−03−10 1244−01−19 1266−06−13 1265−11−13 1271−12−09 1260−05−09 1271−12−22 1289−01−12 1276−06−10b 1265−05b
0/12 (0.0%) 0/12 (0.0%) 0/10 (0.0%) 0/10 (0.0%) 1/12 (8.3%) 1/12 (8.3%) 1/11 (9.1%) 1/11 (9.1%) 3/21 (14.3%) 1/10 (10.0%) 2/16 (12.5%) 0.262
1
F IG . 6.68 – Répulsions significatives entre RB et PPD, pour les constituants de type 0,1,C5,0,1 (niveaux: phrase, pers-arg, pers) Attractions (seuil adapté 0.568%) 0,0,C5,0,0 0,0,C5,0,1 0,0,A4,0,1 0,0,R2,¬pers,0
24/53 (45%) 30/107 (28%) 15/56 (27%) 12/44 (27%) 5.1e−09
1
F IG . 6.69 – Attractions significatives entre MMP et PPD, pour les constituants de type 0,1,C5,0,1 (niveaux: phrase, pers-arg, pers) Répulsions (seuil adapté 0.568%) 0,0,P0,0,0 0,0,Co,0,0 0,0,S1,0,0 0,0,R2,0,0 0,0,R3,0,1
7/213 (3.3%) 1/80 (1.2%) 2/53 (3.8%) 22/162 (13.6%) 4/28 (14.3%) 9.54e−09
1
F IG . 6.70 – Répulsions significatives entre MMP et PPD, pour les constituants de type 0,1,C5,0,1 (niveaux: phrase, pers-arg, pers)
verses et nous n’avons pu dégager de points communs fréquents pour les occurrences ponctuées.63 6.1.4.10
0,1,C5,¬pers,1 (phrase, pers): PPD
Cette structure, qui prend la forme d’une infinitive relatée, est également très peu attestée (table 6.63). En conséquence, il est prévisible qu’aucun document ne contienne
63 Voir le dépouillement en annexe.
296
0 1
FAB
FRE
30 12 42
71.43 28.57 100
0 1
0
5
10
15
20
25
30
TAB . 6.63 – Tri à plat de PPD, pour les constituants de type 0,1,C5,¬pers,1 (niveaux: phrase, pers)
0 1
FAB
FRE
21 9 30
70 30 100
0 1
0
5
10
15
20
TAB . 6.64 – Tri à plat de PPD, pour les constituants de type 0,1,C5,pers,1 (niveau: phrase)
assez d’occurrences de la construction pour qu’on puisse tester son association.64 Cependant, et la différence avec la structure qui précède est majeure, ces C5 marqués sont très cohérents: un coup d’œil sur les attestations, dont voici les trois premières,65 «· et ſıl auenoít que lı eueſkeſ [11] ſe pleínſıſt que hon lı feíſt tort ·/ noſ deuonſ enuoíer douz de noſ homeſ la v on lí [12] feroıt tort ·/ por ſauoír ſe on lı˘ faſoít tort v non» (Document 1243–07–09, 10). ˘
«· et ſı neſt enſı ſe˘rauenrat le maıſon maıntenant · por achateır vín [19] et oſtez al ſacrament» (Document 1247–06, 18). ˘
«· et par lor jugement cele díme groſſe et menue [11] de peres rendıemes nos a la maıſon deuant dıte · por tenír et recíuoır perpetuement [12] sı comme˘lour dıme lıgement» (Document 1265–05b, 10). ˘
montre que le relateur employé est toujours por. On avait pu admettre, au vu des sections précédentes – étude du prédicat (→6.1.2.1) et des actants (→6.1.3) –, que la ponctuation ne dépendait pas uniquement de la morphosyntaxe, mais qu’elle suivait certainement des tendances liées à la structure énonciative des documents et au style formulaire. Avec ce type de structure, on peut en outre s’interroger sur les mots employés pour marquer les relations et étendre la question de la ponctuation aux considérations portant sur lexique employé. 6.1.4.11
0,1,C5,pers,1 (phrase): PPD
Cette fois, plus du quart des constituants de ce type attirent le marquage (table 6.64). La tabulation – reléguée aux annexes – entre les références des documents et le marquage laisse voir qu’aucun texte ne rassemble suffisamment d’attestations pour être évalué.
64 Voir le tableau en annexe. 65 Voir le dépouillement complet en annexe.
297
Du reste, les constructions correspondant à ce type sont très variées. À titre d’exemple, on peut citer:66 «· et chaſcune de noſ partıeſ · at ceſ le [19]treſ ſemblanz mot a˘mot eſcrıteſ · keleſ ne puıſſent eſtre changıeſ ne muees» (Document 1237–12, 18). ˘
«· et ce paıment doıent ılh [8] faıere des díj´s muıs enſı com ılh eſt deuıſet de moıs en moız entırement · quenke molın auenge» (Document 1252–03–01a, 7). «· lı quel quatre repromíſent [12] couent a tenír de part mon ſaıngnor gerar de quarante marſ de lıgoıs · ſılh eıſſoít de nos dís» (Document 1263–03–31, 11). «· les˘quez nos paıerons tant ke nos víuerons · et la maıſons [14] apres le deces de nos et dame adeılhıen deuant dıte · quant elle entırement la dıme recíuerat» (Document 1265–05a, 13). ˘
Si bien que nous n’avons pu leur trouver un point commun qui les caractériserait. 6.1.4.12
Synthèse
a. Cohérence. Bien que souvent trop peu représentées pour permettre un test en bonne et due forme, les structures laissent voir que, dans le cas où les effectifs suffisent, il n’y a pas d’exclusivité ou de quasi exclusivité, comme c’était le cas pour les actants. Les phénomènes de marquage sont, jusqu’à preuve du contraire, répartis dans l’ensemble du corpus. b. Contexte. Lorsque les effectifs le permettent, il est possible de s’assurer que les constituants attirent une ponctuation aux alentours les uns des autres, mais on ne voit pas reparaître les actants attirant le marquage repérés précédemment. Cela conforte l’idée de l’indépendance du marquage. Les circonstants marqués se rencontrent dans l’entourage d’autres C5, ce qui ne choque pas dans les quelques cas évalués. Théoriquement, la définition des circonstants dans le modèle fait qu’ils ne sont pas considérés comme prévus par le schéma actanciel du lexème verbal assumant la fonction P0 (→3.4.2.3). Par conséquent, le nombre de constituants possibles n’est pas fixé. Les différents circonstants sélectionnant le même prédicat peuvent généralement être jugés indépendants, mais le fait relevé ci-dessus nous incite à nous demander s’il ne vaudrait pas mieux les décrire comme des coordonnés. En effet, prenons l’exemple suivant: «· [Elles67 ] furent faıteſ lan noſtre ſaíngnor · mılh · deucenſ et quarante troız · le londı apreſ leſ otaueſ de le treme» (Document 1244–01–19, 24).
Cette phrase, qui contient les deux circonstants lan noſtre ſaíngnor mılh deucenſ et quarante troız et le londı apreſ leſ otaueſ de le treme, est représentée comme dans la figure 6.71 d’après notre modèle, ce qui n’est pas très différent de ce qu’on observe dans la figure 6.72.68 Il existe cependant une relation sémantique entre les deux circonstants qui n’est pas du même ordre que celle observée généralement en cas de 66 Voir le dépouillement complet en annexe. 67 Nous pronominalisons cıſte choze et ceſ lettreſ pour simplifier l’exposé. 68 Voir 3.4.7.2 sur la schématisation de la coordination.
298
l’an Nostre Saignor. . . C5
le londi aprés. . .
furent faites
C5
S1 [Elles] F IG . 6.71 – Structure d’une phrase comprenant deux circonstants (modèle choisi)
h
coordination i le londi aprés. . .
l’an Nostre Saignor. . . C5
furent faites
C5
S1 [Elles] F IG . 6.72 – Structure d’une phrase comprenant deux circonstants (modèle alternatif)
coordination. Cela se traduit morphosyntaxiquement par l’absence généralisée de coordonnant spécifiant la relation entre les deux C5. Qu’on accepte l’idée que les circonstants sont coordonnés ou non ne change rien à l’attraction qu’ils manifestent de manière générale par rapport au marquage. Cette attraction semble d’autant plus forte que les circonstants sont en contact les uns avec les autres. c. Hors de la morphosyntaxe. À la liste des formules relevées jusqu’à présent, il faut peut-être ajouter la portion finale de l’eschatocole, de forme variée. Par ailleurs, l’étude des 0,1,C5,¬pers a mis en évidence l’emploi systématique du relateur por. Pour approfondir l’étude de la relation entre les lexèmes mobilisés, les structures qu’ils servent à construire et leur ponctuation, il serait nécessaire de lemmatiser le corpus. L’entreprise pourrait commencer par les adverbes relateurs. d. Proportions expliquées. Si l’on admet de ranger les constituants parmi les unités attirant la ponctuation, on peut dresser la liste des attractions, de la même manière que nous l’avons fait ci-dessus pour les actants. Ainsi, pour la ponctuation initiale, les circonstants attirant sa présence sont: – – – – – –
0,0,C5,pers,0; 0,1,C5,0,0 (phrase,¬pers-arg,pers,¬pers); 0,0,C5,0,1 (pers,¬pers); 0,1,C5,0,1 (phrase,pers-arg,pers); 0,1,C5,¬pers,1 (pers,phrase); 0,1,C5,pers,1 (phrase).
299
ActCirc.0 ActCirc.1
P.0
P.1
54919 2696 57615
3479 1093 4572
58398 3789 62187
P.0
P.1
12.26 -188.95
-154.49 2381.1
θ
6.4
χ2 = 2733.45, ddl = 1, p = 0 ★★★
TAB . 6.65 – Proportions de marquage expliqué par la ponctuation des compléments
0 1
FAB
FRE
3479 1093 4572
76.09 23.91 100
0 1
0
500
1000
1500
2000
2500
3000
TAB . 6.66 – Tri à plat de la position (limite de complément ou non) pour les positions ponctuées
Parallèlement, pour la ponctuation finale, nous retenons les attractions impliquant les constituants: – – – – – –
0,0,C5,pers,0; 0,0,C5,0,0 (¬pers-arg,¬pers); 0,0,C5,0,1 (phrase,pers-arg,¬pers-arg,pers,¬pers); 0,0,C5,¬pers,1 (phrase); 0,0,C5,pers,1 (phrase,pers-arg,pers); 1,0,C5,pers,1 (phrase).
Nous pouvons ainsi reconsidérer les résultats de la synthèse sur la ponctuation des actants (→6.1.3.14), et construire un tri croisé sur la base de la définition de chaque position entre deux mots (limites de l’énoncé exceptées) par deux variables répondant aux questions: la position est-elle à la limite d’un actant ou d’un circonstant attirant la ponctuation à cet endroit? la position est-elle effectivement marquée d’un ponctogramme? Cela nous permet de construire la table 6.65. En dehors du marquage de la phrase, les positions reconnues comme attirant la ponctuation sont significativement beaucoup plus marquées que les autres. À nouveau, si nous envisageons les exceptions à ces tendances, il est plus fréquent que les positions ne soient pas marquées alors que le contexte attire la ponctuation plutôt que le contraire. Ainsi, considérer les circonstants comme des environnements propices à l’apparition de la ponctuation permet d’augmenter la proportion de ponctogrammes expliqués par leur position (table 6.66) sans pour autant augmenter de manière démesurée la quantité de constructions non marquées alors qu’elles pourraient l’être (table 6.67). 6.1.5
Coordination
D’après les analyses effectuées jusqu’à présent, l’influence de la coordination sur l’emploi de la ponctuation est apparemment aussi importante que généralisée. On a en effet vu apparaître son influence tant aux alentours du prédicat que des actants et
300
0 1
FAB
FRE
54919 2696 57615
95.32 4.68 100
0 1
0
10000
20000
30000
40000
50000
TAB . 6.67 – Tri à plat de la position (limite de complément ou non) pour les positions non ponctuées
même, dans une certaine mesure, des circonstants. La coordination est donc un type de construction qui touche tous les niveaux d’intégration syntaxique. En tant que telle, on pourrait exiger de l’étude du marquage de la coordination qu’elle tienne compte d’un important nombre de variables pour être tout à fait fiable. Néanmoins, la généralité de la relation sur le plan morphosyntaxique justifie une approche unifiée, où les coordinations de niveaux argumental et immédiat seront étudiées sans être distinguées. Les données ont été sélectionnées et annotées (→6.1.5.1) de manière à permettre un traitement approprié de la problématique (→6.1.5.2). 6.1.5.1
Préparation des données
La sélection des constituants qui formeront l’échantillon de notre analyse devra tenir compte de ce que nous avons découvert à ce point de l’exposé (a). Les variables disponibles ne suffisant pas à aborder les coordinations, nous serons amené à définir une nouvelle variable, plus adéquate au traitement de la problématique (b et c). a. Sélection des individus. L’étude de la phrase, des actants et des circonstants a mis en évidence une série d’environnements qui favorisaient l’apparition de la ponctuation. Il est probable que ces tendances interagissent avec la manière dont la coordination influence la présence des ponctogrammes. Dans une logique similaire à celle qui nous a poussé à écarter les propositions partageant une de leurs limites avec une autre quand nous avons étudié leur marquage,69 il nous paraît profitable de ne pas intégrer à l’échantillon les constituants dont la ponctuation peut déjà être «expliquée» par un des environnements pouvant être considérés comme la justifiant. b. Ajout d’une nouvelle variable. Pour étudier de manière approfondie la construction, nous avons dû créer une nouvelle variable décrivant les constituants, à laquelle nous avons assigné le sigle MC. Les modalités de cette variable décrivent la position du constituant dans un ensemble coordonné: MC.¬coord indique que l’unité n’est pas coordonnée; MC.début signifie qu’il s’agit de la première unité du groupe coordonné; MC.fin qu’il s’agit de la dernière et MC.centre que l’unité est coordonnée, mais n’est ni en première, ni en dernière position. Par exemple, dans la phrase: «[1] jakemes lı prouoſt · johans lı doınſ · lı archıakene et toz lı capıtelez [. . .]» (Document 1236–05, 1).
la valeur de MC pour le constituant jakemes lı prouoſt est MC.début; celle de johans lı doınſ et de lı archıakene est MC.centre; celle de toz lı capıtelez correspond à MC.fin. Plusieurs constituants peuvent ainsi avoir comme modalité MC.centre tout en faisant 69 Voir →6.0.1.2 sur les raisons qui nous poussent à retirer de chaque échantillon les unités
partageant une de leurs limites avec une autre unité du même échantillon.
301
MC.¬coord. MC.début MC.fin MC.centre
PPD.0
PPD.1
67480 2284 2872 2677 75313
2996 414 139 1559 5108
70476 2698 3011 4236 80421
PPD.0
PPD.1
33.2 ★★★ −23.3 ★★★ 0.97 ✩✩✩ −419.46 ★★★
−489.55 ★★★ 343.54 ★★★ −14.27 ★★★ 6184.53 ★★★
χ2 = 7508.82, ddl = 3, p = 0 ★★★
TAB . 6.68 – Tri croisé des positions de coordination et PPD
partie du même groupe coordonné. Pour simplifier le traitement, le coordonnant qui spécifie la relation reçoit la modalité de MC correspondant à sa position, exactement comme s’il était lui-même coordonné, c’est-à-dire, généralement MC.centre. c. Cas particulier des groupes de constituants. Le traitement est plus complexe dans le cas de coordination de groupes de constituants, comprenant par exemple un prédicat et un ensemble d’arguments:
«· et [10] ıe cel meíme droıt [. . .] lor quıtte auſı et lor done en almoıne / ſe nul droıt ı˘aj» (Document 1268–08–02b, 9). ˘
La valeur de MC pour les différents arguments dépend alors de la ponctuation étudiée (initiale ou finale). Dans tous les cas, les arguments regroupés dans un membre coordonné qui ne se trouvent ni au début, ni à la fin de ce membre reçoivent la modalité MC.¬coord. C’est le cas de done et en dans l’exemple ci-dessus. Si on étudie la relation entre la coordination et la ponctuation initiale, tout argument autre que le premier du groupe sera également MC.¬coord, alors que le premier sera MC.début, MC.centre ou MC.final, en fonction de la position de l’ensemble du groupe dans la structure rassemblant les éléments coordonnés. Par exemple, seul le constituant lor sera décrit par la modalité MC.début. Pour la ponctuation finale, on procède de même, mais en ne marquant que l’argument final (ici, almoıne). 6.1.5.2
Analyse
Nous n’avons à ce jour pas développé de moyen permettant d’extraire efficacement le contexte immédiat des groupes coordonnés. Aussi, les analyses fournies ci-dessous ne tiennent pas compte des constituants qui précèdent ou suivent les groupes coordonnés. Pour étudier la ponctuation des différents membres coordonnés, il ne paraît pas nécessaire d’aborder distinctement la ponctuation initiale et la ponctuation finale des constituants. Nous commencerons par traiter la ponctuation initiale dans toutes les positions correspondant aux modalités de la variable MC (a, b et c) avant de nous focaliser sur le marquage final du dernier membre (d). a. Tabulation générale. Une fois l’échantillon sélectionné et les constituants décrits à l’aide de la variable MC, il est aisé de construire la tabulation 6.68, qui croise les modalités de la nouvelle variable avec celles de PPD. La ventilation est très significative. La décomposition de l’écart, sur le tableau de droite, présente principalement les MC.¬coord et les MC.fin comme repoussant PPD.1.
302
MC.¬coord. MC.début
PPD.0
PPD.1
67480 2284 69764
2996 414 3410
70476 2698 73174
PPD.0
PPD.1
1.24 -32.31
-25.3 660.94
θ
4.08
χ2 = 717.29, ddl = 1, p = 5.21e − 158 ★★★ Après ajustement de Šidàk pour 4 comparaisons: ★★★ (seuils: 0.0127, 0.00251, 0.00025)
TAB . 6.69 – Tri croisé des positions de coordination MC.¬coord et MC.début et PPD
MC.¬coord. MC.centre
PPD.0
PPD.1
67480 2677 70157
2996 1559 4555
70476 4236 74712
PPD.0
PPD.1
25.57 -425.35
-393.77 6551.31
θ
13.1
2
χ = 7390.31, ddl = 1, p = 0 ★★★ Après ajustement de Šidàk pour 4 comparaisons: ★★★ (seuils: 0.0127, 0.00251, 0.00025)
TAB . 6.70 – Tri croisé des positions de coordination MC.¬coord et MC.centre et PPD
MC.¬coord. MC.centre
PPD.0
PPD.1
67446 562 68008
2979 931 3910
70425 1493 71918
PPD.0
PPD.1
10.84 -511.54
-188.62 8897.43
θ
37.5
χ2 = 9597.14, ddl = 1, p = 0 ★★★ Après ajustement de Šidàk pour 4 comparaisons: ★★★ (seuils: 0.0127, 0.00251, 0.00025)
TAB . 6.71 – Tri croisé des positions de coordination MC.¬coord et MC.centre et PPD (coordonnants retirés)
b. Attractions. Lorsqu’on compare séparément la ponctuation de MC.¬coord et des modalités MC.début et MC.centre,70 on voit tout d’abord que l’attraction est effective pour MC.début (table 6.69). De même (table 6.70),71 les constituants MC.centre (parmi lesquels on compte les coordonnants, rappelons-le) s’opposent également à la tendance propre à la noncoordination. En retirant les coordonnants (table 6.71), le rapport de chances est nettement plus élevé. c. Répulsions. Les constituants non coordonnés et les constituants finaux d’une coordination s’opposent ensemble à la présence de marquage. Ils peuvent à leur tour être comparés (table 6.72). Les constituants qui rejettent la ponctuation ne s’opposent pas entre eux significativement. L’observation de quelques attestations permet d’en entrevoir la raison: 70 La répartition des attractions par document ne modifie pas l’orientation et la significativité
de l’écart. Voir l’annexe 6.1.5.figure-coord-init. 71 La répartition des attractions par document ne modifie pas l’orientation et la significativité
de l’écart. Voir 6.1.5.figure-coord-centre.
303
MC.¬coord. MC.fin
PPD.0
PPD.1
67480 2872 70352
2996 139 3135
PPD.0
PPD.1
0 -0.04
-0.04 0.87
θ
1.09
70476 3011 73487
χ2 = 0.86, ddl = 1, p = 0.355 ✩✩✩ Après ajustement de Šidàk pour 4 comparaisons: ✩✩✩ (seuils: 0.0127, 0.00251, 0.00025)
TAB . 6.72 – Tri croisé des positions de coordination MC.¬coord et MC.fin et PPD Attractions (seuil adapté 1.27%) 0,0,Ap,0,0 0,0,S1,0,0 1,0,Ap,0,0
78/112 (70%) 17/24 (71%) 7/13 (54%) 4.56e−237
1
F IG . 6.73 – Marquage initial de MC.fin par constituant précédent Répulsions (seuil adapté 1.27%) 0,0,Co,0,0
29/2771 (1.0%) 1e−300
1
F IG . 6.74 – Marquage initial de MC.fin par constituant précédent «· y˙ ſabeaz [recevra] · ııj · ſoz · de cenſ [. . .] · ſelle perſoure en relıgıon · et ſelle est mananſ á ſaínt crıſtofle» (Document 1247–06, 17). «· lı tenant ſunt ſıres henrotte de nuefvıs · t˙yrıs de preet · vlar le / [19] peıſſıres et gılez lı chínuz et autre prodome · louuís de flemale maıres de lıege · ewras de lowe et lambeılhoırs pan / [20]cherons» (Document 1252–03–01a, 18).
La présence d’un coordonnant devant le dernier membre semble impliquer le nonmarquage. Et en effet, si l’on examine les constituants qui précèdent un individu à la modalité MC.fin et qu’on croise leur type (MM) avec la présence de ponctuation, la recherche des modalités de MM particulièrement significatives donne des graphiques peu fournis, mais limpides (figures 6.73 et 6.74): dans tous les cas où MC.fin n’est pas précédé d’un coordonnant, il y a attraction significative du marquage. La situation est très fréquente dans le cas des nombres: «· sacent [2] tuj´t ken lan delle jncarnatıon noſtre ſaínor jhesucrıſt · m · cc · lxíj´ · [. . .]» (Document 1263–07–20, 1).
Toutefois, l’attraction est également visible dans des contextes moins spécifiques: «· apres nos auons teılh conuent entre nos et les deuant˘dıs maıeur / ſkeuíns / jureıs et tot lecommun / [13] ke tote lımoıtıes des preus et des rentes kı uenront de celle halle dor en˘auant ſerat noſtre [. . .]» (Document 1263–11, 12). ˘
˘
où l’ensemble maıeur / ſkeuíns / jureıs est apposé à les deuant dıs. D’autres contextes sont possibles, comme: 304
spécification
[constituant]
relation
h i mot spécifiant reste du constituant
F IG . 6.75 – Représentation de la spécification (rappel)
relation addition h
[Ermensens. . . marchisse d’Arlon] [et] [Henri. . . marchis d’Arlon] S1
faisons
i
S1
R2 [conissiance ke. . .] F IG . 6.76 – Structure de Ermensens. . . et Henri. . . (rappel) «· et de tout ce ke deſeure · eſt dıt deuons nous faıre boene ſevrteı au conte deuant dıt par nos letres et par [10] les letres dou chapıtle deuant dıt · et les letrres de nos boenes uıles · et par les letres le conte de los / mon ſegneur wıllaume dauteríue · le [11] ſegneur de stene · le ſegneur de borne · mon ſegneur renart dargentea · le ſegneur de moreaumeıs · mon ſegneur therrı de rochefort · mon ſegneur go / [12]defroı de caumont» (Document 1263–05–27c, 9).
La distinction entre les chiffres (romains) et les autres appositions ne relevant pas de la morphosyntaxe – du moins dans le modèle que nous proposons –, nous n’avons pu traiter efficacement le marquage l’environnant. En attendant une étude précise du sujet, on peut toutefois se risquer à commenter cette opposition entre le marquage du dernier membre par un ponctogramme ou par un relateur. À notre avis, elle remet en question la manière dont nous avons analysé la spécification de la relation de coordination ainsi que la position du coordonnant dans la hiérarchie syntaxique. En effet, comme les tendances générales l’ont montré, et comme nous n’allons pas tarder à le détailler (→6.3), le rejet de la ponctuation finale est commun aux coordonnants et aux autres relateurs. Or, la position du relateur dans l’emboîtement des constituants est celle schématisée dans la structure 6.75, suivant la conception généralement admise que nous avons faite nôtre (→3.2.2.2). Au contraire, quand nous avons analysé d’une manière qui illustre notre conception de la coordination (→3.4.7.2) la phrase suivante, «[. . .] Ermensens, contesse de Luceleborc et de La Roche et marchisse d’Arlon, et Henris, ses fils, quens de Lucele-[2]-borc et marchis d’Arlons, faisons conissiance [. . .] ke [. . . ]» (Document 1242–05–02, 1).
nous avons dessiné le schéma 6.76. Dans ce dernier, le relateur et est extérieur aux deux membres coordonnés. Toutefois, la ponctuation semble se conformer plus aisément à une analyse qui traiterait de manière identique le coordonnant et les autres relateurs (figure 6.77).
305
spécification
[membre 1]
coordination
h
i [coordonnant] membre 2
F IG . 6.77 – Représentation de la spécification de la coordination (revue)
MC.¬coord. MC.début MC.fin MC.centre
PPF.0
PPF.1
56124 1910 1237 3466 62737
5415 714 255 925 7309
61539 2624 1492 4391 70046
PPF.0
PPF.1
18.37 ★★★ −82.45 ★★★ −7.38 ✩★★ −55.41 ★★★
−157.71 ★★★ 707.71 ★★★ 63.36 ★★★ 475.62 ★★★
χ2 = 1568.01, ddl = 3, p = 0 ★★★
TAB . 6.73 – Tri croisé des positions de coordination (sans MF.Co) et PPF
d. Marquage final du dernier constituant. Le marquage final du dernier constituant coordonné72 paraît également significatif. En retirant les coordonnants de l’échantillon, on construit effectivement le tri croisé 6.73. Quand on regarde le tableau de droite, la décomposition de l’écart indique que tous les constituants coordonnés attirent le marquage par rapport à une non-coordination. Puisque toutes les positions impliquées dans la coordination ont été abordées dans l’exposé sur la ponctuation initiale, seule nous intéresse l’avant-dernière ligne du tri croisé, qui montre que la ponctuation finale est généralement attirée par le dernier membre. Cependant, l’attraction paraît moins forte que pour les constituants au début ou au milieu de la coordination. 6.1.5.3
Synthèse
Nous arrivons ainsi à la conclusion que le marquage des membres d’une coordination est généralisé: quelle que soit leur position, ils sont marqués, à moins qu’ils ne soient précédés directement d’un coordonnant. Cette tendance au marquage et la force de l’exception qui lui est associée nous permettent, d’une part, d’augmenter sensiblement la proportion de ponctogrammes pouvant être expliqués et, d’autre part, de critiquer le modèle employé. a. Proportions expliquées. Sans tenir compte des positions entre les mots se trouvant aux limites de constituants qui pourraient justifier la présence de la ponctuation,73 nous pouvons – comme nous l’avons fait précédemment pour ces constituants attirant la ponctuation – construire un tri croisé des positions entre les mots. Celui-ci est fondé sur deux variables dichotomiques: 1/ la position est-elle au début ou à la fin d’un membre coordonné (mais pas à la fin d’un coordonnant)? 2/ la position est-elle ponctuée? Le résultat prend la forme de la table 6.74. Non seulement le test du χ2 est significatif, mais de plus, le rapport de chances est particulièrement élevé. La pro-
72 La répartition par document ne paraît pas significative, voir annexe 6.1.5.figure-coord-fin. 73 Voir ci-dessus les sections sur le marquage de la phrase (→6.1.1), des actants (→6.1.3) et
des circonstants (→6.1.4).
306
Coord.0 Coord.1
P.0
P.1
49266 8349 57615
2147 2425 4572
51413 10774 62187
P.0
P.1
55.98 -267.12
-705.4 3366.14
θ
6.66
χ2 = 4391.94, ddl = 1, p = 0 ★★★
TAB . 6.74 – Proportions de marquage expliqué par la ponctuation de la coordination
1 0
FAB
FRE
2425 2147 4572
53.04 46.96 100
1 0
0
500
1000
1500
2000
TAB . 6.75 – Tri à plat de la position (limite de coordination ou non) pour les positions ponctuées
0 1
FAB
FRE
49266 8349 57615
85.51 14.49 100
0 1
0
10000
20000
30000
40000
TAB . 6.76 – Tri à plat de la position (limite de coordination ou non) pour les positions non ponctuées
portion de ponctogrammes aux limites des constituants coordonnés explique un grand nombre d’occurrences. Les tris à plat correspondant aux colonnes de ce tri croisé montrent en effet en quelle mesure ces décomptes sont importants. Plus de la moitié des ponctogrammes attestés sont impliqués dans une coordination (table 6.75). Mais cela ne signifie pas pour autant que le marquage soit systématique (table 6.76): plus que toute autre tendance, celle du marquage de la coordination est loin d’être une règle. Il nous semble que cela soulève une autre question que nous ne sommes pas encore en mesure de traiter pour des raisons techniques:74 le nombre de membres impliqués dans la coordination, ou la nature de ces membres (groupements de constituants argumentaux ou simples constituants) n’influencent-ils pas le marquage? Néanmoins, nous pouvons nous satisfaire de ces résultats provisoires et les combiner à ceux livrés par l’étude du marquage des phrases et des constituants de syntaxe argumentale (table 6.77). Les proportions de la deuxième colonne du tri croisé laissent voir qu’une grande partie des ponctogrammes peuvent être justifiés par une des tendances mises à jour (table 6.78). Quant à la première colonne (table 6.79), elle nous indique que les environnements attirant la ponctuation sont généralement marqués. b. Critique du modèle. Par ailleurs, l’examen de la ponctuation de la coordination a mené à revisiter la manière dont nous avons analysé les coordonnants dans le corpus. Nous proposons de tenter l’expérience de leur appliquer une analyse similaire à celle
74 Voir →0.5.2 sur les difficultés posées par le traitement automatisé des données.
307
any.0 any.1
P.0
P.1
47057 11063 58120
1335 4712 6047
48392 15775 64167
P.0
P.1
237.34 -728.08
-2281.19 6997.88
θ
15
χ2 = 10241.32, ddl = 1, p = 0 ★★★
TAB . 6.77 – Proportions de marquage expliqué par une tendance générale
1 0
FAB
FRE
4712 1335 6047
77.92 22.08 100
1 0
0
1000
2000
3000
4000
TAB . 6.78 – Tri à plat de la position (limite de constituant attirant le marquage ou non) pour les positions ponctuées
0 1
FAB
FRE
47057 11063 58120
80.97 19.03 100
0 1
0
10000
20000
30000
40000
TAB . 6.79 – Tri à plat de la position (limite de constituant attirant le marquage ou non) pour les positions non ponctuées
que nous avons employée pour traiter les autres relateurs. Un marquage réparti de la sorte: ⊗ constituant A ⊗ constituant B ⊗
est une invitation visuelle à considérer que le contenu du constituant B forme un bloc. Plus qu’une simple correction de détail, cette révision montre que la confrontation de phénomènes peut ouvrir la réflexion sur les modèles qui ont servi à les formaliser.
6.2
Syntaxe immédiate
Dans une analyse déductive comme la nôtre, la syntaxe immédiate doit forcément être abordée en dernier lieu. Comme nous l’avons annoncé dans la synthèse du chapitre →5, la présence de ponctuation autour des constituants au niveau de la syntaxe immédiate peut très bien être due à des phénomènes de marquage intervenant plus haut dans la hiérarchie syntaxique ou à des phénomènes généraux, comme la ponctuation de la coordination. Si nous considérons que les tendances décelées dans la section →6.1 «expliquent» la présence d’un grand nombre de ponctogrammes, ceux d’entre eux pouvant être justifiés par une de ces tendances ne doivent pas être pris en compte pour tenter de découvrir les attractions et répulsions liant les modalités de MM et la ponctuation en syntaxe immédate. En conséquence, nous devrons commencer l’étude par une révision des ta308
bleaux synoptiques proposés (→6.2.1). Nous serons alors en mesure de repérer les tendances, auxquelles nous donnerons le nom de ruptures, qui méritent un traitement approfondi (→6.2.2). 6.2.1
Révision des tableaux synoptiques pour la syntaxe immédiate
Avant de commencer les analyses, nous allons sélectionner exclusivement les individus dont le marquage éventuel ne peut être imputé à une des tendances déjà repérées dans la section précédente. Par exemple, dans: «[1] jakemes lı prouoſt · johans lı doınſ · lı archıakene et toz lı capıtelez [. . .]» (Document 1236–05, 1).
les différents ‹·› qui séparent les syntagmes jakemes lı prouoſt, johans lı doınſ, etc. peuvent être expliqués par la relation de coordination dans laquelle ils sont impliqués. Il n’est pas utile de compter le constituant johans parmi les 1,0,Ap,0,0, de l’échantillon servant aux tris croisés de MM et PPD en contexte MI.synt-arg, puisque le ponctogramme qui le précède peut être interprété comme une marque due à la coordination. S’il n’y avait pas eu de ponctogramme à cet endroit, il n’aurait pas été utile non plus de garder le constituant. De même, les constituants dont le premier mot se trouve au début d’une phrase ou d’un actant ou circonstant attirant PPD.1 doivent être retirés de l’échantillon quand nous étudions la relation entre MM et PPD. Pareillement, les tris croisés entre MM et PPF sont effectués sur un échantillon ne contenant pas de constituants dont le dernier mot termine une phrase, un actant ou un circonstant attirant PPF.1. Cette réduction opérée, nous allons effectuer à nouveau les quatre tris croisant MM et PPD, puis MM et PPF aux deux niveaux d’intégration MI.synt-arg (arguments non propositionnels) et MI.synt (constituants non propositionnels de fonction immédiate). Cela fait, nous évaluerons le lien entre chacune des modalités de MM et le marquage, de la même manière que nous l’avons fait ci-dessus (→5.3.2.4 et →5.3.2.7). Nous ne présenterons ici que les nouveaux tableaux synoptiques et renvoyons aux annexes pour le détail des graphiques décrivant les attractions et répulsions qui ont servi à construire ces nouvelles synthèses. Le premier tableau synoptique révèle essentiellement que peu de constituants attirent la ponctuation initiale (figure 6.78). La ponctuation apparaissant devant le premier constituant immédiat d’une structure ne sera pas traitée: pour les structures de syntaxe argumentale, on peut considérer qu’elle est déjà traitée en détails par le biais des analyses préalablement effectuées (de →6.1.1 à →6.1.4). Pour les structures de syntaxe immédiate, la situation est un peu plus compliquée, mais justifie également qu’on ne s’attarde pas à décrire la ponctuation des constituants initiaux. En effet, si un constituant initial de niveau MI.synt est marqué, même s’il est le premier d’un syntagme contractant une relation immédiate, il constiturea en une rupture (par récursivité) dans la cohésion du syntagme. Par exemple, dans «· et ſe ıl auenoít que˘la terre quı eſt entre vı [14]neı / et mueze reuenoıt a noſ ·/ v une partíe dela terre / noſ deuonſ leueſke et leglıſe [15] remetre enteıl tenure que ıl furent an tenſ le conte · thıebaut de bar le peıre le com / [16]te · hanrı quı eſt morſ vtre meír» (Document 1243–07–09, 13). ˘
309
1,0,Dt,0,1 1,0,Rl,0,0 1,0,Ap,0,0 0,1,Ap,pers,1 1,1,Ap,0,0 1,0,Dt,0,0 0,1,Dt,¬pers,1 0,1,Dt,0,0 0,0,Rl,0,0 0,0,Dt,0,0 0,0,Ap,pers,1 0,0,Ap,0,0 0,1,Ap,0,1 0,1,Ap,0,0
Attraction significative Attraction significative (si non ajustée) Attraction non significative (seuil 5%) Répulsion significative Répulsion significative (si non ajustée) Répulsion non significative (seuil 5%)
0,0,Dt,0,1 0,0,Ap,¬pers,0 0,1,Dt,0,1 0,1,Ap,¬pers,0 synt−arg
synt
F IG . 6.78 – Tableau synoptique des tendances en syntaxe immédiate, PPD (revu) 1,0,Dt,0,1 0,1,Dt,0,1 0,1,Dt,0,0 0,1,Ap,¬pers,0 0,1,Ap,0,1 0,1,Ap,0,0 0,0,Ap,pers,1 0,1,Ap,pers,1 0,0,Ap,¬pers,0 0,0,Dt,0,1 0,0,Dt,0,0 0,1,Dt,¬pers,1 1,0,Ap,¬pers,0 1,0,Ap,0,1 0,0,Rl,0,0 1,0,Dt,0,0 1,0,Ap,0,0 0,0,Ap,0,0 1,0,Rl,0,0
Attraction significative Attraction significative (si non ajustée) Attraction non significative (seuil 5%) Répulsion significative Répulsion significative (si non ajustée) Répulsion non significative (seuil 5%) synt−arg
synt
F IG . 6.79 – Tableau synoptique des tendances en syntaxe immédiate, PPF (revu)
le mot thıebaut, qui est décrit par la modalité MM.1,0,Ap,0,0 dans le syntagme souligné, est marqué à l’initiale. La description de la ponctuation de ce dernier (MM.0,1,Ap,0,0) suffit néanmoins à comprendre le ponctogramme. Ainsi, seuls les 0,0,Ap,0,0 (au niveau MI.synt) et les 0,1,Ap,pers,1 (aux deux niveaux) nous intéresseront. Le second tableau synoptique (figure 6.79, traitant de PPF) montre que la ponctuation finale est attirée par un plus grand nombre de constituants. Néanmoins, de la même manière que pour PPD, ce sont les constituants finaux qui sont les plus nombreux à être liés au marquage. Pour les mêmes raisons que pour PPD, seuls
310
0 1
FAB
FRE
3515 125 3640
96.57 3.43 100
0 1
0
500
1000
1500
2000
2500
3000
3500
TAB . 6.80 – Tri à plat de PPD, pour les constituants de type 0,0,Ap,0,0 (niveau: synt)
les constituants non finaux retiendront notre attention: 1,0,Dt,0,1 au niveau MI.synt, 0,0,Ap,¬pers,0 au niveau MI.synt-arg et 0,0,Ap,pers,1 (aux deux niveaux). 6.2.2
Examen des ruptures
Les quelques types de constituants attirant le marquage sans se trouver aux bornes sont donc: – – – – –
0,0,Ap,0,0 (synt): PPD; 0,1,Ap,pers,1 (synt-arg, synt): PPD; 1,0,Dt,0,1 (synt): PPF; 0,0,Ap,pers,1 (synt-arg, synt): PPF; 0,0,Ap,¬pers,0 (synt-arg): PPF.
Nous les étudierons dans cet ordre. 6.2.2.1
0,0,Ap,0,0 (synt): PPD
Les proportions apparaissent dans la table 6.80. La distribution du marquage entre les documents montre qu’un petit nombre de chartes se distinguent du reste du corpus (figure 6.80).75 Si nous enlevons ces chartes de l’échantillon, l’attraction disparaît. On ne peut pas dire que le phénomène soit général. D’autre part, quand on regarde quels sont les constituants qui, précédant les 0,0,Ap,0,0, attirent le marquage initial de ce dernier, on voit que les ponctogrammes apparaissent essentiellement au contact d’autres 0,0,Ap,0,0 (figure 6.81). L’examen détaillé des contextes révèle que ce sont des nombres ou des noms de personnes (presque exclusivement): «· et ſe ıl auenoít que˘la terre quı eſt entre vı [14]neı / et mueze reuenoıt a noſ ·/ v une partíe dela terre / noſ deuonſ leueſke et leglıſe [15] remetre enteıl tenure que ıl furent an tenſ le conte · thıebaut de bar le peıre le com / [16]te · hanrı quı eſt morſ vtre meír» (Document 1243–07–09, 13). ˘
«· ce faıt lan del jncarnatıon [27] de nostre ſaıngnor mılh et · cc · quarante ſet · ens elle moıſ de juníj´» (Document 1247–06, 26). «· et les · xxıııj · ſols · de [10] cenſ apaíer a termıneſ kı par˘deſeur ſont deuıſeís werpírent cılh lambers vennıſons˘et ſe [11] femme · et affaıtont a˘celı freſſent · par deuant noſ ſeans en justıce par teılh droıt com [12] jlh dıerent ſolonc le loı et le coſtume dele vılhe de dínant · appoſſeír a˘ lı et a˘ſon oır a touſ [13] jourſ en˘paıſ ſens calenge» (Document 1255–05–21, 9). ˘
˘
˘
˘
˘
˘
75 Le graphique des répulsions n’apporte aucune information; il est relégué aux annexes.
311
Attractions (seuil adapté 0.0386%)
14/51 (27.5%) 10/28 (35.7%) 5/22 (22.7%) 4/17 (23.5%) 14/153 (9.2%) 3/13 (23.1%) 5/37 (13.5%) 3/15 (20.0%) 4/26 (15.4%) 6/57 (10.5%) 3/20 (15.0%) 3/32 (9.4%) 2/17 (11.8%) 4/62 (6.5%) 3/44 (6.8%) 2/25 (8.0%) 2/29 (6.9%) 1/29 (3.4%) 1/27 (3.7%) 1/26 (3.8%) 1/26 (3.8%) 1/25 (4.0%) 2/32 (6.2%) 1/24 (4.2%) 2/58 (3.4%) 2/33 (6.1%) 1/23 (4.3%) 1/22 (4.5%) 1/21 (4.8%) 1/21 (4.8%) 1/20 (5.0%) 1/11 (9.1%) 1/18 (5.6%) 1/18 (5.6%) 1/12 (8.3%) 1/12 (8.3%) 1/17 (5.9%) 1/16 (6.2%) 1/16 (6.2%) 1/16 (6.2%) 2/42 (4.8%) 1/15 (6.7%)
1271−12−09 1272−07−08 1276−02−24 1283−12−26 1283−02−13a 1255−05−21 1264−09−07 1263−05−27c 1271−07−07a 1274−05−31b 1267−10−22 1280−05−04 1290−08−24 1278−04−06 1278−08−01 1271−03−18 1284−05−11 1280−08−14 1271−05−22 1270−05−10 1289−04−19 1289−03−05 1276−06−10b 1275−01−10a 1289−01−12 1275−08 1272−06−22 1271−07−07b 1286−05−15 1289−07−19 1288−02a 1287−06−24 1271−12−03c 1288−02b 1264−04 1287−09−08 1243−07−09 1270−09−29 1274−09−06 1286−03−23 1265−04−15 1284−06−09
9.2e−20
1
F IG . 6.80 – Attractions significatives entre RB et PPD, pour les constituants de type 0,0,Ap,0,0 (niveau: synt)
Attractions (seuil adapté 0.73%)
125/866 (14.4%) 68/829 (8.2%)
0,0,Ap,0,0 1,0,Ap,0,0
7.22e−33
1
F IG . 6.81 – Attractions significatives entre MMP et PPD, pour les constituants de type 0,0,Ap,0,0 (niveau: synt)
Répulsions (seuil adapté 0.73%)
39/2111 (1.8%) 2/224 (0.9%) 2/35 (5.7%) 0/13 (0.0%) 0/12 (0.0%)
1,0,Rl,0,0 0,0,Co,0,0 0,0,Rl,0,0 0,0,Ap,¬pers,0 1,0,Dt,0,0
2.42e−29
1
F IG . 6.82 – Répulsions significatives entre MMP et PPD, pour les constituants de type 0,0,Ap,0,0 (niveau: synt)
312
0 1
FAB
FRE
1467 106 1573
93.26 6.74 100
0 1
0
200
400
600
800
1000
1200
1400
TAB . 6.81 – Tri à plat de PPD, pour les constituants de type 0,1,Ap,pers,1 (niveaux: synt, synt-arg) «[1] nos guís cuens de flandres faızons ſauoır atos ke nos · geramont et les appendances · et bornehem et les appendances · kı aſtoıent noſtre franc aluel auons receut enfıes [2] lıgement atenır de mon ſaıngnor henrı par le graſſe de deu eueſke de lıege · et de ſes ſucceſſeurs eueſkes de lıege perpetuement · entel maníere ke nos et noſtre ſucceſ [3]ſeur conte v conteſſes de flandres deuons tenır geramont et bornehem et leur appendances deuant˘dıs del eueſke deuantdıt et de ſes ſucceſſeurs eueſkes de lıege a vn [4] fıes lıgement ſaues les feateıs le roı de france · le ·· conte de haınnau · le ·· roı dalemaıngne · le ·· roı dengletere · et leueſke de cambraı» (Document 1263–05–27a, 1). ˘
«·/ et a la requeſte mon ſeıgnor · jehan [19] deuant dıt / auonſ noſ míſ noſtre seel auuec le ſíen seel a ceſ preſenteſ lettreſ a tenır de nous en fıef hıretauelement» (Document 1263–05–27c, 3). «· entre ces doz parolles lı ·· abbeſſe et lı maıson de la vas benoıet dune part · [12] et lı enfant mon ſaínor wılleame de corwaremme deuant dít datre part ſe mıſent en˘mon ſaínor lıbıere butore de geneffe [13] ceualır ſor paíne de · lx · ma rs de lıgoıez quılh tenroíent che quılh dıroíet» (Document 1264–09–07, 11). ˘
En conséquence, cela signifie que le modèle morphosyntaxique n’est à nouveau d’aucun secours pour évaluer la pertinence de l’association. Tout comme nous l’avons remarqué au sujet des formules, il est peu utile à la description des nuances sémantiques véhiculées par les mots. Nous remarquons intuitivement ce que d’autres ont de nombreuses fois relevé précédemment:76 il y a des ‹·› autour des chiffres, et les noms de personnes physiques ou les syntagmes désignant des personnes morales sont parfois précédés d’un ponctogramme. Dans le cas de 0,0,Ap,0,0, presque toutes les attestations de marquage initial appartiennent à cette catégorie. Le problème, tel que nous l’avons rencontré plusieurs fois jusqu’à présent, est de savoir en quelle mesure ces ponctogrammes sont impliqués dans les tendances de marquage des actants, des circonstants ou de la coordination. Dans l’état actuel d’élaboration du corpus, il n’est pas possible de procéder autrement que par un dépouillement manuel des textes, ce qui n’est pas envisageable. 6.2.2.2
0,1,Ap,pers,1 (synt-arg, synt): PPD
L’examen du tri à plat n’apporte presque rien (table 6.81), mais la présence abondante de 0,0,Ap,pers,1 devant les 0,1,Ap,pers,1 marqués à l’initiale fait penser que la coordination joue à nouveau un rôle important dans l’explication du marquage (figure 6.83). Cependant, il est étonnant de mentionner ici la coordination, puisque nous avons retiré tous les constituants dont le marquage pouvait être éclairé par ce type de structure dès le début de la section →6.2. Nous rencontrons ici le même problème que 76 Voir par exemple Guyotjeannin et al. 1993, 307–308.
313
Attractions (seuil adapté 0.639%) 0,0,Ap,pers,1 0,0,Ap,¬pers,0 0,0,Dt,0,1 0,1,Ap,0,0 0,0,Dt,0,0
24/48 (50.0%) 5/37 (13.5%) 10/118 (8.5%) 2/14 (14.3%) 3/29 (10.3%) 4.2e−36
1
F IG . 6.83 – Attractions significatives entre MMP et PPD, pour les constituants de type 0,1,Ap,pers,1 (niveaux: synt, synt-arg) Répulsions (seuil adapté 0.639%) 1,0,Ap,0,0 0,0,Ap,0,0 0,0,Co,0,0
9/404 (2.2%) 38/828 (4.6%) 0/83 (0.0%) 0.000234
1
F IG . 6.84 – Répulsions significatives entre MMP et PPD, pour les constituants de type 0,1,Ap,pers,1 (niveaux: synt, synt-arg)
0 1
FAB
FRE
31 4 35
88.57 11.43 100
0 1
0
5
10
15
20
25
30
TAB . 6.82 – Tri à plat de PPF, pour les constituants de type 1,0,Dt,0,1 (niveau: synt)
celui détaillé ci-dessus au sujet des circonstants (→6.1.4.2): dans le modèle employé, les différentes appositions, constituants du même syntagme, ne sont pas considérées comme coordonnées, à moins qu’un relateur ne l’explicite. Il est donc possible que le marquage de la structure soit dû à ce contexte d’occurrence, mais nous ne pouvons le vérifier. L’examen de la ponctuation finale de 0,0,Ap,pers,1 ci-dessous confirmera cette impression. 6.2.2.3
1,0,Dt,0,1 (synt): PPF
L’association est trop peu attestée pour qu’un test soit possible (table 6.82), mais les attestations sont claires: «lı eueſkes · et lı cuens deuant dít · renoueleront le couenanches jadís faítes entre lome de bone memore · huart jadıs eueſke de líege · et le conte phılíppe de namur» (Document 1263–07–15, 9). [10]
«/ et lı hyretages kı est afaıtıez eſt teíz / de la curt de nandren · ııj · bonıers en vne pıeche en [16] h...ike / de˘la˘maıſon demı bonıers de terre deſeur le stoke en heve / et · ı · bonıer de pret la˘meımes / de la curt maıſtres arnut · v · jornalz de terre kı gıſt en vne [17] hpıeiche en hıerſaıng» (Document 1271–12–09, 15). ˘ ˘
˘
«[1] a tous cheaus kı ches preſens lettres vıeront et oront · nos ſuers ermenghars par le dıeu paſſıenche ·· abbeſſe et tous [2] lı ·· couens delle vas benoıte de lordene de c˙ytea dune part · et ju humbıers corbeas cheualıers ſıre dawans dautre [3] ſalus et conıſſanche de verrıteít» (Document 1287–09–08, 1).
314
0 1
FAB
FRE
47 29 76
61.84 38.16 100
0 1
0
10
20
30
40
TAB . 6.83 – Tri à plat de PPF, pour les constituants de type 0,0,Ap,pers,1 (niveaux: synt, synt-arg) PPF.0
PPF.1
7 3 51 11 24 1 1 1 99
2 1 29 2 24 1 1 0 60
MMS.0,0,Ap,0,0 MMS.0,0,Ap,pers,1 MMS.0,0,Co,0,0 MMS.0,1,Ap,0,0 MMS.0,1,Ap,pers,1 MMS.0,1,Dt,0,1 MMS.0,1,Dt,¬pers,1 MMS.1,0,Ap,0,0
9 4 80 13 48 2 2 1 159
TAB . 6.84 – Tri croisé entre MMS et PPF, pour les constituants de type 0,0,Ap,pers,1 (niveaux:synt, synt-arg)
0 1
FAB
FRE
106 13 119
89.08 10.92 100
0 1
0
20
40
60
80
100
TAB . 6.85 – Tri à plat de PPF, pour les constituants de type 0,0,Ap,¬pers,0 (niveau: synt-arg)
Dans tous les cas, les raisons du marquage peuvent être rapprochées de celles observées pour 0,0,Ap,0,0: ce sont soit des chiffres, soit des noms ou des titres de personnes qui suivent les 1,0,Dt,0,0 ponctués à la finale. 6.2.2.4
0,0,Ap,pers,1 (synt-arg, synt): PPF
Il n’est pas possible de calculer les attractions relatives au contexte immédiat (table 6.83). Par contre, une simple tabulation comme 6.84 indique que presque toutes les attestations pourraient être assimilées à des coordinations. Parmi les occurrences marquées à la finale, seul un petit nombre ne se trouve pas à la suite d’une autre proposition relatée de mode personnel ou d’un coordonnant. Il est vraisemblable que le marquage final de la structure ne soit pas dû à autre chose que son contexte. 6.2.2.5
0,0,Ap,¬pers,0 (synt-arg): PPF
Peu de constructions entrent dans cette catégorie (table 6.85). Les attestations paraissent liées à ce que nous venons de remarquer pour toutes les autres ruptures en syntaxe immédiate: le mot qui suit peut être un chiffre ou servir à désigner une personne. Ainsi,
315
’ «· et deſ dıſ · v · marſ a warder [. . .] · fach ıe manborſ meſ foemens [. . .]» (Document 1272–03, 16).
«· [. . .] les doıs damoıſelles deſeur dıttes rendírent tantoíſt apres chu a deuant [14] dıt · s˙ymon en lanſage le boníer dalu deuant dıt [. . .]» (Document 1290–08–24, 11).
Ou bien le constituant suivant est une proposition en apposition: «· en teſmoıgnage de la quel choſe / nous auons donne ces preſentes letres au conte de [23] flandres deuant nommeıt ſeelees de noſtre ſeel · kı furent donees en lan del jncarnatıon noſtre ſegneur jeshu crıſt / mıl · deus cens · [24] soıſſante et troıs · le ıour de la trıníte» (Document 1263–05–27c, 22). «· en teſ / [15]moıgnage de la quel choſe / nous auons ces preſentes letres donees au conte de flandres deuant dıt ſeelees de [16] no ſeel · kı furent donees en lan del jncarnatıon noſtre ſegneur jeshu crıſt / m · cc · soıſſante et troıs · le ıour de le trı / [17]níteít» (Document 1263–05–27b, 14). «· com enſı ſoıt ke nos aıenſ entendut par le verrıteıt de prodomeſ / ke [3] vns beſtens / et vne querele eſtoıt eſmute entre me damme labbeſſe et le couent dele val benoıte dele ordene de c˙yteaux dune part · et el˙yas dele aıle · [4] et corbeal dawans · et damoıſelle adılhe et juette fılhes ıadıs a˘saıngnor ıohan coſtant dautrepart · dendroıt dune voıe dune treſchambre kı ſıet deleıs les berrodıers [5] et dune altre uoıe dune treſchambre kı sıet deleıs le ponceal ıoíndant deſ ſtueues dele val benoıte · v´ enſ lı maſſuer dele val benoıte ont eut lor aıſes et lor voıtures» (Document 1273–05–12, 2). ˘
Un seul cas n’est pas réductible à une tendance déjà observée: «/ et lenueſtırons dou chaſtel [4] et des appendances devant dıs / a tenır de nous en fıef hıretauelement» (Document 1263–05–27c, 3).
6.2.3
Synthèse
Difficilement exploitables dans l’état actuel du modèle d’analyse, les structures relevant de la syntaxe immédiate semblent devoir leur marquage exclusivement à des phénomènes sémantiques (nombres, noms de personnes) ou à la coordination. Il se pourrait que seul 0,1,Ap,pers,1 soit particulièrement marqué à l’initiale. Toutefois, il faut admettre qu’à ce niveau, sa participation à l’«explication» de l’ensemble des ponctogrammes serait limitée à quelques unités. Peut-être faudrait-il revoir la manière dont nous analysons les constituants de syntaxe immédiate pour que notre modèle soit plus utile à la description des relations entre la ponctuation et les constituants de ce niveau d’intégration. Il ne s’agit bien entendu pas de modifier le modèle en fonction des ponctogrammes observés – pareille démarche serait incompatible avec notre méthode77 –, mais plutôt de raffiner notre description, notamment en prenant en compte les contraintes positionnelles qui pèsent sur la structuration séquentielle des constituants (par exemple, li est toujours initial). Il ne s’agit pas non plus d’intégrer au modèle des faits qui ne relèvent pas directement de la morphosyntaxe, comme le fait que nous ayons affaire à des chiffres ou des noms de personnes. 77 Nous avons d’emblée souligné notre volonté de faire en sorte que les modèles d’analyse de
l’écriture et de la syntaxe soient indépendants (→0.1.2).
316
Dans ces conditions, nous avons décidé de ne pas employer les maigres résultats de cette section pour augmenter la quantité de ponctogrammes expliqués.
6.3
Relateurs et C6
Dès les premiers tris croisés entre les fonctions et la ponctuation (→5.2.2.2), nous constations la nette tendance qu’ont les C6 et les coordonnants à attirer la ponctuation initiale et, à l’instar des autres relateurs, à repousser la ponctuation finale. Ce sont essentiellement ces tendances, non démenties par l’analyse des relations entre MM et les variables PPD et PPF, qui nous occuperont tout au long de cette section. Nous n’aborderons pas ici le problème du marquage initial des relateurs non coordonnants. À notre avis, le fait d’avoir traité précédemment la ponctuation initiale des structures relatées nous dispense de devoir étudier les liens entre PPD et les relateurs. 6.3.1
Attraction de PPD.1 par les C6 et les coordonnants
Les tableaux synoptiques mettent en évidence des tendances d’attraction semblables de ponctuation initiale pour les C6 et les coordonnants. Cette convergence nous pousse à revenir sur la distinction, posée a priori, entre ces deux fonctions. 6.3.1.1
Ressemblances
Les coordonnants et les C6 partagent un certain nombre de caractéristiques communes: du point de vue du lexique mobilisé, les formes les plus employées en fonction de C6 (et et ne) peuvent également assumer la fonction de coordonnant.78 D’autre part, la relation que les coordonnants spécifient unit le plus souvent des unités ou des groupes d’unités de même fonction syntaxique. Or, par rapport au texte qu’elles servent à construire, les phrases partagent des propriétés communes. On pourrait même dire que le sens véhiculé par les formes et ou ne ne varie pas fondamentalement avec leur fonction. Ces similitudes pourraient éventuellement mener à la conclusion que la distinction entre les fonctions est purement artificielle: un C6 ne serait qu’un coordonnant au niveau de la phrase. Nous allons nous livrer à une analyse contrastive, pour vérifier si, d’un point de vue quantitatif, il existe une différence significative entre les deux emplois des mêmes lexèmes. 6.3.1.2
Données numériques
La généralité du marquage initial des C6 et des coordonnants sera d’abord évaluée. Nous passerons ensuite à l’analyse des tris croisés et des proportions de marquage par document, de manière à apprécier l’importance de l’écart entre le comportement des C6 et celui des coordonnants par rapport à la ponctuation initiale. a. Tris à plat et distribution dans le corpus. Tout d’abord, les tris à plat effectués sur la variable PPD des constituants de fonction C6 ou Co montrent qu’une quantité ap78 Pour un aperçu des formes de C6, voir →3.4.2.3 b.
317
1 0
FAB
FRE
780 222 1002
77.84 22.16 100
1 0
0
200
400
600
TAB . 6.86 – Tri à plat de PPD, pour les constituants de type 1,0,C6,0,0 (niveau: phrase)
0 1
FAB
FRE
2415 845 3260
74.08 25.92 100
0 1
0
500
1000
1500
2000
TAB . 6.87 – Tri à plat de PPD, pour les constituants de type 0,0,Co,0,0 (niveaux: phrase, pers, pers-arg, synt, synt-arg, ¬pers, ¬pers-arg) Attractions (seuil adapté 0.171%) 1272−03 1265−05b 1270−05−10 1283−02−13a 1266−06−13 1289−01−12 1265−11−13 1276−06−10b 1265−05a 1267−08−28 1271−04−20 1271−12−09 1263−03−31 1263−11 1289−04−19 1278−08−01 1271−12−22 1270−11−26 1271−05−22 1277−06−12 1242−05−02 1270−03−24
23/23 (100%) 25/26 (96%) 16/16 (100%) 31/34 (91%) 14/14 (100%) 20/21 (95%) 12/12 (100%) 11/11 (100%) 10/10 (100%) 18/20 (90%) 12/13 (92%) 12/13 (92%) 10/11 (91%) 9/10 (90%) 9/10 (90%) 16/19 (84%) 8/10 (80%) 15/19 (79%) 10/12 (83%) 12/15 (80%) 9/11 (82%) 9/11 (82%) 0.0196
1
F IG . 6.85 – Attractions significatives entre RB et PPD, pour les constituants de type 1,0,C6,0,0 (niveau: phrase)
préciable de mots sont marqués à l’initiale. Selon les tris à plat pour C6 et pour les coordonnants (tables 6.86 et 6.87), il est déjà visible, en les comparant intuitivement, que la fréquence relative de C6 marqués est largement supérieure à celle des coordonnants. Nous pouvons donc poser l’hypothèse H1 que C6 est plus marqué que Co. Vérifions à présent la distribution du marquage dans les différents documents du corpus. Dans le cas des C6, le nombre de chartes comprenant assez d’attestations pour être soumises au test est limité (du fait qu’il est nécessaire que la charte contienne dix phrases commençant par un C6), mais permet de construire les graphiques 6.85 et 6.86. Les attractions semblent réparties dans tout le corpus car les deux documents attirant le marquage avant correction du seuil α ne paraissent pas déstabiliser l’écart. En effet, une fois ces documents retirés de l’échantillon, on peut calculer une probabilité infime que C6 ne soit pas soit lié à PPD.1 au niveau de la phrase.79 79 Voir l’annexe 6.4.10C600PPDstable.
318
Répulsions (seuil adapté 0.171%) 1280−07−20 1244−01−19 1268−03−10 1283−12−26 1276−07−22 1247−06 1236−05 1252−03−01a
3/13 (23%) 7/20 (35%) 9/19 (47%) 5/11 (45%) 7/13 (54%) 17/25 (68%) 7/11 (64%) 9/12 (75%) 8.59e−06
1
F IG . 6.86 – Répulsions significatives entre RB et PPD, pour les constituants de type 1,0,C6,0,0 (niveau: phrase)
MF.C6 MF.Co
PPD.0
PPD.1
356 2420 2776
801 846 1647
1157 3266 4423
PPD.0
PPD.1
-188.69 66.85
318.04 -112.67
θ
6.44
χ2 = 684.4, ddl = 1, p = 7.4e − 151 ★★★
TAB . 6.88 – Tri croisé C6 ou Co × PPD
De même, malgré la quantité plus importante de documents attirant spécifiquement le marquage initial des coordonnants (voir le graphique page 320) l’attraction entre ces derniers et PPD.1 reste stable une fois l’échantillon réduit (figure 6.88).80 b. Tri croisé. Il en résulte que nous pouvons effectuer un tri croisé entre MF et PPD sur un échantillon composé uniquement des constituants ayant fonction de C6 ou de Co (table 6.88). Les calculs accompagnant la tabulation ne font que confirmer nos premières impressions: la ventilation n’est pas aléatoire et manifeste une différence de proportion (θ) très importante: les C6 sont plus marqués que les coordonnants. c. Proportions par document. Étant donné la quantité d’attestations disponibles, nous pouvons compléter le simple tri croisé par une étude des proportions de ponctuation de ces deux structures par charte.81 Les échantillons mènent à la construction des graphiques 6.89, p. 322 (le dernier graphique comporte les résultats d’un test de Wilcoxon entre les deux échantillons). Les graphiques sont très clairs et confirment les résultats du tri croisé: malgré une tendance à attirer le marquage initial commune aux C6 et aux coordonnants, ces derniers sont moins marqués. d. Synthèse. De manière générale, les C6 et les Co diffèrent. Or, ce qui les sépare n’est pas d’ordre lexical, mais d’ordre relationnel, et est, au départ, basé exclusivement sur la capacité qu’a la phrase à assumer le statut d’énoncé. Si cette différence correspond à une opposition du point de vue de la ponctuation, il est fort probable que les scribes eux-mêmes distingaient les emplois. La fréquence de ponctuation est donc l’indice que les structures n’étaient pas considérées de la même manière. Il est possible que la tendance à marquer le coordonnant dépende du constituant qui le suit. L’analyse n’a pas été faite, parce qu’elle nécessite que le corpus soit apprêté d’une manière qui corresponde à une autre analyse du coordonnant.82 80 Voir l’annexe 6.4.10Co00PPDstable. 81 Suivant le même procédé que celui employé pour étudier le marquage de la phrase
(→6.1.1.1 c). 82 L’encodage de la coordination est présenté dans la section Analyses syntaxiques des annexes.
319
Attractions (seuil adapté 0.0398%) 1274−02−24 1270−06−06a 1289−01−12 1265−11−13 1263−07−15 1283−02−13a 1280−08−14 1267−10−29 1271−07−07a 1263−03−31 1236−07 1273−05−12 1260−02−03 1270−05−10 1267−07−06 1237−12 1278−08−01 1288−02b 1241−09 1271−12−03a 1288−02a 1272−06−22 1270−09−29 1271−07−07b 1259−01−16 1265−05a 1268−03−01 1275−08 1280−05−04 1281−03 1286−03 1271−12−03b 1265−07−04 1271−12−09 1283−02−13b 1264−11−29 1271−12−22 1267−08−28 1289−03−05 1271−04−20 1266−06−13 1265−04−15 1285−02−24 1263−05−27c 1276−06−10b 1276−02−24 1260−05−30a 1268−03−25 1277−03−23 1283−02−21 1270−04−07 1284−05−11
23/29 (79%) 24/33 (73%) 41/73 (56%) 30/48 (62%) 16/23 (70%) 41/96 (43%) 10/14 (71%) 9/12 (75%) 12/19 (63%) 17/33 (52%) 7/10 (70%) 20/45 (44%) 8/14 (57%) 11/23 (48%) 9/18 (50%) 10/21 (48%) 18/47 (38%) 8/17 (47%) 6/13 (46%) 6/13 (46%) 7/16 (44%) 10/26 (38%) 7/17 (41%) 6/14 (43%) 5/11 (45%) 9/24 (38%) 12/34 (35%) 13/38 (34%) 10/28 (36%) 6/15 (40%) 9/25 (36%) 5/12 (42%) 8/22 (36%) 12/36 (33%) 6/17 (35%) 4/11 (36%) 11/36 (31%) 11/37 (30%) 6/19 (32%) 14/49 (29%) 5/19 (26%) 7/27 (26%) 5/16 (31%) 9/31 (29%) 8/30 (27%) 6/22 (27%) 4/14 (29%) 3/10 (30%) 3/10 (30%) 3/10 (30%) 5/17 (29%) 8/29 (28%) 1.80e−10
1
F IG . 6.87 – Attractions significatives entre RB et PPD, pour les constituants de type 0,0,Co,0,0 (niveaux: phrase, pers, pers-arg, synt, synt-arg, ¬pers, ¬pers-arg)
6.3.2
Répulsions de PPF.1
Les relateurs et les C6 ont également en commun un rejet très prononcé de la ponctuation finale. Nous renvoyons aux annexes pour l’examen de la répartition du phénomène par document: les graphiques et calculs ne mettant en évidence aucune charte déstabilisant l’écart, on peut considérer la tendance au rejet comme une générale. 6.3.2.1
C6
Les proportions de marquage montrent que le nombre de relateurs ou C6 suivis d’un ponctogramme est très réduit (table 6.89) et le nombre d’attestations d’un poncto-
320
Répulsions (seuil adapté 0.0398%)
3/70 (4.3%) 2/47 (4.3%) 0/25 (0.0%) 2/34 (5.9%) 0/21 (0.0%) 1/25 (4.0%) 2/31 (6.5%) 0/18 (0.0%) 1/24 (4.2%) 0/17 (0.0%) 5/45 (11.1%) 1/22 (4.5%) 0/14 (0.0%) 2/26 (7.7%) 3/31 (9.7%) 1/19 (5.3%) 4/35 (11.4%) 0/12 (0.0%) 0/12 (0.0%) 2/23 (8.7%) 0/11 (0.0%) 0/11 (0.0%) 5/38 (13.2%) 2/22 (9.1%) 2/22 (9.1%) 2/22 (9.1%) 3/27 (11.1%) 1/16 (6.2%) 1/16 (6.2%) 2/21 (9.5%) 3/26 (11.5%) 1/15 (6.7%) 1/14 (7.1%) 1/14 (7.1%) 4/28 (14.3%) 1/13 (7.7%) 1/13 (7.7%) 1/13 (7.7%) 1/13 (7.7%) 1/12 (8.3%) 7/40 (17.5%) 2/16 (12.5%) 4/25 (16.0%) 3/20 (15.0%) 2/15 (13.3%) 1/10 (10.0%) 6/32 (18.8%) 7/36 (19.4%) 4/23 (17.4%) 2/14 (14.3%) 2/14 (14.3%) 2/14 (14.3%) 3/18 (16.7%) 8/39 (20.5%) 4/22 (18.2%) 4/22 (18.2%) 2/13 (15.4%) 2/12 (16.7%) 2/12 (16.7%) 2/12 (16.7%) 5/24 (20.8%) 12/51 (23.5%) 3/15 (20.0%) 11/47 (23.4%) 4/19 (21.1%) 5/23 (21.7%) 4/16 (25.0%) 4/16 (25.0%) 5/20 (25.0%) 11/46 (23.9%) 6/24 (25.0%) 6/24 (25.0%) 18/73 (24.7%) 4/18 (22.2%) 3/14 (21.4%) 2/10 (20.0%) 13/52 (25.0%)
1280−07−20 1268−03−10 1274−05−31b 1276−07−22 1280−08−09 1274−05−31a 1290−08−24 1281−06−06 1287−09−08 1271−09−17 1263−05−27a 1283−12−26 1268−08−02a 1282−12−22 1260−02−21a 1276−06−10a 1289−04−19 1270−06−06b 1279−03−10 1289−08−01 1267−10−22 1276−09−16 1270−11−26 1236−05 1278−10−17 1278−12−03 1260−05−09 1264−04 1286−05−15 1283−05−02 1270−04−16 1280−05−05 1263−05−27b 1284−06−09 1277−05−04 1277−05−19 1281−03−03 1287−06−24 1289−04−05 1282−02−01a 1244−01−19 1267−03−23 1242−05−02 1271−07−25 1284−02−12 1268−05−31 1271−05−22 1252−03−01a 1278−04−04a 1260−05−30b 1268−08−02b 1286−03−23 1275−01−10b 1263−05 1270−03−24 1271−03−18 1282−03−03 1252−03−01b 1255−05−21 1260−10−02 1243−07−09 1263−11 1273−12 1277−06−12 1274−09−06 1275−01−10a 1287−10 1289−07−19 1274−06−30 1278−04−06 1260−05−14 1264−09−07 1272−03 1247−06 1277−07−01 1272−07−08 1265−05b
5.39e−05
1
F IG . 6.88 – Répulsions significatives entre RB et PPD, pour les constituants de type 0,0,Co,0,0 (niveaux: phrase, pers, pers-arg, synt, synt-arg, ¬pers, ¬pers-arg)
321
C6
2.5 32 28 24 20 16 12 8 4 0
Densité
2.0 1.5 1.0 0.5 0.0 0.0
0.2
0.4
0.6
0.8
1.0
Coordonnants
40 36 32 28 24 20 16 12 8 4 0
2.5
Densité
2.0 1.5 1.0 0.5 0.0 0.0
0.2
0.4
0.6
0.8
Test de Wilcoxon: p = 0
1.0 0.8 0.6 0.4 0.2 0.0 C6
Co
F IG . 6.89 – Proportions de marquage des C6 et des Co
322
0 1
FAB
FRE
997 5 1002
99.5 0.5 100
0 1
0
200
400
600
800
TAB . 6.89 – Tri à plat de PPF, pour les constituants de type 1,0,C6,0,0 (niveau: phrase)
F IG . 6.90 – Réalisation de ponctogramme après un C6: grattage (Document 1270–09–29, 18)
gramme à la suite d’un 1,0,C6,0,0 est si faible que seul un examen manuel est envisageable: « [15] et · che ke deuant dıt eſt par nostre arbıtre commandons noſ a˘tenír az partıez deuant dıteſ ſor le paínne kı míſe íeſt» (Document 1270–04–16, 15). ˘
«· et · [ı] ſılh navoıt paıſ le xııj · mvı de˘ſpeate [19] devan˘dıſ devenſ lotavle de˘ſent andrıe · lı vıj · bonıer [20] dalue deſor dıt ſunt le poureſ ſen demíner ſen nul aıor [21]nemen feır parcouent faıt» (Document 1270–09–29, 18).
˘
˘
˘
«· et · nos lí eſkeuıen [28] de líege deſoírnomeít conıſſons ke nos fumes · a ces [29] conuenances et a ceſt recort kı cí deſoír eſt eſcrís [30] et ke lí maíres deuant˘dís le míſt en nostre warde · et [31] ke nos bíen en awímes nos droıtures» (Document 1275–01–10, 27). ˘
«et / [26] par chu ke che ſoıt ferme choſe et eſtaule sı auons nos pendut a ces preſens · lettre nostre saíal [27] en teſmongnage de verıteıt» (Document 1280–05–04, 25). «· et / [30] ce ſera tantoſt apres mon treſpaſ» (Document 1283–02–13b, 29).
Il est impossible de justifier l’apparition de la ponctuation à la suite de ces C6 par leur environnement morphosyntaxique. Il faut se limiter à observer que, dans trois des cinq cas en présence, le ponctogramme interagit avec le reste du système graphique. Ainsi, la deuxième attestation ci-dessus se réalise comme montré dans la photographie 6.90, où l’on voit que le ponctogramme précède un linéogramme qui a été gratté. Il est possible que le ‹·› présent derrière le ‹z–› soit lié à une unité qui n’apparaît pas dans le texte final. Il faut dès lors conclure que le ponctogramme est là par erreur. Les deux dernières occurrences de la liste présentent des ponctogrammes en fin de ligne. 6.3.2.2
Relateurs non coordonnants
Les relateurs non coordonnants repoussent également la ponctuation finale, mais les fréquences absolues du tri à plat suivant montrent que les ponctogrammes apparaissent parfois à leur suite (table 6.90). Que nous apprend le contexte immédiat de ces relateurs? D’après les figures 6.91 et 6.92, les constituants qui attirent la présence de 323
0 1
FAB
FRE
11610 100 11710
99.15 0.85 100
0 1
0
2000
4000
6000
8000
10000
TAB . 6.90 – Tri à plat de PPF, pour les constituants de type 1,0,Rl,0,0 (niveaux: phrase, pers, pers-arg, synt, synt-arg, ¬pers, ¬persarg) Attractions (seuil adapté 0.394%) 0,0,Ap,0,0 0,0,C5,pers,1 0,0,Rl,0,0
87/5577 (1.6%) 1/32 (3.1%) 1/78 (1.3%) 5.59e−15
1
F IG . 6.91 – Attractions significatives entre MMS et PPF, pour les constituants de type 1,0,Rl,0,0 (niveaux: phrase, pers, pers-arg, synt, synt-arg, ¬pers, ¬pers-arg) Répulsions (seuil adapté 0.394%) 0,1,Ap,0,0 0,0,S1,0,0 0,0,Dt,0,0 0,0,A4,0,1 0,1,P0,0,0 0,0,P0,0,0 0,0,Ap,¬pers,0 0,0,C5,0,0 0,0,C5,0,1 0,0,R2,0,0
11/4353 (0.25%) 0/1013 (0.00%) 0/10 (0.00%) 0/14 (0.00%) 0/189 (0.00%) 0/185 (0.00%) 0/33 (0.00%) 0/85 (0.00%) 0/50 (0.00%) 0/53 (0.00%) 9.4e−08
1
F IG . 6.92 – Répulsions significatives entre MMS et PPF, pour les constituants de type 1,0,Rl,0,0 (niveaux: phrase, pers, pers-arg, synt, synt-arg, ¬pers, ¬pers-arg)
marquage sont les 0,0,Ap,0,0. En conséquence, vu les découvertes présentées dans la section →6.2, nous avons certainement affaire à des nombres ou des noms de personnes. L’examen des attestations83 indique en effet que presque tous les cas de marquage concernent des relateurs précédant un nombre ou un titre; par exemple: «· lequeles · xvıj · verges baduíns lı marchans kı lalut vendı tínt en hıretage [8] por · xxıj · ſtırs deſpeate bone et loıaz chaſcun an alıege alíuerer aſe deſpens · et a la [9] meſure de˘lıege» (Document 1263–07–20, 7). ˘
«[9] et je par le jugement et lenſengnement de˘mes homes donaı en fıez al ·· abbeıt et a couent deuant [10] dıt tot luſage et tot le droıt ke je auoı en leawe deſor dıte ſen nıent a˘retenír / sauf les [11] droetures mes peſſoers de flones / dengıs et de chamont» (Document 1271–04–20, 9). ˘
˘
Apparemment, presque toutes les attestations de signes à la suite des constituants peuvent être justifiées par des causes extérieures à la morphosyntaxe. Par ailleurs, il est également remarquable qu’une seule attestation de PPF.1 n’apparaît pas au niveau de la syntaxe immédiate, comme le montre la tabulation 6.91; la voici: 83 Voir le dépouillement en annexe.
324
MI.pers MI.pers-arg MI.¬pers MI.¬pers-arg MI.synt MI.synt-arg
PPF.0
PPF.1
575 700 105 270 5215 4745 11610
0 1 0 0 47 52 100
* 575 701 105 270 5262 4797 11710
TAB . 6.91 – Tri croisé MI × PPF pour les constituants 1,0,Rl,0,0
0 1
FAB
FRE
3207 53 3260
98.37 1.63 100
0 1
0
500
1000
1500
2000
2500
3000
TAB . 6.92 – Tri à plat de PPF, pour les constituants de type 0,0,Co,0,0 (niveaux: phrase, pers, pers-arg, synt, synt-arg, ¬pers, ¬pers-arg) Attractions (seuil adapté 0.190%)
9/163 (5.5%) 20/697 (2.9%) 3/64 (4.7%) 3/103 (2.9%) 10/518 (1.9%)
0,0,R2,0,0 0,0,Ap,0,0 0,1,R2,0,0 0,1,C5,0,1 0,1,Ap,0,0
0.000202
1
F IG . 6.93 – Attractions significatives entre MMS et PPF, pour les constituants de type 0,0,Co,0,0 (niveaux: phrase, pers, pers-arg, synt, synt-arg, ¬pers, ¬pers-arg) «et otrıons a˘la˘cıteıt delıege · que / ſe [8] eſtoıt rebelles de paír les fermetez deuant dıtes / elle le˘poroıt [9] deſtraíndre a˘paır · en quel manıere que mıes lur˘ſemblera afaıre · ſennos [10] aforfaıre de rıen · et aler en ˘contre noſtre íuſtıce» (Document 1249–06–25, 7). ˘ ˘
˘
˘
˘
˘
Nous ne nous hasarderons pas à commenter cette occurrence, pour laquelle nous ne voyons aucune explication plausible. Les observations sur la ponctuation finale des relateurs confirment que les phénomènes attirant le marquage sont prioritaires sur ceux attirant le non-marquage (→6.1.2.4). 6.3.2.3
Relateurs coordonnants
Les relateurs coordonnants marqués à la finale sont peu nombreux également (table 6.92) et ce sont à nouveau les 0,0,Ap,0,0 qui ressortent (figure). Nous devons donc faire un dépouillement manuel,84 qui nous apprend que les nombres sont le plus souvent marqués. Par exemple:
84 Voir en annexe.
325
Répulsions (seuil adapté 0.190%) 0/217 (0.00%) 0/195 (0.00%) 0/134 (0.00%) 0/83 (0.00%) 0/12 (0.00%) 0/12 (0.00%) 0/12 (0.00%) 0/73 (0.00%) 0/13 (0.00%) 0/63 (0.00%) 1/134 (0.75%) 0/17 (0.00%) 0/18 (0.00%) 1/71 (1.41%) 0/20 (0.00%) 0/46 (0.00%) 0/23 (0.00%) 0/25 (0.00%) 6/382 (1.57%) 0/26 (0.00%) 0/35 (0.00%) 0/29 (0.00%)
0,0,P0,0,0 0,0,C5,0,1 0,1,P0,0,0 0,1,Ap,pers,1 0,0,Dt,0,0 0,0,R3,0,0 0,1,R2,¬pers,0 0,0,Rl,0,0 0,0,A4,0,0 0,0,R3,0,1 0,1,Dt,0,1 0,1,R3,0,1 0,1,R2,pers,1 0,0,C5,0,0 0,1,C5,0,0 0,1,S1,0,0 0,1,Dt,0,0 0,1,Ap,¬pers,0 0,0,S1,0,0 0,1,A4,0,1 0,0,A4,0,1 0,0,Dt,0,1
0.0924
1
F IG . 6.94 – Répulsions significatives entre MMS et PPF, pour les constituants de type 0,0,Co,0,0 (niveaux: phrase, pers, pers-arg, synt, synt-arg, ¬pers, ¬pers-arg)
«· conute choſe ſoıt achaſcun et atoſ ke [3] noſ auonſ donet warníer le bolengıer con dıſt de rumezéſ vne maſon [4] en˘hıretage luj´ et ſeſ oırſ kı ſıet apont damercuer deleſ lemaıſon johan [5] le craſ enſ ele voıe de ſaín remacle por vínt ſos de˘lıgoıſ cheſcun an [6] et quatre chaponſ apaıer · x · ſols anoıel et · ıııj · chaponſ · et · x · ſols ale ſaín [7] johan baptıſtre et a · ıj · ſols · de˘requíſtıſon doír aautre» (Document 1252–03–01b, 2). ˘
˘
˘
«· [3] sacent treſtuít cılh kı ſunt · et kı a venír ſunt kenz el an dele jncarnatıon nostre ſangor [4] jheſu crıſt · m · et · cc · et · lx · vıj · lendemaín dele feſte ſaínt ſ˙ymon · et ſaínt jude · vınrent [5] pardeuant noſ · entre ſaínte marıe · et ſaínt lambert a lıege · werrıſ lı fız dame raínewj´ [6] de holonge ſor jer dune part · et ſıre arnulz lı preſtreſ · capelaínz del alte ſaínt jakeme [7] de g˙yneffe dautre part» (Document 1267–10–29, 2).
6.4
Conclusions sur la fréquence du marquage
Au cours de ce chapitre, nous avons progressivement examiné les constituants attirant ou repoussant la ponctuation de manière significative. 6.4.1
Cohérence dans le corpus
Quand les effectifs suffisent à le tester, les tendances peuvent être considérées comme générales. Il n’y a donc aucune raison de penser, comme on a pu le dire précédemment à propos d’autres documents, que la ponctuation des chartes est «sommaire» et qu’elle n’«obéi[t pas] à des règles précises» (Monfrin 1974, lxiv). Bien sûr, nous n’avons généralement examiné que des tendances et non des règles d’implication. En ce sens, il est certain que les utilisateurs de la ponctuation médiévale avaient la possibilité de poser des choix, mais nous avons pu identifier un certain nombre de structures particulièrement liées à l’emploi de ponctogrammes. Malgré tout, il est fréquent que quelques documents manifestent une régularité 326
plus importante que les autres dans le respect de certaines tendances,85 voire soient les seuls à les attester.86 De même quasi chaque tendance délimite un petit ensemble de chartes qui s’opposent aux tendances générales. Ainsi, alors que la plupart des chartes marquent régulièrement les limites de la phrase, certaines n’emploient pas un ponctogramme à cette position (→6.1.1.1 a et →6.1.1.2 a). Pareillement, alors que la fonction de coordonnant attire généralement PPD.1, quelques textes repoussent particulièrement cette tendance. L’existence d’une ligne directrice commune et d’inclinaisons plus ou moins marquées à suivre la mouvance générale ou à s’en détacher correspond à ce qui est observable, en linguistique traditionnelle, lorsqu’on parle de normes et d’usages, ceux-ci se positionnant par rapport à celles-là. En d’autres termes, il y a tout lieu de penser qu’il est envisageable d’étudier la ponctuation sous l’angle de sa variation. Le marquage des actants dans les testaments (→6.1.3.4, →6.1.3.5 et →6.1.3.11) et la propension à marquer certaines structures formulaires87 pourraient former l’embryon d’une étude variationnelle de la ponctuation dans la société – en fonction des types discursifs et des structures textuelles. Bien entendu, tout reste à faire: non seulement ce type d’étude demanderait qu’un nombre considérablement supérieur de documents soient examinés, mais en plus les notions de description diplomatique sont, nous l’avons déploré (→6.1.3.14 a), encore trop vagues pour permettre une analyse fine de la relation entre l’acte juridique et l’acte écrit.88 Enfin, les descriptions diaphasiques et diastratiques nécessitent que soit pris en compte un nombre conséquent de variables extralinguistiques, relevant tant de l’histoire que de la sociologie. 6.4.2
Interférences non contrôlées
Notre choix initial était de ne considérer que la structuration morphosyntaxique des textes (→0.1.1.2). Nous n’avons donc pas établi de cadres descriptifs précis concernant les points de vue sémantique et énonciatif.89 Néanmoins, l’observation directe des attestations dans leur contexte a permis de montrer concrètement les limites de l’analyse fondée sur la syntaxe: la ponctuation des constituants est parfois liée à des faits d’ordre sémantique ou énonciatif. 6.4.2.1
Interférences sémantiques
Du reste, l’analyse de la ponctuation en syntaxe immédiate (→6.2) et l’examen des attestations allant à l’encontre des tendances générales dans le cadre de la syntaxe argu85 Il suffit par exemple d’observer la manière dont se répartissent les documents du marquage
86 87 88 89
initial de la phrase (→6.1.1.1) pour voir que certains d’entre eux ponctuent la phrase dans tous les cas. Voir, pour le marquage final de 0,0,R3,0,1, par exemple, la figure 6.42, page 276. Voir les inventaires dans les synthèses pour chaque section: →6.1.2.4 c pour le prédicat, →6.1.3.14 c pour les actants et A4 et →6.1.4.12 c pour les circonstants. Souvenons-nous de la réflexion sur la nature de l’unité texte et de ses relations avec le contexte de sa construction (→3.1.2.1 b). Voir →3.1.3.1 sur la théorie des trois points de vue.
327
mentale (par exemple, →6.1.3.5) ou du marquage des relateurs (notamment →6.3.2.2) font penser que certains faits dont le point de vue morphosyntaxique n’est pas à même de rendre compte, influencent le marquage de manière non négligeable. Ces faits sont de nature sémantique. Ainsi, les chiffres paraissent «encadrés» par une ponctuation de part et d’autre, alors que les noms de personnes ou les titres sont parfois marqués à l’initiale par un ponctogramme. En employant des méthodes statistiques, il n’est pas possible, sans dépasser le cadre étroit de la syntaxe, d’être assuré de l’importance de ces tendances, puisque nous n’avons pas les moyens d’extraire l’ensemble des chiffres ou l’ensemble des noms de personnes. Cet état des lieux est gênant. Le marquage des chiffres est sans conteste celui qui a été intuitivement perçu comme le plus répandu. Les noms de personnes sont également bien reconnus comme un facteur attirant le marquage.90 En somme, ces tendances sont ainsi justifiées par une recherche philologique, mais cette dernière ne justifie pas qu’on les prenne en considération dans une étude censée se limiter à décrire les relations entre la ponctuation et la syntaxe. Selon nous, c’est le fait que cette ponctuation soit fréquente et qu’elle interfère avec la ponctuation syntaxique qui justifie que nous en tenions compte. Un marquage à valeur non syntaxique est forcément distribué autour des structures syntaxiques, c’est là un fait évident qui a été relevé dès les premières études sur le sujet.91 En outre, un marquage fréquent a la propriété d’influencer dramatiquement les décomptes dans lesquels il est impliqué. Il y a donc un danger à ne pas considérer les faits extérieurs à la syntaxe: par exemple, celui de considérer qu’une structure entière est souvent marquée à l’initiale, alors que son marquage est lié au fait qu’elle débute souvent par un chiffre ou un nom de personne. . . C’est pourquoi nous nous devrions de vérifier, pour chaque tendance, si les chiffres et les noms n’y sont pas impliqués outre mesure. Pour pouvoir appliquer des méthodes numériques à ce problème, il faudra attendre que notre corpus soit enrichi d’une lemmatisation appropriée. Nous avons néanmoins pu le faire intuitivement de manière satisfaisante à chaque fois que les effectifs rendaient l’opération manuelle raisonnablement réalisable. 6.4.2.2
Interférences énonciatives
Du fait de l’emploi que les protagonistes d’une action juridique font de l’objet charte, la rédaction du texte de cette dernière est tributaire de conventions de rédaction formalisées et formulaires. Contrairement aux interférences ayant trait au caractère sémantique des unités, l’importance du marquage de structures stéréotypées, qui revêt une dimension énonciative et pragmatique, ne nous met pas autant dans l’embarras. Comme le montre particulièrement l’étude du marquage des actants, les formules attirant le marquage sont souvent d’une forme morphosyntaxique particulière, qui laisse penser que l’aspect énonciatif converge avec l’aspect morphosyntaxique. Ainsi, les structures 1,0,R3,0,1 semblent réservées à l’adresse du texte (→6.1.3.12), de même que les 0,1,R2,pers,1 comme régime d’un prédicat à l’infinitif sont liées à des formules du type _faisons
90 Voir Monfrin 1974, lxiv. 91 Voir Marchello-Nizia 1978, 48.
328
savoir que. . . _. Lorsque la correspondance est si nette, nous estimons que le modèle syntaxique suffit à rendre compte de la tendance. Cependant, non seulement certaines formules échappent à cette régularité – comme c’est le cas de _x qui l’afaitement fit_, relevé en étudiant le marquage du prédicat –, mais en plus, il n’est pas possible de tenir compte simultanément de la présence et de l’absence du marquage sans un dépouillement exhaustif. À nouveau, privé de décomptes précis nous avons néanmoins relevé le phénomène, dans l’attente sur le système de la ponctuation dans ses relations avec d’autres points de vue que celui sur lequel nous avons concentré nos efforts. 6.4.3
Remise en question du modèle
L’intérêt de la confrontation des deux modèles construits dans la première partie n’est pas exclusivement pratique. Nous avons vu à plusieurs reprises que l’analyse pouvait mener à la remise en question des fondements épistémologiques de la description du champ morphosyntaxique. Au travers de faits concrets, nous avons ainsi pu formuler quatre critiques importantes. 6.4.3.1
Lexèmes employés
La structure 0,1,R2,pers,1 a attiré notre attention sur la formule _savoir faisons que. . . _, qui alterne dans les documents avec la formule _a savoir faisons que. . . _ (→6.1.3.9). Or, malgré la ressemblance des deux formules (elles ne diffèrent que par l’emploi du relateur), la structure «profonde» que nous proposons les envisage comme radicalement différentes (→3.4.4.6). Notre modèle ne tient pas assez compte du lexique employé, lequel relève du point de vue morphosyntaxique. 6.4.3.2
Coordination et apposition
La mise en évidence de l’importance de la coordination vis-à-vis de la ponctuation s’est faite progressivement, en examinant le contexte immédiat des constituants marqués. Nous avons, par exemple, remarqué que les 0,0,S1,0,0 attiraient le marquage final lorsqu’ils étaient suivis d’un autre constituant du même type ou d’un coordonnant.92 L’observation de faits semblables pour d’autres constituants93 a mené à la conclusion que la coordination était fortement impliquée vis-à-vis de la ponctuation. Il nous fallait donc étudier l’attraction entre les structures coordonnées et le marquage. D’autres faits proches de la coordination n’ont pas été considérés comme en relevant. Ainsi, nous avons vu que les propositions comprenaient fréquemment plusieurs circonstants successifs, mais non coordonnés d’après notre modèle (→6.1.4.12 b). De même, les propositions relatées de mode personnel en syntaxe immédiate se succèdent régulièrement sans que le fait ne soit décrit comme une coordination. Il y aurait lieu de reprendre le problème dans son ensemble, peut-être pour étendre la notion de coordination.
92 Voir la figure 6.25, page 265. 93 Voir par exemple les figures 6.29 et 6.33.
329
6.4.3.3
Description de la syntaxe immédiate
Nous ne reviendrons pas longuement sur ce problème, qui constitue selon nous la principale faiblesse du modèle décrit au chapitre →3. Bien qu’économique, le modèle ne suffit pas à rendre compte de toutes les subtilités de la syntaxe immédiate. Il a néanmoins permis de comprendre un certain nombre de mécanismes et de mettre en relation les tendances de ponctuation liées à la morphosyntaxe à celles liées à la sémantique. 6.4.3.4
Coordonnants et autres relateurs
Traitée spécifiquement, la question de la coordination nous a également amené à réviser la manière dont nous concevons l’insertion syntaxique des coordonnants (→6.1.5.3 b). Le rôle démarcatif de la ponctuation invite en effet à comprendre les blocs qu’elle permet d’isoler comme des groupements de constituants fonctionnant ensemble. Or, notre analyse du coordonnant le plaçait en quelque sorte «en dehors» de tous les syntagmes ou groupes coordonnées (→3.4.7.2). L’examen de la ponctuation sert ici de révélateur. Peut-être le modèle est-il inutilement compliqué? Il semble qu’assimiler le fonctionnement des coordonnants à celui des autres relateurs ne nuirait pas à la finesse de la description. 6.4.4
«Règles» et proportions de marquage expliqué
Nous pouvons conclure en formulant l’hypothèse suivante: la cohérence des tendances témoigne qu’il existe un consensus, une pratique partagée par une communauté, dont les membres connaissent un certain nombre de règles qu’ils appliquent et un certain nombre de tendances qu’ils sont libres de suivre ou non. 6.4.4.1
Interdictions
Si l’on admet que la ponctuation a une fonction visuelle générale d’aide à la lecture, sa présence dans des endroits incongrus devient un obstacle à l’intelligibilité, alors que son absence là où on pourrait la rencontrer reste généralement anodine. En somme, si l’on doit parler de «règles», il y a lieu de les nommer interdictions: – on ne ponctue pas le prédicat (→6.1.2.4); – on ne met pas de ponctogramme à la suite d’un relateur ou d’un C6 (→6.3.2); – on ne rompt pas la cohésion du syntagme. Face à ces règles, nous avons pu observer un certain nombre de licences, toutes liées au contexte immédiat: – la coordination attire la ponctuation; – bien que cela ne soit pas vérifié, les chiffres et les noms de personnes permettent la ponctuation. Ainsi, les environnements favorables prévalent sur ceux qui rejettent la ponctuation. Ces observations révèlent toute la dimension fonctionnelle de la ponctuation: l’absence de marque correspond à une indication de continuité, la fonction principale
330
any.0 any.1
P.0
P.1
47057 11063 58120
1335 4712 6047
48392 15775 64167
P.0
P.1
237.34 -728.08
-2281.19 6997.88
θ
15
χ2 = 10241.32, ddl = 1, p = 0 ★★★
TAB . 6.93 – Proportions de marquage expliqué par une tendance générale (repris)
1 0
FAB
FRE
4712 1335 6047
77.92 22.08 100
1 0
0
1000
2000
3000
4000
TAB . 6.94 – Tri à plat de la position (limite de constituant attirant le marquage ou non) pour les positions ponctuées (repris)
0 1
FAB
FRE
47057 11063 58120
80.97 19.03 100
0 1
0
10000
20000
30000
40000
TAB . 6.95 – Tri à plat de la position (limite de constituant attirant le marquage ou non) pour les positions non ponctuées (repris)
des ponctogrammes paraissant jusqu’à présent être la démarcation des unités. Ne pas mettre de ponctogramme revient à préserver l’unité graphique des mots entourant la position qui aurait pu être ponctuée. Les «unités de lecture» médiévales sont telles que le contexte immédiat du prédicat et les mots suivant les relateurs en sont rarement détachés, ce qui nous conforte dans l’analyse que nous avons pu donner de la relation entre différents types d’arguments et le prédicat (→3.4.2) et du statut hiérarchique des relateurs (→3.2.2.2 et →3.4.4.2). 6.4.4.2
Régularité des tendances
On pourrait dire que la sélection d’un petit nombre de tendances fortes permet d’expliquer une proportion avoisinant 80% des ponctogrammes (table 6.93). Si, de manière abstraite, beaucoup de structures sont effectivement «ponctuables», dans les faits, seules certaines d’entre elles attirent effectivement la ponctuation. On peut regarder les résultats d’une autre manière, et construire le tableau 6.96, qui reprend, pour chaque tendance attirant la ponctuation, les proportions de présence effective d’un ponctogramme. Ainsi, dans le graphique 6.95, les barres foncées représentent la fréquence absolue de non-marquage des positions indentifiées sur l’axe vertical. Les barres claires expriment la quantité de marquage dans les mêmes positions. On y visualise clairement que toutes les attractions n’ont pas la même régularité. La ponctuation de l’énoncé est la plus régulière et explique un très grand nombre de positions, alors que la ponctuation des membres coordonnés est la moins systématique, mais explique la plus grande partie des occurrences de ponctogrammes. La ponctuation des
331
Coordination Circonstant Actant Énoncé
0
1
8423 2265 459 420 11567
2480 844 275 1462 5061
10903 3109 734 1882 16628
TAB . 6.96 – Tri croisé des proportions de marquage × environnements Énoncé Présence Actant
Absence
Circonstant Coordination
0
2000
4000
6000
8000
F IG . 6.95 – Graphique des proportions de marquage expliqué par les environnements
actants et des A4 est intermédiaire, de même que celle des circonstants. Nous avons toutefois vu que la première était très spécifique à certains types de documents ou à certaines formules figées (→6.1.3.14), alors que la seconde est plus répandue et paraît se rapprocher de la coordination (→6.1.4.12 b). 6.4.4.3
Puissance explicative
Les dépouillements et analyses résolvent la question de savoir jusqu’où il faut aller dans la recherche des unités, mais exclusivement dans le cadre du modèle proposé comme référence. Si nous avions considéré toute position comme étant ponctuable, nous aurions «justifié» toute la ponctuation, sans pour autant l’expliquer de manière satisfaisante. En posant les limites d’un modèle, puis celles fixées par les effectifs, les proportions et les tests statistiques adéquats, nous avons volontairement limité la puissance explicative de notre exposé, reléguant la responsabilité de l’explication d’une partie des phénomènes ponctuationnels à d’autres études.
332
7
Forme du marquage
Les deux derniers chapitres ont été entièrement focalisés sur les relations qu’entretenaient les constructions syntaxiques avec les modalités de PPD et de PPF, c’est-à-dire des variables dont les modalités sont très abstraites, opposant simplement la présence à l’absence de ponctogramme – voir →5.0 sur la définition de ces variables, en particulier →5.0.2.3. Ce choix initial, visant à canaliser les données pour permettre un traitement général, a abouti à la définition de grandes tendances expliquant une grande partie des occurrences de ponctogrammes dans les chartes. Les grandes lignes ont été tracées. Il nous paraît opportun de revenir aux formes de ponctogrammes et d’étudier leurs relations avec la syntaxe. Nous commencerons par présenter les données soumises à l’analyse, ce qui aboutira à la création d’un grand tableau de contingence. La forme des ponctogrammes sera confrontée au contexte syntaxique de leurs attestations (→7.1). Ce tableau sera ensuite soumis à l’analyse factorielle des correspondances, outil particulièrement adapté à notre problématique. Cette démarche mènera à la découverte de plusieurs associations de forme et de structure (→7.2). Celles-ci seront testées à l’aide de techniques similaires à celles que nous avons employées précédemment (→7.3). Enfin, nous observerons les occurrences des ponctogrammes les plus rares (→7.4).
7.1
Données soumises à l’analyse
Nous devons définir les données soumises à l’analyse. Nous verrons tout d’abord quelles formes de ponctogrammes apparaissent dans les documents et en quelle quantité chacune d’entre elles est attestée (→7.1.1). Nous serons alors à même de mettre les occurrences de ces signes en relation avec les structures syntaxiques. Cela mènera à la construction du tableau de contingence qui sera soumis aux analyses (→7.1.2). 7.1.1
Fréquence des ponctogrammes
Dans ce chapitre, l’individu étudié est le ponctogramme. Chaque individu est défini par une variable dont les modalités sont les différentes formes que prennent les signes. En effectuant un tri à plat sur cette variable, on obtient le tableau 7.1. Bien qu’il ne nous informe pas encore sur la manière dont les ponctogrammes interagissent avec la syntaxe, ce tri à plat nous appelle à la vigilance. En effet, la surabondance de la forme ‹·› et la faible fréquence de la majorité des autres ponctogrammes risquent de compliquer l’analyse. D’autre part, on présume que la grande variété de forme des signes était superflue
333
· /’ · ·· / · ¶ ; // – : ·/ ·¶·
FAB
FRE
4681 863 179 108 62 53 7 6 3 2 1 1 5966
78.46 14.47 3 1.81 1.04 0.89 0.12 0.1 0.05 0.03 0.02 0.02 100.01
TAB . 7.1 – Tri à plat des formes de ponctogrammes
pour la majorité des scribes: malgré l’abondance de signes disponibles et la variété des constructions, il est probable que la plupart de ces dernières soient marquées de la même manière, quelles que soient leurs différences. Nous devons donc trouver l’outil adéquat au traitement de ces effectifs déséquilibrés. 7.1.2
Création du tableau de contingence
Au delà de leur intérêt propre, les tendances que nous avons considérées comme générales nous offrent un ensemble qui peut servir de cadre de référence pour une étude plus ciblée. Nous ne sommes plus perdu devant un énorme ensemble de structures variées, puisque nous avons pu mettre en évidence que la majorité des ponctogrammes se manifestaient dans des contextes particuliers. Plutôt que de considérer à ce stade l’ensemble des environnements syntaxiques possibles, nous ne sélectionnerons parmi eux que ceux dont nous sommes certain qu’ils attirent le marquage. Ainsi, les ponctogrammes sont définis par une seconde variable: l’environnement syntaxique attirant le marquage, c’est-à-dire sept modalités: 1. Énoncé: le ponctogramme se trouve entre deux énoncés (voir la synthèse →6.1.1.3). 2. Actant D: le ponctogramme se trouve devant un actant attirant la ponctuation initiale (→6.1.2.4). 3. Actant F: le ponctogramme se trouve derrière un actant attirant la ponctuation finale (→6.1.2.4). 4. C5 D: le ponctogramme se trouve devant un circonstant attirant la ponctuation initiale (→6.1.3.14). 5. C5 F: le ponctogramme se trouve derrière un circonstant attirant la ponctuation finale (→6.1.3.14). 6. Coord.: le ponctogramme se trouve à une des bornes d’un constituant coordonné et ne suit pas un coordonnant (→6.1.5). 7. Aucun: le ponctogramme n’est pas expliqué par une des tendances mises à jour. Pour respecter les contraintes de construction des tables de contingence, nous avons retiré de l’échantillon les positions correspondant simultanément à plusieurs ten-
334
– ; : / ·’ · / // · ·/ ·· ·¶· ¶
Aucun
Actant F
Actant D
C5 F
C5 D
Coord.
Énoncé
1 0 1 25 42 227 4 961 0 70 0 0 1331
0 0 0 0 44 12 0 82 0 9 0 0 147
0 0 0 0 0 9 0 14 0 0 0 0 23
0 0 0 15 48 108 1 162 0 3 0 0 337
0 0 0 3 7 37 0 106 0 0 0 0 153
0 0 0 8 16 272 1 1765 1 15 0 11 2089
2 7 1 4 7 109 0 1165 0 8 1 23 1327
3 7 2 55 164 774 6 4255 1 105 1 34 5407
TAB . 7.2 – Tri croisé environnement × forme du ponctogramme
dances. La tabulation de la variable décrivant la forme avec celle décrivant l’environnement produit la table de contingence 7.2. Devant un tel tableau, il est difficile d’avoir une idée d’ensemble de la manière dont les lignes et les colonnes sont effectivement associées. Un test sur l’ensemble n’est pas possible, étant donné l’importante quantité de cases présentant un effectif très faible, voire nul.1 Il n’est pas non plus envisageable de comparer entre elles toutes les cellules: on aboutirait à un ensemble inexploitable – parce que trop large – de tests dépendant les uns des autres. Tout ce qu’on peut déjà remarquer est que certains signes, très rares, ne sont attestés que dans des environnements très limités, alors que le signe ‹·› est toujours le plus fréquent, quel que soit l’environnement dans lequel on le rencontre. Nous devons donc nous servir d’une technique qui nous permette d’y voir plus clair dans cette grande table de contingence.
7.2
Analyse factorielle des données
Dans le monde francophone,2 on utilise couramment l’analyse factorielle des correspondances (AFC) pour analyser de grands tableaux de contingence. L’AFC fait partie de la famille des statistiques exploratoires. Ces dernières s’opposent aux statistiques inférentielles, dont relèvent tous les tests que nous avons employés jusqu’ici. En effet, elles visent à donner un aperçu général de la structure des données, non à calculer des probabilités. Pour faciliter la lecture de grandes tables de contingence, l’AFC les divise en une série de tables unidimensionnelles simples (→7.2.1). Ces tables simples sont ensuite combinées en une représentation graphique bi– ou tridimensionnelle (→7.2.2) qui peut être interprétée (→7.2.3).
1 2
Voir la colonne des totaux dans le tableau de contingence 7.2. Les méthodes factorielles n’ont pas conquis aussi aisément les statisticiens anglo-saxons (Meter et al. 1994); en témoigne le volumineux Méthodes statistiques en sciences humaines de David C. Howell (1998), qui ne mentionne pas cette technique dans le panorama qu’il dresse.
335
Valeurs propres 67.73% 17.81% 10.49% 3.52% 0.41%
0.12
0.10
0.08
0.06
0.04
0.02
0.00
0.04%
F IG . 7.1 – Décomposition en valeurs propres
Aucun Actant F Actant D C5 F C5 D Coord. Énoncé
CD1
CT1
CS1
-0.13 -1.40 -0.06 -0.85 -0.18 0.17 0.26
0.03 0.41 0.00 0.34 0.01 0.08 0.13
-0.20 -0.76 -0.01 -0.82 -0.27 0.74 0.64
TAB . 7.3 – Points-colonnes, données numériques (1er facteur)
7.2.1
Décomposition du tableau
La base de l’AFC est la décomposition en facteurs. Celle-ci simplifie les tableaux de contingence complexes en plusieurs petites tables unidimensionnelles qui, lorsqu’on les considère toutes simultanément, permettent d’appréhender le tableau entier.3 . Chacune de ces petites tables, ou facteurs, représente une partie de l’information contenue dans le grand tableau (son inertie ). La proportion d’inertie expliquée par chaque facteur décroît rapidement: le premier d’entre eux explique une grande partie de l’inertie, le deuxième un peu moins, le troisième encore un peu moins, etc. L’inertie est ainsi décomposée en valeurs singulières (Lebart/Salem 1994, 15–31, Greenacre 1994, 12– 14). On parle également de trace (Lebart/Salem 1994, 90). Il faut cinq facteurs pour expliquer l’intégralité de la ventilation du tableau de contingence sur lequel nous travaillons. On peut voir que la proportion de l’inertie totale expliquée diminue rapidement dans le graphique 7.1. Chaque facteur peut être interprété un axe, qui s’étend dans l’intervalle ] − ∞; ∞[. Cet axe possède un point central appelé origine, dont la coordonnée est 0. Chaque ligne et chaque colonne du tableau correspond à une coordonnée sur cet axe; on parle de points-lignes et de points-colonnes. Ces points sont calculés de manière à pondérer les petits effectifs et les prendre en compte. Pour la table étudiée, les points-colonnes sont positionnés sur le premier axe suivant les coordonnées (CD) données dans la première colonne du tableau 7.3 (les colonnes suivantes seront expliquées ensuite). On voit que certains points sont positionnés dans l’intervalle ] − ∞; 0[ et d’autres dans l’intervalle ]0; ∞[. Cette répartition représente une opposition entre les modalités associées aux points positifs et celles associées aux points négatifs. Plus un point est éloigné de l’origine, 3
Les calculs nécessaires à l’AFC ont été effectués à l’aide du paquet ADE-4. Les graphes et tableaux ont été générés à l’aide d’un ensemble de fonctions que nous avons écrites; voir le fichier R/cor.R dans le paragraphe consacré à R de la section Ressources des annexes.
336
plus la force du contraste dans lequel il est impliqué est grande. Par exemple, les actants et les circonstants ponctués à la finale ont une coordonnée négative très basse et s’opposent ainsi fortement à tous les autres points. Notons que le signe de la coordonnée n’a pas d’autre valeur que celle de marquer une opposition: si l’on multipliait toutes les coordonnées par −1, l’axe serait interprété de manière similaire et mènerait aux mêmes conclusions. La deuxième colonne du tableau 7.3, CT, donne la contribution (Lebart et al. 1998, 94–95) du point à la construction du facteur. La somme des contributions des points vaut 1 pour chaque axe. Plus la contribution d’un point est élevée, plus il est important dans le contraste inhérent au facteur. Ainsi, la contribution du point-ligne représentant les circonstants attirant la ponctuation finale est plus élevée que celle du point de l’énoncé. Du fait que les facteurs simplifient la grande table de contingence, la position des points sur les axes n’est qu’une approximation. La qualité de celle-ci est donnée par une mesure nommée cosinus carré (Lebart et al. 1998, 95–97), reportée dans la troisième colonne (CS) du tableau. Plus la valeur absolue du nombre figurant dans la colonne des cosinus carrés est proche de l’unité, plus la coordonnée calculée est fiable; un cosinus carré n’est jamais négatif (puisqu’il est le carré d’un cosinus) et le signe qui précède la valeur reportée dans le tableau correspond à celui de la coordonnée. Le point-ligne des circonstants attirant la ponctuation finale est plutôt bien représenté sur cet axe, alors que celui des circonstants attirant la ponctuation initiale l’est très mal. En conséquence, l’interprétation du facteur doit ignorer les points de faible cosinus carré. Il n’existe pas de règle mathématique fixant une limite à la qualité des points à considérer (Lebart et al. 1998, 97). 7.2.2
Représentation bidimensionnelle
Chaque facteur équivaut donc à un axe sur lequel sont positionnés des points plus ou moins bien représentés. La combinaison des coordonnées données par tous les axes obtenus par décomposition en valeurs propres permet de dessiner un espace à k dimensions, où k est le nombre d’axes. Dans cet espace, la projection géométrique du tableau de contingence est parfaite (la somme des cosinus carrés d’un point vaut 1): chaque facteur corrige l’approximation fournie par le(s) précédent(s) jusqu’à ce qu’aucune correction supplémentaire ne soit possible (Cibois 2000, 27–34). Malheureusement, l’être humain est incapable d’appréhender efficacement plus de deux dimensions – trois dimensions constituant naturellement un maximum. Les représentations tridimensionnelles ne sont pas facilement interprétables, parce que l’observateur est obligé de choisir un point de vue pour observer l’espace, ce qui élimine automatiquement la troisième dimension. C’est pourquoi on construit une visualisation planaire du tableau de contingence en prenant en considération les deux premiers axes de l’espace calculé. Ce plan représente la partie de l’inertie équivalant à la somme des contributions des vecteurs impliqués dans sa construction. Bien que réducteur, un plan formé par les deux premiers axes d’une AFC correspond souvent à une grande partie de l’inertie du tableau – Il dépasse généralement 90% de cette dernière. Pour dessiner ce plan, nous avons donc besoin de deux axes fournissant les coordonnées des points-colonnes du tableau 7.4 (la colonne R indique pour chaque point la proportion de qualité de représentation dont les axes précédents ne rendent pas
337
Aucun Actant F Actant D C5 F C5 D Coord. Énoncé
CD1
CT1
CS1
CD2
CT2
CS2
R
-0.13 -1.40 -0.06 -0.85 -0.18 0.17 0.26
0.03 0.41 0.00 0.34 0.01 0.08 0.13
-0.20 -0.76 -0.01 -0.82 -0.27 0.74 0.64
0.16 -0.76 0.52 0.23 0.19 0.00 -0.16
0.19 0.46 0.03 0.09 0.03 0.00 0.19
0.32 -0.23 0.49 0.06 0.28 0.00 -0.25
0.49 0.02 0.50 0.12 0.45 0.26 0.12
Actant D
0.4 C5 F
0.2
C5 D Aucun
0.0
Coord. Énoncé
−0.2 −0.4 −0.6
0.0
−0.5
−0.8 Actant F
−1.0
Contribution de f2 : 0.0345 (17.81 %)
TAB . 7.4 – Points-colonnes, données numériques
Contribution de f1 : 0.1312 (67.73 %)
F IG . 7.2 – Analyse factorielle des correspondances: points-colonnes
compte). En utilisant les coordonnées du premier axe pour positionner horizontalement les points et les coordonnées du second axe pour positionner verticalement les points, on dessine le plan de la figure 7.2. Seul le centre des disques correspond aux coordonnées. La surface des disques est proportionnelle à la qualité (cosinus carré) cumulée des points sur les deux axes employés. Grâce à cette représentation, on peut interpréter efficacement la distance qui sépare les différentes modalités. Par exemple, Actant F est plus éloigné de Actant D que de C5 F. Les points-lignes sont positionnés dans un espace distinct. Sur la base des ’ coordonnées du tableau 7.5, on dessine le plan de la figure 7.3 (les formes ‹·› et ‹·/› sont rendues respectivement par ‹?› et ‹!›). Chacun des deux espaces construits de la sorte donne une idée de la manière dont chaque modalité se comporte par rapport aux autres modalités de la même variable. On projette les deux plans ainsi obtenus dans un seul espace (figure 7.4; la couleur des disques n’a pas d’autre fonction que celle de permettre la distinction des points-lignes et des points-colonnes), ce qui permet d’interpréter les relations entre les points-lignes et les points-colonnes. Du fait que les espaces sont ajustés (par contraction ou dilatation) de manière à être combinés, l’interprétation de la distance entre les points-lignes et les points-colonnes ne peut se faire intuitivement.
338
!
//
0.5 / ··
0.0
·
:
·/ −−
−0.5
?
¶ ; ·¶·
0.5
0.0
−0.5
−1.0
−1.0 −1.5
Contribution de f2 : 0.0345 (17.81 %)
1.0
Contribution de f1 : 0.1312 (67.73 %)
F IG . 7.3 – Analyse factorielle des correspondances: points-lignes
!
// Actant D
0.5 C5 F
··
0.0 −0.5
/ C5 D Aucun : Coord. ·/ · Énoncé −−
?
¶ Actant F
; ·¶·
0.5
0.0
−0.5
−1.0
−1.0 −1.5
Contribution de f2 : 0.0345 (17.81 %)
Contribution du plan : 0.1657 (85.54 %) 1.0
Contribution de f1 : 0.1312 (67.73 %)
F IG . 7.4 – Analyse factorielle des correspondances: forme des ponctogrammes et environnement
339
– ; : / ·’ · / // · ·/ ·· ·¶· ¶
CD1
CT1
CS1
CD2
CT2
CS2
R
0.36 0.72 0.18 -0.71 -1.76 -0.26 -0.55 0.13 0.46 -0.52 0.72 0.64
0.00 0.01 0.00 0.04 0.72 0.07 0.00 0.10 0.00 0.04 0.00 0.02
0.10 0.17 0.03 -0.42 -0.92 -0.36 -0.23 0.88 0.13 -0.23 0.17 0.36
-0.29 -0.88 0.00 0.73 -0.52 0.32 0.79 -0.05 -0.02 0.20 -0.88 -0.60
0.00 0.03 0.00 0.16 0.23 0.42 0.02 0.05 0.00 0.02 0.00 0.07
-0.07 -0.25 0.00 0.43 -0.08 0.55 0.47 -0.11 0.00 0.04 -0.25 -0.32
0.83 0.58 0.97 0.15 0.00 0.10 0.29 0.01 0.87 0.74 0.58 0.32
TAB . 7.5 – Points-lignes, données numériques
7.2.3
Interprétation
L’interprétation doit suivre un petit nombre de règles simples que nous allons illustrer concrètement en faisant l’analyse de l’ensemble du plan. Généralement, on commence par interpréter le premier facteur, puis le second, avant de mettre en relation les points-lignes et les points-colonnes. a. Interprétation du premier axe. Le premier axe exprime naturellement l’essentiel de’ l’information. Parmi les ponctogrammes (points-lignes), il oppose essentiellement ‹·› (ici représenté par ‹?›) aux autres ponctogrammes, comme la contribution de ce point l’indique clairement. Les ponctogrammes le plus nettement distingués comprennent ‹·›, dont la position proche du centre montre le faible pouvoir discriminant. En d’autres ’ termes, on s’attend à ce que les formes délimitées par un ‹·› soient nettement plus spécifiques que celles ponctuées d’un simple point. Les types d’environnement (points-colonnes) les mieux représentés et contribuant le plus à la construction du premier axe sont les actants et circonstants ponctués à la finale d’une part et coordonnants d’autre part. b. Interprétation du deuxième axe. Le deuxième axe met en évidence l’opposition entre, d’une part, le groupe formé par ‹¶› et ‹·¶·› et, d’autre part, le groupe formé par ‹/› et ‹·/› (ici représenté par ‹!›). Pour ce qui est des environnements, il oppose cette fois les circonstants et les actants ponctués à la finale, rapprochant ces derniers de l’énoncé. c. Interprétation des plans. Si l’on considère simultanément les deux plans (celui des points-lignes et celui des points-colonnes), il est possible de déceler les relations existant entre les ponctogrammes et les environnements. Néanmoins, pour des raisons mathématiques,4 il n’est pas correct d’interpréter directement les distances entre un point-ligne et un point-colonne. Par contre, on peut examiner la position d’un pointligne par rapport à tous les points-colonnes (et vice-versa).5 Une autre manière de procéder pour apprécier la distance entre un point-ligne et un point-colonne est de calculer l’angle formé par l’origine des axes (qui est le sommet de cet angle) et ces deux 4
5
Cf. Lebart/Salem 1994, 88, «En fait, il n’est pas licite d’interpréter [l]es proximités croisées entre un point-ligne et un point-colonne, car les deux points ne sont pas dans le même espace au départ.» La représentation simultanée des deux espaces contracte un des deux plans (ibid.). Cf. Lebart/Salem 1994, 88.
340
points.6 Si l’angle est aigu, il y a attraction entre les points (et donc entre les modalités correspondantes). Si l’angle est obtus, il y a répulsion. Un angle droit représente l’indépendance. Par exemple, le point-colonne C5 F et le point-ligne du ponctogramme ‹¶› dessinent un angle obtus dont le sommet est l’origine des deux axes. Il y a donc répulsion entre les circonstants attirant la ponctuation finale et le ponctogramme ‹¶›. Par contre, le point-ligne du ponctogramme ‹/› dessinerait un angle aigu avec l’origine et le pointcolonne C5 F; pareille configuration indique une attraction entre les modalités. En suivant ces principes, le plan livre principalement les informations suivantes: 1. l’attraction’ la plus forte est sans conteste celle qui lie les actants ponctués à la finale au ‹·› et au ‹¶›; ’ 2. les C5 ponctués à la finale ressemblent à ces actants par leur attraction de ‹·›, mais s’en distinguent par une attraction singulière envers ‹/› et ‹·/›; 3. bien que peu éloignés du centre en raison de leur association avec ‹·›, les énoncés se rapprochent des actants ponctués à la finale par leur attraction envers le ponctogramme ‹¶›. Comme le montre la dernière colonne des données numériques (colonne R qui contient la part d’information négligée pour chaque point), un nombre important de ponctogrammes restent non expliqués par les deux premiers axes. De même, l’environnement constitué par la ponctuation initiale des actants et l’absence d’environnement spécifique est mal représenté. Normalement, si les données en valent la peine, on complète l’analyse fournie par les deux premiers axes en examinant successivement tous les axes suivants. Néanmoins, on gagnerait certainement en clarté en supprimant du traitement tous les ponctogrammes dont l’effectif est très faible. Cela permettrait certainement au point-ligne correspondant à ‹··› de se trouver représenté efficacement. Il y a donc tout intérêt à réfléchir à la manière de réduire le tableau. 7.2.4
Réduction du tableau de contingence
Bien que l’AFC permette de se servir d’effectifs très petits, cette capacité peut poser problème: «L’analyse factorielle des correspondances [. . .] pondère les petits effectifs et les prend ainsi en compte: c’est même là une de ses qualités reconnues. Cependant, cette qualité peut se transformer en piège. Il suffit pour cela que quelques modalités soient prises en même temps par un tout petit nombre d’individus et qu’ainsi ce regroupement apparaisse dans le premier facteur d’analyse.» (Cibois 1997, 309).
À ce problème, auquel Philippe Cibois donne le nom d’effet de distinction, il faut ajouter le fait que la table de contingence ne tient absolument pas compte de la répartition entre les documents. Il est dès lors possible que certaines tendances observées soient caractéristiques d’un petit nombre de chartes particulières. Il est donc utile d’inspecter préalablement les modalités de faible effectif et de modifier le tableau de contingence en retirant celles d’entre elles qui seraient, d’une
6
Voir Cibois 2000, 16–17.
341
1272-03 Autres
0
1
57 76 133
42 4 46
99 80 179
’ TAB . 7.6 – Tri croisé RB × actant ponctuable à la finale pour ‹·› Attractions (seuil adapté 1.70%) 1265−05b 1263−03−31
8/10 (80%) 5/10 (50%) 0.00424
1
’ F IG . 7.5 – Attractions entre CiF et RB pour punctus ‹·› Répulsions (seuil adapté 1.70%) 1272−03
26/99 (26%) 0.0333
1
’ F IG . 7.6 – Répulsions entre CiF et RB pour punctus ‹·›
part, trop rares, d’autre part, trop spécifiques (→7.2.4.1). Ce tableau réduit rendra possible une analyse moins tributaire de tendances marginales (→7.2.4.2). 7.2.4.1
Modalités de faible effectif
Nous aborderons successivement la ponctuation finale des actants et des circonstants ainsi que la forme des ponctogrammes rares avant de proposer un tableau de contingence réduit. a. Marquage final des actants. Nous savons que la ponctuation finale des actants est parfois un phénomène limité à un nombre de chartes ’très restreint.7 Si l’on observe en effet la manière dont la ponctuation des actants par ‹·› se distribue entre les documents, on obtient la tabulation 7.6.8 Cette ventilation est éloquente: nul besoin de test pour constater que l’association ne concerne qu’un seul document, qui s’est déjà distingué de nombreuses fois quand nous étudiions les fréquences de marquage.9 b. Marquage final des circonstants. Dès lors que la première attraction n’a pas lieu d’être considérée comme générale, on peut se demander si chacun des trois ponctogrammes attirés par les circonstants ponctués à la finale n’est pas’spécifique de documents particuliers. Selon les figures 7.5 et 7.6, pour le signe ‹·›, un document se démarque. Pour ‹/›, trois documents pourraient se démarquer, mais ne franchissent pas le seuil corrigé (figures 7.7 et 7.8). Pour ‹·/›, il n’y a pas d’attraction significative (figure 7.9 et 7.10). En somme, si une distorsion est introduite par ces quelques associations (qui, du reste, ne concernent qu’une petite proportion des ponctogrammes impliqués), il est certain qu’elle est bien moindre que celle que nous venons de constater au sujet des actants.
7 8 9
Voir en particulier le cas du marquage final des R2, →6.1.3.5. Voir la tabulation complète dans l’annexe 7.2.4.1.table-RB-punctuselevatus. Voir, entre autres, →6.1.3.4 ou →6.1.3.11.
342
Attractions (seuil adapté 0.160%)
11/24 (46%) 8/15 (53%) 13/38 (34%) 5/11 (45%) 4/10 (40%) 6/18 (33%) 7/24 (29%) 5/17 (29%) 7/26 (27%) 4/19 (21%) 7/34 (21%) 8/36 (22%)
1263−11 1263−05−27b 1270−06−06a 1268−08−02b 1264−04 1263−05−27a 1288−02a 1267−07−06 1283−02−13a 1274−02−24 1267−08−28 1271−04−20
0.00387
1
F IG . 7.7 – Attractions entre CiF et RB pour punctus ‹/›
Répulsions (seuil adapté 0.160%)
2/47 (4.3%) 3/36 (8.3%) 1/20 (5.0%) 0/11 (0.0%) 0/10 (0.0%) 1/16 (6.2%) 3/28 (10.7%) 3/28 (10.7%) 1/15 (6.7%) 1/14 (7.1%) 2/20 (10.0%) 1/13 (7.7%) 4/30 (13.3%) 2/18 (11.1%) 2/15 (13.3%) 3/20 (15.0%) 3/19 (15.8%) 3/16 (18.8%) 4/23 (17.4%) 3/17 (17.6%)
1271−12−09 1271−12−22 1276−07−22 1287−09−08 1289−04−05 1268−03−10 1270−11−26 1271−05−22 1260−05−14 1287−10 1271−03−18 1287−06−24 1271−07−07a 1270−03−24 1289−04−19 1290−08−24 1272−06−22 1280−08−14 1273−05−12 1288−02b
0.00853
1
F IG . 7.8 – Répulsions entre CiF et RB pour punctus ‹/›
Attractions (seuil adapté 1.70%)
5/13 (38%)
1273−12
0.838
1
F IG . 7.9 – Attractions entre CiF et RB pour punctus ‹·/›
Répulsions (seuil adapté 1.70%)
2/11 (18%) 3/11 (27%)
1272−03 1236−12−15
0.456
1
F IG . 7.10 – Répulsions entre CiF et RB pour punctus ‹·/›
343
· /’ · / · ··
Aucun
Actant D
C5 F
C5 D
Coord.
Énoncé
956 209 41 24 70 1300
14 8 0 0 0 22
158 93 47 15 3 316
105 35 7 3 0 150
1743 253 16 8 15 2035
1136 106 7 4 8 1261
4112 704 118 54 96 5084
TAB . 7.7 – Tri croisé environnement × forme du ponctogramme (revu)
· /’ · / · ··
Aucun
Actant D
C5 F
C5 D
Coord.
Énoncé
961 227 42 25 70 1325
14 9 0 0 0 23
162 108 48 15 3 336
106 37 7 3 0 153
1765 272 16 8 15 2076
1165 109 7 4 8 1293
4173 762 120 55 96 5206
TAB . 7.8 – Tri croisé environnement × forme du ponctogramme (revu)
c. Ponctogrammes rares. Il est évident que les ponctogrammes attestés une seule fois se verront attirés fortement par l’environnement dans lequel ils ont été relevés. C’est par exemple le cas de ‹·¶·›, qui est attiré par l’énoncé. Avec ce type de répartition, soit les points sont mal représentés, soit ils mobilisent une part trop grande de l’inertie pour leur intérêt. Compte tenu des effectifs disponibles, il paraît raisonnable de retirer de l’effectif des ponctogrammes tous ceux dont la forme apparaît moins de dix fois. Enfin, l’association des actants ponctués à la finale et de ‹¶› ne concerne également qu’un seul document (à nouveau Document 1272–03), qui contient à lui seul toutes les attestations du signe (→7.2.4.1). Quand on voit l’importance que ce ponctogramme a eu dans le tracé des coordonnées du plan factoriel général, on est presque certain que les premiers résultats obtenus sont loin de se conformer à une réalité largement partagée. Il faut donc remettre en question ces conclusions un peu hâtives. d. Réduction du tableau. Pour être le plus prudent possible, reconstituons un nouveau plan factoriel sur la base d’une table de contingence d’où nous avons retiré la colonne correspondant aux actants ponctués à la finale, les lignes des ponctogrammes peu attestés ou exclusifs ’ à un document et les quelques chartes susceptibles de biaiser les relations entre ‹·› ou ‹/› et les circonstants. Le résultat de la réduction est la table de contingence 7.7. Cette table est très bien représentée par le plan de la figure 7.11, p. 345.10 Cependant, nous pourrions également nous baser sur le tableau de contingence gardant les décomptes liés aux chartes associant significativement (ou presque) le ponctogrammes aux circonstants ponctués à la finale (table 7.8). En effet, en effectuant une AFC sur cette table, on obtient le plan de la figure 7.12, qui peut être simplifié en séparant la représentation des points-lignes de celle des points-colonnes (figure 7.13). Ce plan laisse paraître que l’espace n’est pas modifié de manière sensible par la présence des documents qui pourraient le distordre. Nous nous baserons donc sur cette seconde table revue et le plan qui y correspond pour effectuer la suite 10 Voir les tableaux des données numériques en annexe: 7.2.4.1.table-revised-rows et
7.2.4.1.table-revised-cols.
344
Valeurs propres
78.72%
18.01%
3.23%
0.08
0.06
0.04
0.02
0.00
0.04%
0.2
?
C5 F C5 D Actant D /
0.0
Coord. Énoncé ·
!
−0.2
Aucun
−0.4 −0.6 −0.8 −1.0
0.0
−0.5
−1.0
··
−1.5
Contribution de f2 : 0.0217 (18.01 %)
Points−lignes et points−colonnes Contribution du plan : 0.1168 (96.73 %)
Contribution de f1 : 0.0951 (78.72 %) F IG . 7.11 – Analyse factorielle des correspondances: forme des ponctogrammes et environnement
345
Valeurs propres
79.31%
17.31%
3.33%
0.08
0.06
0.04
0.02
0.00
0.05%
0.2
?
C5 F C5 D Actant D /
0.0 −0.2
Coord. Énoncé ·
! Aucun
−0.4 −0.6 −0.8 −1.0
0.0
−0.5
··
−1.0
Contribution de f2 : 0.0214 (17.31 %)
Contribution du plan : 0.1194 (96.62 %)
Contribution de f1 : 0.098 (79.31 %) F IG . 7.12 – Analyse factorielle des correspondances: forme des ponctogrammes et environnement
346
0.2
C5 F C5 D Actant D Coord. Énoncé
0.0 −0.2
Aucun
0.2
0.0
−0.2
−0.4
−0.6
−0.8
−0.4
−1.0
Contribution de f2 : 0.0214 (17.31 %)
0.4
?
0.2
/
0.0
·
!
−0.2 −0.4 −0.6 −0.8 −1.0
0.0
−0.5
−1.0
··
−1.5
Contribution de f2 : 0.0214 (17.31 %)
Contribution de f1 : 0.098 (79.31 %)
Contribution de f1 : 0.098 (79.31 %) F IG . 7.13 – Analyse factorielle des correspondances: forme des ponctogrammes et environnement (points-lignes et points-colonnes séparés)
des analyses. Les données numériques pour les points-lignes figurent dans la table 7.9. La table 7.10 représente les points-colonnes. 7.2.4.2
Analyse du tableau réduit
a. Interprétation du premier axe. Le premier axe distribue les quatre ’ ponctogrammes les plus attestés en deux catégories: le ‹·› d’une part, et les ‹/›, ‹·› et ‹·/› d’autre part. Tous ces ponctuants sont très bien représentés sur le premier axe. On voit que le punctus est très proche de l’origine, ce qui montre sa faible valeur discriminante, alors que les autres ponctuants sont graduellement de plus en plus éloignés de la coordonnée 0. De la même manière, le premier axe oppose le groupement comprenant l’énoncé
347
· /’ · / · ··
CD1
CT1
CS1
CD2
CT2
CS2
CD3
CT3
CS3
R
0.14 -0.39 -1.42 -1.05 -0.36
0.15 0.23 0.48 0.12 0.02
0.98 -0.90 -0.95 -0.97 -0.11
0.01 0.03 0.25 -0.13 -1.03
0.01 0.00 0.07 0.01 0.91
0.01 0.00 0.03 -0.01 -0.89
0.01 -0.13 0.23 0.13 0.04
0.04 0.62 0.29 0.04 0.01
0.01 -0.10 0.02 0.02 0.00
0.00 0.00 0.00 0.00 0.00
TAB . 7.9 – Points-lignes, données numériques
Aucun Actant D C5 F C5 D Coord. Énoncé
CD1
CT1
CS1
CD2
CT2
CS2
CD3
CT3
CS3
R
-0.17 -0.23 -1.01 -0.28 0.15 0.24
0.08 0.00 0.67 0.02 0.09 0.15
-0.34 -0.10 -0.94 -0.62 0.82 0.88
-0.24 0.13 0.24 0.17 0.06 0.06
0.67 0.00 0.18 0.04 0.07 0.04
-0.66 0.03 0.06 0.23 0.14 0.06
0.00 -0.66 0.06 -0.13 -0.03 0.06
0.00 0.47 0.05 0.13 0.10 0.25
0.00 -0.86 0.00 -0.14 -0.04 0.06
0.00 0.00 0.00 0.01 0.00 0.00
TAB . 7.10 – Points-colonnes, données numériques
et les phénomènes de coordination à la ponctuation finale des circonstants, qui forment un deuxième groupe (les autres points ne sont pas bien représentés). Dans ce dernier, on voit que les circonstants attirant le ponctogramme final sont les mieux représentés et qu’ils contribuent relativement bien à l’inertie de l’axe, alors que les autres points ont une contribution plus faible. b. Interprétation du deuxième axe. Le deuxième axe corrige le premier en le précisant. En ce qui concerne les points-lignes, le vecteur détache fortement ‹··› de l’ensemble des autres ponctogrammes – très mal représentés dans cette dimension. Pour les points-colonnes, le facteur oppose essentiellement la modalité Aucun à C5 F. c. Interprétation des plans. La comparaison simultanée des deux plans associe l’environnement à la forme de la ponctuation. Trois groupes se détachent: 1. l’énoncé et la coordination sont ponctués par ‹·›, qui reste, comme en première analyse, très peu discriminant; 2. les’ circonstants sont associés de manière très forte aux ponctogrammes ‹/›, ‹·/› et ‹·›; 3. les environnements n’attirant pas spécifiquement la ponctuation sont caractérisés essentiellement par l’attraction de ‹··›, qui leur est spécifique. Par ailleurs, il faut remarquer que: 3. les ponctogrammes les plus fréquents sont ceux qui sont les moins spécifiques; 4. enfin, eu égard à la forme des ponctogrammes employés, la ponctuation des actants et des circonstants attirant un ponctogramme initial est d’un très faible intérêt. d. Interprétation du troisième facteur. Comme nous l’annoncions ci-dessus, lorsque les données le justifient, il est envisageable de continuer l’interprétation des différents facteurs. Le troisième facteur peut nous révéler d’autres oppositions ignorées par le plan construit sur la base des deux premiers. On construit généralement un nouveau plan (figure 7.14) à l’aide des axes 2 et 3 pour observer les informations livrées par ce troisième facteur (le premier axe du graphique est similaire au deuxième axe du graphique précédent). Pour interpréter ce plan, où les points ont forcément des cosinus
348
?
0.2 !
0.0
··
· /
−0.2
0.2
0.0
−0.2
−0.4
−0.6
−0.8
−0.4
−1.0
Contribution de f3 : 0.0041 (3.33 %)
0.4
Énoncé
0.0
Aucun
C5 F
Coord. C5 D
−0.2
−0.4
−0.6
0.4
0.2
0.0
−0.2
Actant D
−0.4
Contribution de f3 : 0.0041 (3.33 %)
Contribution de f2 : 0.0214 (17.31 %)
Contribution de f2 : 0.0214 (17.31 %) F IG . 7.14 – Analyse factorielle des correspondances: forme des ponctogrammes et environnement (points-lignes et points-colonnes séparés), facteurs 2 et 3
carrés moins élevés que sur le plan précédent, il est nécessaire de se souvenir que tous les facteurs à partir du deuxième sont des corrections11 des précédents. De ce fait, la valeur des cosinus carrés sur ces axes a moins d’importance que les oppositions qu’ils mettent en évidence. Ainsi, on peut observer essentiellement une opposition qui détache fortement Act D du reste des points-colonnes, l’associant, de même que la coordination et C5 I, au ponctogramme ‹/›. Au terme de cette description, nous sommes en mesure de réduire les données à une petite série d’oppositions dominantes. Néanmoins, l’AFC étant une technique exploratoire, il est possible que les résultats qu’elle nous livre ne soient pas statistique11 Ceci est expliqué très simplement dans Cibois 2000, 84–85.
349
· /’ · / ·
C5 F
Énoncé ou Coord.
162 108 48 15 333
2930 381 23 12 3346
3092 489 71 27 3679
C5 F
Énoncé ou Coord.
−49.64 ★★★ 91.79 ★★★ 268.94 ★★★ 64.51 ★★★
4.94 ✩✩★ −9.13 ✩★★ −26.77 ★★★ −6.42 ✩✩★
Test exact de Fisher, p = 2.39e − 70 ★★★ Valeur attendue minimale = 2.44
TAB . 7.11 – Tri croisé forme des ponctogrammes (réduit) × environnement (C5F, Énoncé, Coord.)
· Autres
C5 F
Énoncé ou Coord.
162 171 333
2930 416 3346
3092 587 3679
C5 F
Énoncé ou Coord.
-49.64 261.48
4.94 -26.02
θ
7.43
2
χ = 339.19, ddl = 1, p = 9.57e − 76 ★★★ Après ajustement de Šidàk pour 4 comparaisons: ★★★ (seuils: 0.0127, 0.00251, 0.00025)
TAB . 7.12 – Tri croisé attraction de ‹·›
ment significatifs. En effet, l’AFC décrit la structure des écarts et non leur intensité.12 N’importe quelle table de contingence, pour peu qu’elle ne corresponde pas exactement à la table des valeurs attendues (→5.2.1.2), a une structure que l’AFC est capable de mettre en évidence, sans pour autant s’assurer de sa significativité statistique.
7.3
Tests statistiques sur les groupements obtenus
Les tests qui suivent permettent d’évaluer la pertinence des tendances détectées. a. Attraction entre ‹·› et le groupe formé par l’énoncé et la coordination. Testons les groupements (table 7.11). Il y a bien, globalement, une cause non aléatoire qui organise la ventilation des données dans le tableau. L’AFC ne nous a pas trompé. Tout d’abord, ce qui est visible dans la première ligne du tableau de droite que nous venons de donner, ‹·› est associé aux constructions qui ne sont pas des C5 attirant la ponctuation finale. Le tri croisé spécifique figure dans la table 7.12. À nouveau, cela est similaire à ce que dessinait le plan factoriel. D’après la décomposition de l’écart dans la table 7.11, l’opposition est loin d’être la plus importante: la troisième ligne dessinerait un contraste bien plus fort. Que cette différence d’intensité se conforme tout à fait à ce que l’AFC nous apprenait n’a rien d’étonnant; l’intérêt du test est essentiellement de montrer la probabilité que l’opposition observée sur le plan est pertinente. b. Gradation de l’attraction entre ‹·› et les différents environnements. Que dire à présent de l’opposition des environnements qui attirent le punctus? Selon la table 7.13, la petite séparation apparaissant sur le troisième facteur, qui opposait l’énoncé à la coordination, est significative, du moins du point de vue exclusif du marquage par ‹·›. 12 Voir Cibois 2000, 121–122. Pour un exemple détaillé, voir Cibois 1997, 300–309.
350
· Autres
Énoncé
Coord.
1165 120 1285
1765 296 2061
Énoncé
Coord.
1.4 -9.9
-0.88 6.17
θ
1.63
2930 416 3346
χ2 = 17.89, ddl = 1, p = 2.34e − 05 ★★★
TAB . 7.13 – Tri croisé ‹·› × contexte l’attirant
/’ / · ou ·
C5 F
Énoncé ou Coord.
108 63 171
381 35 416
489 98 587
C5 F
Énoncé ou Coord.
-8.33 41.57
3.42 -17.09
θ
6.35
χ2 = 68.39, ddl = 1, p = 1.34e − 16 ★★★ Après ajustement de Šidàk pour 4 comparaisons: ★★★ (seuils: 0.0127, 0.00251, 0.00025)
TAB . 7.14 – Tri croisé attraction de ‹/› C5 F
Énoncé ou Coord.
48 15 63
23 12 35
’
· / ·
71 27 98
C5 F
Énoncé ou Coord.
0.12 -0.32
-0.22 0.58
θ
1.67
χ2 = 0.77, ddl = 1, p = 0.381 ✩✩✩ Après ajustement de Šidàk pour 4 comparaisons: ✩✩✩ (seuils: 0.0127, 0.00251, 0.00025) Valeur attendue minimale = 9.64
’ TAB . 7.15 – Tri croisé opposition ‹·› vs ‹·/›
Cette conclusion en amène une autre, qui ne fait que renforcer l’hypothèse de la distinction nette entre les C6 et les coordonnants: les phrases et les membres impliqués dans une relation de coordination ne sont pas considérés comme équivalents, puisque le choix d’un autre signe que ‹·› paraît fortement lié à la coordination. c. Gradation de l’attraction entre les circonstants ponctués à la finale et les différents ponctogrammes. On peut ensuite voir comment ‹/› s’oppose aux deux autres ponctogrammes (table 7.14). La virgula se distingue des autres ponctogrammes proches des C5 attirant la ponctuation finale par le fait qu’elle est moins spécifique à cet environnement. En d’autres termes, ce que le premier plan mettait en évidence est à nouveau corroboré par une faible probabilité. ’ Qu’en est-il à présent de l’opposition entre les deux formes ‹·› et ‹·/›? On ne peut pas dire que les deux formes du punctus elevatus soient distinctes (table 7.15), ce qui justifie leur proximité dans l’AFC effectuée ci-dessus. d. Attraction entre ‹··› et l’absence de contexte attirant la ponctuation. D’après un test opposant simplement l’absence d’environnement particulièrement propice à la ponctuation à tous les environnements de ce type (voir table 7.16), le ‹··› est bel et bien spécifique à la modalité Aucun. Le dépouillement complet13 montre que le ponctogramme apparaît généralement devant les noms de personnes et les titres; par exemple: 13 Ce dernier a été effectué sur l’ensemble des attestations de ‹··›. Voir l’annexe dep-7.3.puncti.
351
Aucun
Autres
70 1255 1325
26 3855 3881
·· Autres
96 5110 5206
Aucun
Autres
84.98 -1.6
-29.01 0.55
θ
8.27
χ2 = 113.6, ddl = 1, p = 1.60e − 26 ★★★ Après ajustement de Šidàk pour 4 comparaisons: ★★★ (seuils: 0.0127, 0.00251, 0.00025)
TAB . 7.16 – Tri croisé ‹··› × contexte l’attirant « cheſt aſauoır en hommeſ dıſcreız et honeſtes · mon ſaíngnor ·· guíon de [9] bomont et mon ſaíngnor henrí de haloız chanonnes delle glıſe deuant dıte» (Document 1270–04–07, 8). «nos jamaıs a [26] nul˘jor ne ferıens ne ne soferoens a faere ne a dıre choſe par coı lı ·· abbes et lı couens deuant dıs [27] fuſt encombreız de tenır paſıblement le droıture et luſage del eawe deuant dıte» (Document 1271–04–20, 25). ˘
À nouveau, seule une étude approfondie de ce phénomène sémantique permettrait de s’assurer que ces observations sont significatives.
7.4
Ponctogrammes rares
Nous avons temporairement négligé l’analyse des ponctogrammes ‹–›, ‹;›, ‹:›, ‹//›, ‹·/› et ‹·¶·› en raison de leur rareté. Leur faible fréquence empêche de les intégrer aux analyses statistiques. Il est toutefois possible de commenter leur apparition de manière intuitive. Même limitée à ces quelques signes moins fréquents, cette approche met à notre disposition un certain nombre d’informations sur le fonctionnement général de la ponctuation. La description qui suit est un commentaire détaillé des occurrences des ponctogrammes rares: ‹:› (→7.4.1), ‹–› (→7.4.2), ‹;› (→7.4.3), ‹//› (→7.4.4), ‹·/› (→7.4.5), ‹·¶·› (→7.4.6). 7.4.1
Ponctogramme ‹:›
Le ponctogramme ‹:› n’apparaît que deux fois, dans deux chartes distinctes: «altrement ce kı cı de / [17]uant eſt dıt : reuenrat a le maıſon deuant dıte» (Document 1247–06, 16). «· et la affaıtat me dame kathelíne deuant dıte a ſes [7] troıs enfans deſour nomeıſ [. . .] se deme kı ſıet a˘no [8]vılhe [. . .] et kı eſkeır lour deuoıt apreſ ſon deces : et sı furent lı troıſ enfans deſour dıs enſ [10] empaıs commandeıs [. . .]» (Document 1271–07–25, 6). ˘
Les réalisations du ponctogramme sont assez différentes. La plus ancienne est celle de la figure 7.15 et la seconde est celle de la figure 7.16. Le retour à la substance mobilisée par ce que nous avions interprété comme une forme ‹:› fait penser que ces deux attestations réalisent certainement des ponctogrammes différents. S’ils semblent déjà matériellement distincts, les environnements syntaxiques dans lesquels ils apparaissent sont loin d’être identiques: le premier correspond peut-être à la limite 352
F IG . 7.15 – Réalisation de ‹:› (Document 1247–06, 17)
F IG . 7.16 – Réalisation de ‹:› (Document 1271–07–25, 9)
F IG . 7.17 – Réalisation de ‹–› (Document 1277–07–01, 14)
d’un circonstant ou d’une proposition personnelle apposée; le second figure entre deux énoncés. Alors que la complexité des traits de la première des deux formes ne laisse aucun doute quant à l’intention du scribe qui l’a tracée, on peut se demander si dans le deuxième cas, unique dans le corpus, la forme ‹:› n’est pas un accident. Le scribe a peut-être malencontreusement taché le manuscrit, de sorte qu’un nouveau point, plus petit et moins net, est venu s’ajouter au-dessus du premier. Il est impossible de le savoir, mais rien ne s’opposerait, d’un point de vue fonctionnel, à assimiler ce second colon à un simple punctus, dont nous avons constaté l’affinité avec le marquage de l’énoncé. 7.4.2
Ponctogramme ‹–›
Le ponctogramme ‹–› apparaît deux fois dans un contexte précis, sous (semble-t-il) la même plume, la même année: «· la quele coníſ [11]ſance gılheſ [. . .] mıſt enſ elle warde des [12] homes delle chıeſe deu kı la furent preſens – a ceſte veſture a faíre furent ·· homeſ [13] delle chıeſe deu [. . .]» (Document 1277–03–23, 10). «· la quele co [13]níſſance ſıreſ ıohanſ de lardíer [. . .] míſt [14] enſ elle warde deſ homeſ delle chıeſe deu kı la furent preſens – a ceſte veſtu [15]re a faíre furent homeſ delle chíeſe deu [. . .]» (Document 1277–07–01, 12).
Le signe n’apparaît que devant la liste des témoins ayant assisté à l’action juridique. La réalisation du ponctogramme est très similaire dans les deux cas (figure 7.17). Le fait que le ponctogramme soit en contact direct avec le linéogramme qui le suit pose question. Il est possible que le trait formant ce que nous avons transcrit comme 353
F IG . 7.18 – Réalisation de ‹–› (Document 1286–05–15, 2)
un ponctogramme fasse en réalité partie du linéogramme ‹a›, lui-même marqué par un hétérogramme. Dans ce cas, il faudrait transcrire plus simplement: «[. . .] homes delle chıeſe deu kı la furent preſens a ceſte veſture a faíre furent ·· homeſ delle chıeſe deu [. . .]»
[13]
Tant au point de vue de leur contexte d’occurrence que de leur substance, les deux attestations que nous venons d’examiner ne sont pas solidaires de l’attestation isolée suivante: «conutte choſe ſoıt a tos · ke lan de graſce · m · cc · quatrevíns et sıez le merkedı – [3] apres le saín seruaıs · vínrent par deuant nos [. . . ]» (Document 1286–05–15, 2).
Comme le laisse voir la réalisation du signe (figure 7.18), la question de la segmentation des unités ne se pose pas: le ‹–› suit et est distinct de ‹merkedı›. Par ailleurs, dans l’éventualité où les deux attestations de 1277 seraient effectivement des ponctogrammes, elles se différencient également de l’attestation de 1286 par l’épaisseur du trait employé pour les dessiner. Enfin, du point de vue de la valeur des signes, les deux premières attestations sont à la limite entre deux énoncés, ce qui n’est pas le cas de la troisième. 7.4.3
Ponctogramme ‹;›
Le ponctogramme ‹;› apparaît exclusivement à la fin d’un énoncé: «et le doıt ſıres gıles et ſa mere loer en toz líus la ulıglıſe vorrat ; et por ce [12] ke ce ſoıt ferme et˘ſtable auonoſ a ce letreſ pendut noſtre ſaeal» (Document 1236–05, 11). ˘
«[14] et lauons donee a damme agnes ſouent nomee · et a˘freres precheours de˘lıege deſeur dít / en teſmoínage de veríteıt ;» (Document 1288–02a, 14). ˘
˘
«[1] a˘tous chıaus kı ces lettres verront et oront [. . .] ſalus et conıſſance de verıteıt ; [3] nos faıſons ſauoír a˘tous / ke nos a damme agnes hubíne de ho˙y auons en donıers conteıs rechıes / quarante set · mars de˘lıe / [4]goıs» (Document 1288–02a, 1). ˘
˘
˘
«· et lauons donee a damme agnes ſouent nomee · et a˘freres precheours de˘lıege de ˘ſeur dít / en teſmoínage de veríteıt ; [15] che fut faıt et doneít en˘lan de˘graſſe · mılhe · dueſ˘cens · quatrevíns · et ſet · en moıs de feurıer» (Document 1288–02b, 14). ˘
˘
˘
˘
˘
˘
«· jtem je laís · dous ſos · por requerre les orıſons [30] de prodomes et de bone gens deuens lıege et defours ; et en totes cheſ deuíſes je reten me plaín poouer de muer [. . .]» (Document 1289–01–12, 29).
354
F IG . 7.19 – Réalisation de ‹//› (Document 1283–12–26, 10)
«· en apres · je laıs hanet [. . .] chu ke ju aí de terre a croıtoır · et quatre chapons kí gıſent a haſtal ; en apres je laís lanbuíche [8] me fılh · les maıſons kí ſıente ver˘les bons enfans [. . .]» (Document 1289–01–12, 6).
˘
«· premíerement · je voılh ke me detres et mí tortfaıt ſılh ıat nul · ſoent paıet do pluſ aparlhıet do míen ; en apres je laí damme anes [3] me femme ſes humíers [. . .]» (Document 1289–01–12, 2).
Nous pouvons éventuellement considérer que ‹;› est une forme «renforcée» de ‹·›, mais cette hypothèse ne peut être confirmée dans l’état actuel de notre documentation. Nous ne nous prononcerons pas davantage. 7.4.4
Ponctogramme ‹//›
Le ponctogramme ‹//› paraît avoir un emploi systématique: il est exclusivement utilisé pour marquer un ajout: «· et lor quıttat _// sıres baduıns lı vowes //_ le fıez et lom/ (Document 1260–02–21a, 9).
[10]
mage et frank alut lor enfıſt»
«· conute [2] choſe ſoıt a tos ke lan de graſce · m · ccıııj xx et on · a tírch jour del moís de marche _// a lentreıe /_ vínrent pardeuant nos [. . .]» (Document 1282–03–03, 1).
«· conute choſe soıt a tos ke [. . .] vínrent pardeuant nos entre saınte marıe et saín lambıer a lıge [4] sours anes abbeſſe de robermont pour lı et pour ſe couent _// dune part //_ · et fılepeaz lı fıs adam de her [5]meıes kı ja fut dautre part» (Document 1282–12–22, 2).
«· et ces xx _// muıs //_ · deſpeate lı maıſon doıt paıer a fılepea [. . .]» (Document 1283–12–26, 10). «et che prouarent ılh por frere s˙ymon le [4] príor deſ bonſ _enfans //_ por ſangnor ponchar preſtre et chappellaın deuens le glıſe ſaín píerre et por baſtuele fılle ſangnor baſtín dawans deuant dít leſ ques noſ feſímeſ jurer» (Document 1289–04–05, 3).
Cet emploi est très clair dans la réalisation présentée dans la figure 7.19, où l’on voit par ailleurs que l’édition que nous fournissons dans la transcription n’est pas tout à fait représentative des topèmes mobilisés. Contrairement aux autres ponctogrammes, la fonction de ‹//› semble être de marquer une anomalie dans la substance sur laquelle sont déployées les unités linguistiques. Le signe n’est pas à proprement parler syntaxique, parce qu’il ne ponctue pas une structure particulière. En revanche, il sert la syntaxe en indiquant que les mots placés au-dessus de la ligne doivent être compris comme occupant une place spécifique dans la chaîne graphique. 355
F IG . 7.20 – Réalisation de ‹·/› (Document 1274–05–31a, 27)
F IG . 7.21 – Réalisation de ‹·¶·› (Document 1289–01–12, 2)
7.4.5
Ponctogramme ‹·/›
Le ponctogramme ‹·/› n’apparaît qu’une seule fois, dans «aſauoír eſt · ſıres johans de lardíer eſkeuıens de lıege kı les veſtures et les afaıtemens deſoíreſcrıs [26] fıſt · herbers de le roſe · gerars et buchars frere · johans lí fís ſaıgnor johan de lardıer · lambers de [27] la ríuıere · baduıens pıfes ·/ dans fılıpes moínes de la maıſon de la val ſaínt lambert et pluſoír [28] autre» (Document 1274–05–31a, 25).
La matérialité du signe pose question (figure 7.20). Elle est d’autant plus problématique que l’autre expédition du même document, qui nous paraît être de la même main (Document 1274–05–31b), n’emploie pas ce ponctogramme au même endroit. Cette observation pose la délicate question des copies, que nous ne traiterons pas. 7.4.6
Ponctogramme ‹·¶·›
Le ponctogramme ‹·¶·› n’est attesté qu’une seule fois (figure 7.21): «· ju baſtíens [. . .] ordenne deuíſe · et faís mon teſtament par laſent de˘dame anes me femme de tos [2] meſ bıens mobles et hıretages enſı ke chí par deſos eſt eſcrıt ·¶· premíerement · je voılh ke me detres et mí tortfaıt ſılh ıat nul · ſoent paıet [. . .]» (Document 1289–01–12, 1).
˘
Nous nous limiterons à remarquer que ce signe apparaît, comme ‹¶›, à la limite de deux énoncés.
7.5
Synthèse
L’analyse factorielle et les tests par lesquels nous l’avons validée ont mis en évidence l’existence de plusieurs associations entre les environnements et la forme du marquage. Les effectifs mobilisés par chaque type de ponctogramme ont des implications sémiotiques évidentes (→7.5.1). L’examen individuel de formes rares pose quant à lui plusieurs questions d’ordres méthodologique et théorique (→7.5.2). 7.5.1
Implications sémiotiques de la variété des formes
L’étude sur la relation entre la forme des ponctogrammes et l’environnement qui appelle leur apparition est révélatrice de la manière dont les signes parlent au lecteur. 356
Les deux caractéristiques les plus fortes de la variété du marquage médiéval sont sa facultativité (→7.5.1.1) et, corrolairement, la force des signes les plus rares (→7.5.1.2). 7.5.1.1
Facultativité
Le fait le plus marquant lorsqu’on étudie la forme des ponctogrammes est la faible rentabilisation de la variété de signes disponibles (→7.1.1) au profit d’un usage fréquent et généralisé du simple ‹·›. Un même scribe peut donc ponctuer des structures aussi différentes que des phrases, des circonstants en se ou des coordinations à l’aide du même ponctogramme. Comme le montrait la table de contingence de la section →7.1.2, quelle que soit la structure ou le constituant ponctué, le ponctogramme dont l’effectif est le plus fréquent est toujours ‹·›. Il en ressort qu’à la conclusion «la ponctuation n’est pas obligatoire», formulée dans le chapitre précédent (→5.3.3.3), nous sommes en droit d’ajouter que là où elle est utilisée, la ponctuation peut généralement se réduire à un simple point. Certaines conditions attirant la présence de la ponctuation n’attestent cependant jamais ‹·› dans cette fonction: nous avons vu que les ajouts étaient systématiquement indiqués à l’aide de ‹//›, qui paraît réservé à cet emploi. Il s’agit de cas rares, de nature ne relevant pas de la morphosyntaxe, mais d’un «accident» dans la substance mobilisée par l’écriture. Ces signes fonctionnent en dehors du système de relations entre la ponctuation et la syntaxe. 7.5.1.2
Force
Puisque la présence d’un ponctogramme entre deux mots est une marque pour l’œil par opposition à l’absence de toute ponctuation, l’emploi d’un signe rare constitue une «surmarque». En effet, les ponctogrammes rares sont, du point de vue de la substance, plus élaborés que les signes fréquents: le nombre de périgrammes (→2.2.3.2 a) impliqués dans leur tracé est plus important. D’autre part, du point de vue de leur fonction, les signes un peu moins fréquents sont attirés par les fonctions les plus spécifiques,14 alors que les ponctogrammes vraiment rares sont en général limités à des emplois très particuliers.15 Nous pouvons à nouveau enrichir nos conclusions, précisant que non seulement la ponctuation, si elle est facultative, n’en est pas moins organisée: on ne peut placer un ponctogramme n’importe où (→6.4.4), mais en plus, les signes ne sont pas interchangeables à volonté. Les scribes n’avaient pas la possibilité d’employer n’importe quel signe à un endroit pouvant être ponctué. 7.5.2
Problèmes liés à la substance
Du reste, l’observation des ponctogrammes les plus rares nous mène à une réflexion méthodologique sur la validité des transcriptions (→7.5.2.1), ainsi qu’à une remise
14 Voir la distance des points par rapport à l’origine sur les axes de l’AFC (→7.2.2). 15 Voir les cas de ‹//› (→7.4.4), ‹;› (→7.4.3) et ‹–› (→7.4.2).
357
en perspective théorique sur les relations entre la ponctuation et le reste du système graphique (→7.5.2.2). 7.5.2.1
Validité des transcriptions
À plusieurs reprises, nous avons vu que l’examen des formes rares pouvait mener à remettre en question le travail philologique effectué avant que le moindre dépouillement n’ait pu être fait.16 ’ Ainsi, est-il vraiment nécessaire de distinguer ‹·› de ‹·/›, puisqu’il n’est pas possible de prouver que ces ponctogrammes sont différents eu égard aux constructions qu’ils ponctuent?17 De même, un bon nombre de signes rares posent question. La forme ‹:› est-elle attestée deux fois, ou bien ne regrouperait-elle pas artificiellement deux ponctogrammes différents? La forme ‹·/› existe-t-elle réellement ou est-elle due à une rature du scribe sous la plume duquel elle apparaît? Le ponctogramme ‹–› existe-t-il réellement ou le trait qui le forme fait-il partie d’un linéogramme? 7.5.2.2
Ponctogrammes et système graphique
Enfin, la dernière question philologique, à propos de ‹–›, dépasse la simple remise en cause de l’édition: elle ouvre la discussion sur les relations entre le système de ponctuation au sens strict et le reste du système graphique médiéval. Si un ponctogramme est considéré comme une marque pour l’œil, cette fonction sémiotique n’est pas exclusive du petit ensemble de signes dont nous nous sommes occupé. À ce stade, on peut avancer plusieurs hypothèses de travail, sur lesquelles sont généralement basées les tentatives de définition de la ponctuation au sens large (→2.3.2.2). Les unités comme les plérétopes (→2.2.2.2) ou les hétérogrammes (→2.2.3.1) pourraient: – remplacer la présence d’un ponctogramme dans une des positions qui l’attirent; – s’ajouter à un ponctogramme déjà présent, de manière, par exemple, à suppléer l’expressivité faisant défaut au simple ‹·›, ou de manière à renforcer une marque déjà bien visible; – marquer d’autres unités, définies du point de vue morphosyntaxique ou d’un tout autre point de vue.
16 Voir la section Transcriptions des annexes. 17 Voir →7.3 c.
358
8
Conclusion
Arrivé au terme de notre étude, efforçons-nous de faire le point sur notre démarche. Nous procèderons en trois temps. Tout d’abord, nous résumerons la progression de l’étude: en reprenant le plan exposé dans l’introduction (→0.3), nous montrerons comment chaque étape a été acheminée d’une problématique précise à un résultat exploitable dans la suite du travail, pour finalement mener à une conclusion (→8.1) et à un tableau de synthèse (→8.1.3). Nous essayerons ensuite de mettre nos découvertes à l’épreuve de nouveaux matériaux, en confrontant les tendances remarquées à la ponctuation de deux chartes dont l’édition a été publiée récemment (→8.2). Enfin, nous présenterons les perspectives nouvelles que nous croyons avoir ouvertes et la manière dont il sera possible d’améliorer les résultats (→8.3).
8.1
Progression
Conscient des limites de notre approche, nous avons commencé par faire le pari que la syntaxe pouvait expliquer la majorité des ponctogrammes (→0.1.2). Cette optique nous a guidé durant tout le développement au bout duquel nous arrivons, dont le but était de répondre à la question: Comment, d’après ce qu’on peut observer dans les chartes écrites en français à Liège avant 1292, la ponctuation originale interagit-elle avec la syntaxe dans la langue française médiévale?
Nous avons d’emblée positionné notre étude par rapport à la réflexion sur la ponctuation médiévale (→0.1.1), osant le pari que la syntaxe peut servir de point de référence pour expliquer la plus grande partie de la ponctuation des chartes. Nous avons ensuite décrit la constitution du corpus. Face à une pareille question, il n’était pas envisageable de commencer immédiatement à dépouiller les documents: il nous fallait définir avec exactitude les différents concepts dont nous allions avoir besoin. 8.1.1
Première partie: modélisation
La première partie du travail a ainsi été consacrée à la définition, sur des bases empiriques, des concepts mobilisés. Partant du sens commun et des principes fondamentaux de l’analyse linguistique classique (tenant du structuralisme et du fonctionnalisme), nous avons exploité les matériaux à notre disposition pour en dégager des 359
notions, dans une approche inductive par son rapport aux faits, mais déductive par sa progression. Ainsi, au chapitre →2, l’observation du tracé des unités graphiques sur le parchemin nous a amené à abstraire les catégories nécessaires à une modélisation de l’ensemble des unités de la langue écrite, pour lesquelles nous proposons une terminologie neuve reflétant notre analyse. Nous avons progressivement défini langue écrite, puis scriptèmes, grammèmes, etc., progressant des unités les plus générales aux unités les plus particulières. Ce n’est qu’à ce prix que nous avons pu enfin délimiter exactement, le moins intuitivement possible, notre propre acception du mot ponctuation: «ensemble des ponctogrammes d’une langue écrite spécifique» (→2.3.1.2). Dans cette définition, le terme ponctogramme désigne une unité minimale de la langue écrite (scriptème, →2.2.1) n’organisant pas l’espace (grammème, →2.2.1 également), exprimant un contenu (plérégramme, →2.2.2), ne dépendant pas matériellement d’une autre unité (autogramme, →2.2.3.1), construit à l’aide de traits qui ne se combinent pas obligatoirement sur un même axe (nébulogramme, →2.2.3.2 a) et non paraphrasable par d’autres unités significatives (→2.2.4.1 b). . . Employer ce terme ne pouvait se faire qu’à la fin d’un exposé détaillé, passant en revue tous les hyperonymes impliqués. De manière moins audacieuse du point de vue de la terminologie employée, nous avons également tenté d’exposer notre conception de la syntaxe (chapitre →3). À nouveau, c’est le corpus qui nous a servi de guide: une fois les phrases délimitées de manière empirique, toutes les structures syntaxiques ont été passées en revue, nommées et intégrées dans un système théorique fondé sur la notion, héritée d’Alain Lemaréchal, de relation minimale (→3.2.1.2). Nous sommes parti de l’existence d’un lien sémantique entre les unités en présence et nous avons caractérisé la manière dont ce lien était spécifié (→3.2.2.2). Nous croyons, au delà de l’intérêt pratique de cette première partie, que les concepts dégagés peuvent être jugés suffisamment généraux sinon pour servir à la comparaison d’autres systèmes graphiques ou syntaxiques, du moins afin de constituer une base à leur description. 8.1.2
Deuxième partie: analyse des données
Une fois les concepts définis et l’ensemble du corpus annoté,1 il a été envisageable de répondre à la question posée. Néanmoins, l’ensemble des données disponibles, de par sa nature et son abondance, rendait l’approche traditionnelle – ou plutôt manuelle – difficilement applicable. C’est pourquoi nous avons ouvert la seconde partie du travail en annonçant le recours à des méthodes plus outillées: les statistiques.2 Ces méthodes présentées, nous avons sélectionné six caractéristiques morphosyntaxiques et positionnelles que nous avons jugées fondamentales pour décrire tous les constituants. Ces variables répondaient à six questions: 1/ du point de vue de l’ordre linéaire des mots, le constituant est-il le premier de la structure qu’il sert à construire? 2/ le constituant est-il le dernier de la structure qu’il sert à construire? 3/ quelle est la 1 2
Voir la section Analyses syntaxiques des annexes. Voir →4, en particulier →4.2, où nous exposons le détail des raisons et des implications de ce choix.
360
nature et le niveau d’intégration syntaxique de la structure qui le contient? 4/ quelle est la fonction du constituant? 5/ est-il de nature propositionnelle (mode personnel ou non)? 6/ est-il relaté? Nous avons ensuite pu mettre en relation les réponses à ces questions et la simple présence de ponctuation de part et d’autre des constituants, sans tenir compte, dans un premier temps, de la forme des ponctogrammes.3 Pour ce faire, nous avons essentiellement employé les techniques statistiques les plus classiques en sciences humaines: l’analyse des tableaux de contingence à l’aide du test du χ2 (→5.2.1.2). Après avoir évalué la relation entre chacune des six variables et la ponctuation, nous avons constaté l’inefficacité de la méthode (→5.2.3), ce qui nous a conduit à en rechercher une autre, permettant d’envisager simultanément toutes les variables morphosyntaxiques et positionnelles.4 Ces nouveaux dépouillements nous ont permis de repérer, au milieu de la masse de constituants inégalement marqués par la présence d’un ponctogramme, ceux dont le marquage ou le rejet du marquage avait la plus faible probabilité d’être dû au hasard. Ce qui est ressorti de cette première étape, où les données étaient réduites à une représentation très abstraite, c’est une liste de points forts concernant (→5.3.3.3): – la différence de fréquence entre le marquage de la phrase et celui des autres propositions; – la spécificité du marquage d’un certain nombre de types d’arguments; – le rejet manifeste du marquage du prédicat; – la faible fréquence de marquage à la suite des relateurs; – la forte présence de marquage devant les coordonnants. Nous avons ainsi pu observer que la ponctuation n’était pas obligatoire, mais que sa présence était certainement liée à un contexte syntaxique spécifique. Ensuite, ces grandes lignes ont pu être inspectées de manière plus concrète: pour chaque tendance qui le justifiait, nous avons évalué la probabilité que l’attraction ou la répulsion observée soit généralisée. Nous avons adopté la position pragmatique selon laquelle toute tendance suffisamment fréquente pouvait être considérée comme générale si le fait de retirer les chartes qui la manifestaient de manière significative de l’échantillon ne changeait pas significativement la probabilité d’attraction (par exemple, →6.1.1.1 a). Il en est ressorti que la plupart des tendances observées étaient générales ou trop faiblement illustrées pour être évaluées de ce point de vue. Par ailleurs, nous avons essayé de mettre en relation la ponctuation avec le contexte immédiat, ce qui nous a laissé observer que beaucoup de constituants étaient davantage, voire exclusivement marqués au contact d’autres constituants attirant également le marquage5 ou dans un contexte de coordination.6 Cet examen détaillé des tendances mises en évidence au chapitre →5 permet en fin de compte de faire le tri parmi les tendances et de repérer celles qui sont manifestement dues à l’entourage du constituant ou au document dans lequel il est attesté. En observant plus intuitivement les attestations, nous avons également pu repérer, comme
3 4 5 6
Le détail des modalités sélectionnées pour ces variables est exposé sous →5.0.2. Voir →5.3, en particulier →5.3.1, où nous expliquons comment nous avons procédé. Voir, par exemple, le cas du marquage du prédicat, →6.1.2.1 c. Voir, par exemple, le cas du sujet, →6.1.3.1.
361
nous nous y attendions,7 un certain nombre de tendances liées à des facteurs étrangers à la morphosyntaxe: la ponctuation de formules spécifiques au type discursif, celle des chiffres ou encore la présence d’un ponctogramme devant les noms de personnes. En outre, l’examen du détail des attestations nous a amené à proposer des révisions concernant le modèle d’analyse morphosyntaxique présenté au chapitre →3 (→6.4.3): 1/ il conviendrait que soient pris en compte les lexèmes employés; 2/ la notion de la coordination pourrait être étendue à des groupements de constituants que nous n’avons pas considérés comme coordonnés; 3/ il serait peut-être profitable de considérer les coordonnants de la même manière que les autres relateurs. D’autre part, nous avons insisté sur le fait que l’analyse des structures en syntaxe immédiate gagnerait à être moins abstraite. De cette étude de la fréquence du marquage est ressorti un ensemble d’environnements propices à la présence de ponctuation. À ce moment, il nous a été possible de réintroduire les considérations portant sur la forme des ponctogrammes et d’employer l’Analyse Factorielle des Correspondances (AFC) pour décrire les données (→7.2). Nous avons effectué un tri croisé pour mesurer les associations entre la forme des ponctogrammes et la tendance au marquage spécifique à la position où se trouvait ce ponctogramme (ce qui incluait l’absence d’environnement attirant le marquage). Après une analyse exploratoire, nous avons complété notre étude par une série de tests évaluant la probabilité que les regroupements entre la forme des ponctogrammes et l’environnement dans lequel on les rencontre soit due au hasard (→7.3). Dans la majorité des cas observés, les contrastes mis en évidence par l’AFC correspondaient à des oppositions significatives. L’étude détaillée de la forme a mené à la conclusion suivante: les ponctogrammes autres que ‹·› sont plus rares, et leur emploi paraît plus spécifique à un environnement donné. En d’autres termes: non seulement les scribes ne ponctuaient pas n’importe où, mais, en plus, ils n’employaient pas indifféremment les signes. Les méthodes ne permettant pas de traiter de manière efficace les ponctogrammes peu attestés, nous les avons simplement commentés, laissant de côté les statistiques pour une étude plus philologique (→7.4). Ces observations ont mené, d’une part, à la critique de la validité de la transcription: 1/ certaines distinctions entre les formes sont peut-être superflues;8 2/ certaines unités peuvent être confondues avec d’autres.9 D’autre part, la forme des ponctogrammes pose la question de la relation entre les ponctogrammes et le reste du système graphique (→7.4.2). 8.1.3
Tableau de synthèse
En bout de course, une partie des résultats nous paraissent bien assurés et stables et mériteraient d’être mis à l’épreuve de matériaux différents de ceux ayant servi dans cette étude. Ces résultats que nous considérons comme suffisamment sûrs pour être conservés dans cette conclusion sont reportés dans le tableau de la page 363. La première colonne contient l’environnement attirant la ponctuation (chapitre →6), la deuxième colonne propose un sigle pouvant être intégré à un texte dont on 7 8 9
Voir en particulier l’analyse du ’marquage des structures en syntaxe immédiate, sous →6.2.2. Voir le cas du contraste entre ‹·› et ‹·/› (→7.3). Voir, par exemple, le cas de ‹–› (→7.4.2).
362
Structure
Sigle
Positions
Formes
Énoncé
Énoncé
⊗x⊗
‹¶›, ‹;›
Coordination
Coord.
⊗x ⊗ ety⊗
Actants
⊗x
– 0,1,S1,pers,1 (MI.phrase)
S1
– 0,1,R2,pers,1 (¬pers-arg)
R2
– 1,0,R3,0,1
R3
– 0,0,A4,0,1 (pers,pers-arg,¬pers-arg)
A4
– 0,0,C5,pers,0
Incidente
⊗x⊗
– 0,0,C5,0,1 (pers,¬pers)
0,0,C5,0,1
⊗x⊗
– 0,1,C5,0,0 (phrase,¬pers-arg,pers,¬pers)
0,1,C5,0,0
⊗x
– 0,1,C5,0,1 (phrase,pers-arg,pers)
0,1,C5,0,1
⊗x
0,1,C5,¬pers,1
⊗x
– 0,1,C5,pers,1 (phrase)
0,1,C5,pers,1
⊗x
– 0,0,C5,0,0 (:pers-arg,:pers)
0,0,C5,0,0
x⊗
– 0,0,C5,0,1 (phrase,pers-arg,¬pers-arg)
0,0,C5,0,1
x⊗
0,0,C5,¬pers,1
x⊗
– 0,0,C5,pers,1 (phrase,pers-arg,pers)
0,0,C5,pers,1
x⊗
– 1,0,C5,pers,1 (phrase)
1,0,C5,pers,1
x⊗
– 0,0,C5,¬pers,1 (phrase)
’ (‹·›)
’ ‹·›, ‹·/›
Circonstants
– 0,1,C5,¬pers,1 (pers,phrase)
‹/›
.
Autres (non confirmé par les statistiques) – chiffres
x
– titres, noms de personnes,. . .
NP
⊗x⊗
⊗x
‹··›
Répulsions – P0
NA
øxø
– C6
NA
xø
– Co
NA
xø
– Rl
NA
xø
TAB . 8.1 – Tableau synthétique des tendances dégagées
363
étudie la ponctuation. Nous l’exploiterons dans la section suivante (→8.2). La troisième colonne indique la position des ponctogrammes (indiquée par ‹⊗›) par rapport au constituant. La dernière colonne reprend les associations entre les environnements et les formes (chapitre →7).
8.2
À l’épreuve d’autres matériaux
Tentons une expérience. Dépassons à présent le corpus que nous avons exploité. Oublions-le et ne gardons que les conclusions auxquelles il a permis d’aboutir. Replaçons-nous ensuite dans une situation pratique fréquente pour le philologue et pour l’historien de la langue affectionnant le retour aux sources: la lecture d’un texte, sans l’aide d’un ordinateur, sans analyse préalable. Comment appliquer les résultats de notre travail à de nouveaux matériaux? Les tendances dégagées aident-elles à comprendre les documents? Nous avons choisi ces documents dans des volumes d’éditions diplomatiques récents: l’édition des chartes luxembourgeoises de 1226 à 1281 de l’équipe de Günter Holtus et al. (2003) et l’édition des chartes champenoises de 1270 à 1300 de Pieter Reenen (2007). Dans ces deux volumes, nous avons choisi la charte la plus ancienne accompagnée d’une photographie du document, ce qui nous a permis de vérifier la qualité de la transcription. Nous avons fait l’exercice d’annoter ces chartes au fur et à mesure de leur lecture. Pour chaque ponctogramme, nous avons indiqué par un sigle10 à sa suite quelle tendance dégagée dans notre étude était à même d’en expliquer la valeur. Les chevrons à l’intérieur de ces sigles pointent dans la direction du constituant concerné. Par exemple, indique que le constituant à droite du ponctogramme est un chiffre. Si plusieurs tendances expliquent simultanément un ponctogramme, elles sont séparées par ‹;›. Les ? indiquent les doutes et font l’objet d’une discussion à la suite de la lecture. 8.2.1
Charte luxembourgeoise ou lorraine de 1245
Cette première charte (Holtus et al. 2003, Document 11, 11 mai 1245 ; reproduction p. 689), localisée au Luxembourg ou en Lorraine d’après les éditeurs, compte trenteneuf ponctogrammes: – ‹·› est attesté trente-huit fois; – ‹–› est attesté une fois (ligne 9). Nous ne nous occuperons pas du ‹–›, qui relève de la syntaxe de mot (→3.2.3), ni du dernier ‹·›, qui achève la charte. 8.2.1.1
Lecture suivie
Commençons par lire le texte intégralement, en reportant à la droite des ponctogrammes le sigle résumant la ou les raison(s) de sa présence. Nous reproduisons la 10 Celui donné dans le tableau 8.1.3.
364
transcription de l’édition sans aucune modification11 autre que l’ajout de sigles pour expliquer la poncuation. «Wéry, archidiacre de Metz et Henri Ier de Houffalize tranchent le débat opposant la comtesse Ermesinde de Luxembourg et ses deux fils au couvent de Saint Sauveur de Metz et attribuent à ce dernier la prévôté de Beuvange.12 Je Werriſ Arcediacreſ De Mez · Et Je Henriſ de Hvfailize faſonſ coigniſſant atouz ceouz ke ceſ lettreſ [2] vairont et oront ke dou beſtant ki eſtoit entre Madame laconteſſe De lucenbourc · et Mon ſeignor [3] Henri · Et monſeignor Gerairt · ceſ douz filz dune part · <0,0,C5,0,1; Et lou doien · et lo chapitre de ſaint ſalue[4]ovr datre · <0,0,C5,0,1 ke fut miz ſuz noſ par lou concentemant deſ partieſ · Incidente> ceſt aſauoír deſ damaigeſ ke liſires [5] Henriſ · et liſien auoj´ent fait an lauj´le de biouenges · Et deſ douz hommeſ auſi Curſe · et thiederi · Et de lage[6]ſte ke Madame laconteſſe · et ſuj fill demandoient anlaujle de biouengges . Et delauowerie de biouenges · Co?> kil diſſo[7]ient ke˘lichapitreſ auoit aquaſteit · dont il diſſoient · ? ken lor enfaiſoit tort ·
˘
˘
dit en nostre dit kil laqujſſent ·
nj´ant nont ·
?
anceſ choceſ dauant diteſ · <Énoncé>
Ne il ne˘lor oj´r · ˘
?
Co>
<Énoncé>
Et ſi auons
Et ſi auonſ dit ancores ke˘lichapitreſ acquiſſet leſ ˘
· [9]
damaigeſ ke meſ–[10]ſireſ Henriſ · et liſien firent aſ Hommeſ debiouenges · <Énoncé> Et apreſ auonſ dit · ? ke meſ ſireſ Henriſ ranſet achapitre [11] por˘lour propreſ damaigeſ · ˘
x> l · <x livres de M eceins · <Énoncé> Et ancor auonſ dit en nostre raport ke˘ſilihomme de biouenges [12] welent aleir a˘tionvile · ou en autre leu deſouſ madame laconteſſe ou deſouz les affanſ por manoir [13] li aretaigeſ remaingnet touz quitteſ au chapitre dauant dit · <Énoncé> Et pour ce ke ce ſoit ferme choſe et [14] aſtaule ſi anſunt ceſ lettreſ ſeeleieſ de noſ ſeeſ en˘temognage de verite · ? ke furent faiteſ lov [15] Juedi apreſ leſ octaueſ ſainte croix · 0,0,C5,0,1> elmoiſ de mai · <0,1,C5,0,1;0,1,C5,pers,1> quant li˘miliareſ coroit par · Co>;x> M · ;<x
˘
˘
˘
˘
et cc ·
8.2.1.2
;<x
et xlv anſ ·»
Signes expliqués
Cette charte ne pose pas la question de la forme du marquage des ponctuants, étant donné que seul le ‹·› est employé – le ‹–› étant un signe apparaissant à l’intérieur d’un mot. Quelles structures expliquent le mieux la présence des ponctogrammes? a. Énoncé. Quatre énoncés (c’est-à-dire tous ceux contenus dans le document) sont marqués de part et d’autre par ‹·›, ce qui correspond tout à fait à la tendance générale et confirme l’individualité de la structure. b. Incidente. Le texte comporte une incidente (l. 4), qui est marquée de la même manière que les énoncés, par un ponctogramme de part et d’autre. c. Autres circonstants. Deux ponctogrammes sont expliqués par la présence d’un circonstant. Un autre ponctogramme se trouve à la limite entre deux circonstants (l. 15) et un autre pourrait autant être dû à la présence d’un circonstant qu’à une coordination (l.3).
11 Les petites espaces, indiquées dans l’édition par ‹˘ ›, sont ici rendues par ‹˘›. 12 En allemand dans le texte. Nous traduisons.
˘
365
d. Coordination. La coordination est fréquente dans le document et explique vingtdeux ponctogrammes, dont trois liés également au marquage des chiffres (l. 15) et un autre lié au marquage des circonstants (l. 3). Dans deux cas, on pourrait considérer qu’il y a coordination entre deux propositions de mode personnel relatées en syntaxe immédiate, pour peu qu’on accepte cette révision de notre modèle d’analyse:13 «ceſt aſauoír deſ damaigeſ ke liſires [5] Henriſ [. . .] Et delauowerie de biouenges · kil diſſo[7]ient ke˘lichapitreſ auoit aquaſteit · dont il diſſoient · ken lor enfaiſoit tort» (4). ˘
e. Chiffres. Si on accepte leur influence sur la ponctuation, les chiffres expliquent deux marquages à eux seuls (l. 11) et se combinent avec la coordination dans trois autres cas (l. 15). f. Tendances floues. Six ponctogrammes apparaissent à des endroits non prévus par les tendances retenues. Tout d’abord: «il diſſoient · ken lor enfaiſoit tort» (7). «Auonſ dit et raporteit · ke ma [8] dame laconteſſe et ſuj dou˘fill dauant dit · nj´ant nont · anceſ choceſ dauant diteſ» (7). ˘
[11]
por˘lour propreſ damaigeſ · l · ˘
«Et apreſ auonſ dit · ke meſ ſireſ Henriſ ranſet achapitre livres de Meceins» (10).
Le marquage de 0,1,R2,pers,1 est toujours en attraction, non significative partout, sauf dans la formule _faisons savoir que_.14 En contexte immédiat, nous relevons: «Et pour ce ke ce ſoit ferme choſe et [14] aſtaule ſi anſunt ceſ lettreſ ſeeleieſ de noſ ſeeſ en ˘temognage de verite · ke furent faiteſ lov [15] Juedi apreſ leſ octaueſ ſainte croix» (14). ˘
La structure 0,1,Ap,pers,1 attire le marquage initial,15 mais nous n’avons pas gardé cette tendance en raison de son affinité avec le contexte immédiat formé d’un 0,0,Ap,pers,1 ponctué à droite. Enfin, nous sommes étonné par la présence de ponctogrammes dans la position relevée ci-dessous: «Auonſ dit et raporteit · ke ma [8] dame laconteſſe et ſuj dou˘fill dauant dit · nj´ant nont · anceſ choceſ dauant diteſ» (7, 2 attestations). ˘
Cette ponctuation est complètement imprévisible: elle n’est justifiée par aucune tendance et «transgresse» l’interdiction de marquage après le prédicat. Les causes du marquage doivent certainement être cherchées ailleurs que dans la syntaxe.
13 Voir →6.2.2.2, où nous constatons le phénomène. 14 Voir le tableau synoptique de la page 224, ainsi que l’analyse →6.1.3.9. 15 Voir →6.2.2.2.
366
8.2.1.3
Résultats
Seuls six signes sur les trente-sept ponctogrammes analysés résistent à une analyse fondée sur les tendances dégagées. Cela correspond à 16.21% de l’effectif. Cette proportion atteint 21.62% si l’on exclut les justifications non syntaxiques (marquage des chiffres). Il nous semble que ces nombres restent suffisamment bas pour conclure que les grandes lignes du marquage des structures syntaxiques sont tout à fait pertinentes dans le cas de cette charte. 8.2.2
Charte champenoise de 1270
La charte (Reenen 2007, Document 1, 11 avril 1270 ; reproduction p. XIV- XV) contient vingt-huit ponctogrammes: – dix-huit ‹/›; – neuf ’‹.›; – un ‹·›. Nous n’analyserons pas le ‹/› apparaissant à la fin de la deuxième ligne, ce ponctogramme relevant de la syntaxe de mot. 8.2.2.1
Lecture suivie
Nous reproduisons la transcription de l’édition en introduisant quelques modifications. Premièrement, toute modernisation a été retirée. Ainsi certaines virgules, qui s’étaient introduites dans la transcription, ont été supprimées. De même, nous avons enlevé les séparations de mots et les agglutinations proposées par l’éditeur. Deuxièmement, nous avons jugé nécessaire de corriger certains passages, ce que nous avons indiqué par des notes. L’éditeur emploie ‹.› pour transcrire le punctus que nous représentons par ‹·›. «Assignation par Erart, sire de Vallery et connétable de Champagne, sur ses cens de Cervet, en faveur de l’infirmière de l’abbaye de Notre-Dame-aux-Nonnains de Troyes, à commencer par sa cousine Isabelle et en continuant après sa mort, de 50 sous tournois annuels donnés à l’abbaye par son père [Jean, sires de Vallery]16 pour la célébration de son anniversaire. [1]
A touz cauz qui cez presentes letres verront et orront /
Je Ernaz sire de Valeri cones-
table de Champaigne Salut en nostre [2] Seignor . <Énoncé> Je faiz sauoir a touz que com mes sires mes peres / Co> en son boen sens / et en sa bone memoire / Cinquante solz de tournois de Rente chascun an ·18 <0,0,C5,0,0 a tout iors [4] por faire pittance au dit Couuent / le ior com fera anniuersare en leglise / <Énoncé> Je les diz Cinquante solz asie19 penre et a receuoir Chascun an / ? le ior de feste saint20 Remi ou chief doctobre /
0,1,C5,0,0>
a
[5]
<0,0,C5,0,0;0,1,C5,0,1>
en mes cens de Ceruel .
<Énoncé>
Et Weil
[6]
et Commant que li dit Cin-
16 Note de l’éditeur. 17 L’édition ne reproduit pas cette ‹/›. 18 L’édition transcrit ‹;›. 19 L’édition transcrit afie. Nous proposons une autre lecture. 20 L’édition transcrit ‹Saint›.
367
quante solt soient rendu et paie a ma chiere Cousine ysabel dou chastel enfermiere de nostre dame de Troies tant com ele viura / 0,1,C5,¬pers,1> por faire la pittance au Couuent / 0,1,C5,0,0> le ior com fera 21 lanniuersare [8] mon seignor mon pere / <Énoncé> Et apres son deces ie Weil et conmant / ? que il soient rendu et paie chascun an au terme [9] desus dit a lanfermerie de celle eglise .
<Énoncé>
la quele sera tenue a departir les diz Cinquante soulz au dit Couuent le
ior de lanniuersare deuant dit /
<Énoncé>
Et a ce don garder et tenir enterinement /
Je oblige moi et mes hoirs et touz autres qui [11] la terre tenront apres moi .
<0,0,C5,¬pers,1
0,1,C5,0,1>
par quel
que raison que ce soit . <Énoncé> Et en tesmoignage de la quel chose / <0,0,C5,0,1 ie ai sellees cez presentes letres [12] de mon seel / <0,0,C5,0,1 en lan de lincarnation nostre seignor . Co>;x> mil . ;<x> CC . ;<x> lx et Nuef le venredi deuant pasques / 0,1,C5,0,1> ou mois de auril»22
8.2.2.2
Signes expliqués
a. Énoncé. Les sept énoncés successifs de ce document sont tous ponctués. Quatre d’entre eux sont marqués par ‹·›, trois par ‹/›. L’individualité de la structure est à nouveau appuyée par la ponctuation. b. R3. Le R3 qui ouvre la charte (l’adresse) est ponctué, comme cela a été fréquemment relevé dans notre corpus. c. Circonstants. Les circonstants justifient le marquage de dix ponctogrammes, dont un figurant à la frontière entre deux circonstants attirant la ponctuation (l. 5). Ce dernier signe a la forme ‹/›, comme sept autres ’ ponctogrammes marquant un C5. Un seul est marqué par ‹·› (l. 11) et un autre par ‹·› (l. 3). d. Coordination. Trois coordinations sont marquées par ‹/› et trois autres, impliquant des chiffres, par ‹·›. e. Chiffres. Tous les chiffres marqués le sont par le ponctogramme ‹·›. Trois d’entre eux sont combinés à une coordination (l.12). f. Tendances floues. Seules deux attestations ne rentrent pas dans le canevas dessiné par nos conclusions. La première précède à nouveau un 0,1,R2,pers,1: «Et apres son deces ie Weil et conmant / que il soient rendu et paie chascun an au terme [9] desus dit a lanfermerie de celle eglise.» (8).
La seconde est située entre deux circonstants: «Je les diz Cinquante solz asie a [5] penre et a receuoir Chascun an / le ior de feste saint Remi ou chief doctobre» (4).
Il est possible de justifier la présence du ponctogramme en étendant la notion de coordination (→6.4.3.2) ou en simplifiant la description des circonstants. Nous ne le ferons pas.
21 L’édition introduit ici une ‹/› que nous considérons comme un trait de plume insignifiant: il
n’a pas la même forme que les ‹/› du document et est rattaché au ‹a› qui le précède. 22 L’édition introduit ici un ‹.› absent du manuscrit.
368
8.2.2.3
Résultats
En nous refusant d’intégrer les chiffres aux facteurs explicatifs des ponctogrammes, la proportion de signes justifiés par leur environnement est de vingt sur vingt-six ponctogrammes, ce qui correspond à un pourcentage de 76.92%. Ce pourcentage grimpe à 92.31% si nous acceptons ces ponctogrammes marquant les chiffres. D’autre part, la forme des ponctogrammes employés se singularise de ce que nous avons pu observer globalement dans les chartes liégeoises par la présence massive du ponctogramme ‹/›, ’qui correspond à lui seul à près de deux tiers des ponctogrammes. Par contre, le ‹·› est bien à la limite finale d’un circonstant (→7.2.4.2 c) et les ‹·› ne sont attestés (à une exception près) que dans l’entourage des énoncés et de structures coordonnées. Ces deux dernières associations se conforment très bien aux tendances des chartes liégeoises (→7.2.4.2 c également). 8.2.3
Apports des analyses
Que retirer de ces deux lectures? Tout d’abord, elles sont pour l’essentiel compatibles avec les grandes lignes dégagées dans la deuxième partie de notre étude, malgré l’origine géographique différente de ces deux nouvelles chartes. Il est donc déjà possible d’affirmer que l’extension géographique des faits dépasse Liège et ses environs: même si les documents lus ici étaient exceptionnels par rapport aux autres chartes de la même région, tout dans le mode de transmission des chartes nous conforte au moins dans l’idée que les documents ont été écrits à des endroits différents.23 Nous pourrions même retenir cette hypothèse selon laquelle la proximité de ces documents avec les nôtres est exceptionnelle et ne reflète pas la situation générale, cela ne modifierait en rien la conclusion suivante: il existe une pratique commune, géographiquement répandue. Du reste, les faits de ponctuation qui ne correspondent pas à de grandes tendances sont généralement attestés ailleurs dans notre corpus.24 Leur présence dans ces documents témoigne une fois encore de la variation à cet égard, une variation dont la description est à présent envisageable par rapport à la référence que constitue notre conclusion.
8.3
Perspectives
Considérons à présent cette conclusion comme un nouveau point de départ. Nous avons déjà évalué ce qu’elle apporte et la manière dont nous avons répondu à notre question. Tournons-nous à présent vers le futur: comment peut-on envisager la suite du travail sur la ponctuation des chartes et, plus généralement, sur la ponctuation médiévale? Tout d’abord, le travail permanent d’enrichissement du corpus permettra, en intégrant éventuellement l’édition de chartes d’autres régions ou d’autres types de textes, 23 L’auteur qui s’identifie dans la suscription, les lieux mentionnés, etc. Voir Carolus-Barré
1964 et Monfrin 1968. 24 Mis à part deux ponctogrammes relevés sous →8.2.1.1, in fine.
369
de pallier les problèmes liés au manque d’effectif frappant certaines constructions ou certaines formes de ponctogrammes (→8.3.1). Ensuite, nous verrons comment pourra être envisagée la prise en considération de phénomènes linguistiques n’ayant pas été exploités dans l’analyse (→8.3.2). Enfin, le champ pourra également être étendu par la mise en relation de la ponctuation et d’autres phénomènes relevant de la langue écrite (→8.3.3). 8.3.1
Enrichissement du corpus
L’évolution du projet Khartês (→0.2.1) permettra d’augmenter progressivement la taille du corpus des chartes liégeoises, puis hutoises, namuroises, etc. Par ailleurs, les efforts de la communauté scientifique pour rassembler des matériaux permettant d’étudier la langue écrite des textes et en donner une édition sous forme électronique se multiplient. Le mouvement concerne entre autres l’édition de chartes: les sources des documents traités dans Holtus et al. 2003 sont électroniques (180 documents entre 1228 et 1281), l’édition des chartes lorraines (290 documents avant 1271) est en cours (Gleßgen 2005). On peut également espérer que la version électronique annoncée de l’édition des chartes de l’Aube (Reenen 2007) sera diplomatique (72 chartes entre 1270 et 1298). Les textes littéraires sont également en cours d’édition. Certains sont déjà anciens, comme le projet Charrette, pionnier de l’édition électronique (Uitti 1998 et, pour un état des lieux plus récent Murray 2005); d’autres sont toujours en cours d’élaboration, comme le projet Banque de Français Médiéval, partim. 5, entièrement dédié à la transcription diplomatique de manuscrits pour la plupart littéraires (Lavrentiev 2005). Quels que soient les types de textes et leur localisation, une édition attentive à la transcription fidèle des ponctogrammes pourra servir à enrichir les résultats de notre étude: en augmentant le volume de données, les modalités peu attestées des variables décrivant la morphosyntaxe ou la ponctuation devraient atteindre un niveau suffisant de représentation (→8.3.1.1). En outre, cet accroissement des matériaux rendra possible et nécessaire la réflexion sur le classement de ces derniers suivant des critères extralinguistiques (→8.3.1.2). 8.3.1.1
Meilleure représentation des modalités
Du fait de l’emploi généralisé du test du χ2 pour décrire nos données, nous avons dû écarter de l’analyse les modalités décrivant la position et la structure morphosyntaxique des constituants trop peu représentés.25 Il est certain qu’une partie des constituants ainsi négligés relèvent de tendances au marquage spécifiques. Un agrandissement du corpus permettra d’augmenter l’effectif de ces structures jusqu’à un niveau suffisamment élevé pour être pris pleinement en considération.26 25 Sur les conditions d’application du test, voir →5.2.1.2 b. Sur la manière dont nous avons
écarté les constituants, voir notamment →5.3.1.3. 26 Les structures peu attestées sont partiellement prises en considération, notamment lorsque
nous vérifions, par une série de χ2 , quelles modalités se distinguent de toutes les autres (→5.3.1.3): les modalités cactéristiques d’un faible effectif d’individus sont toujours intégrées dans un groupe comprenant toutes les modalités à l’exception de celle qui est testée.
370
En outre, le tri à plat de la variable décrivant la forme des ponctogrammes (→7.1.1) laisse voir que certains d’entre eux, comme ‹;› ou ‹¶›, sont très peu attestés dans notre corpus. Or, nous savons que tous les signes étaient employés par un grand nombre de scribes différents.27 Malgré leur relative rareté, ces ponctogrammes sont répandus, et l’augmentation de la taille du corpus nous livrera certainement de nouvelles attestations, rendant possible une étude statistique. 8.3.1.2
Meilleure description externe
Augmenter le nombre de chartes disponibles devra également permettre de dépasser le stade actuel, où les chartes sont, sauf exception, toutes considérées comme appartenant au même genre de texte.28 Nous avons constaté que quelques testaments paraissaient se distinguer des autres textes par une ponctuation spécifique des actants.29 Nous pensons qu’il ne s’agit pas d’un fait isolé: l’action juridique enregistrée par le texte imprime une structure à ce dernier, laquelle est servie par une ponctuation adéquate. Pour parfaire l’étude des tendances de marquage des constituants, il importera au moins de distinguer les types de chartes, ce qui ne portera ses fruits qu’une fois que la quantité de documents disponibles permettra de constituer des groupes fournis. L’introduction de textes relevant d’autres types discursifs que les chartes nous obligera à élaborer une meilleure description externe des matériaux, fondée non seulement sur la typologie textuelle, mais aussi sur la tradition dont est issu le document. 8.3.2 8.3.2.1
Faits linguistiques exploités Approfondissement et amélioration du modèle
À plusieurs reprises, nous avons attiré l’attention sur la perfectibilité du modèle syntaxique employé.30 L’analyse des données a permis de reconsidérer celui-ci à propos de structures particulières. Nous avons vu que plusieurs changements étaient envisageables, en particulier concernant, d’une part, l’extension de la notion de coordination aux combinaisons de circonstants (en syntaxe argumentale) ou d’appositions (en syntaxe immédiate)31 et, d’autre part, la modification de la position des coordonnants dans la représentation de la hiérarchie syntaxique.32 Dans le même ordre d’idées, la description pourrait être précisée au niveau de la syntaxe immédiate, pour laquelle la bipartition entre les déterminants et les appositions semble trop générale pour permettre un classement fin (→6.4.3.3).
27 Voir les nombreux exemples dans Parkes 1992. 28 Voir la définition du terme charte sous →3.1.2.1 b. 29 Voir la conclusion sur la fréquence du marquage (→6.4.1). 30 Nous avons conclu le chapitre →3 en la soulignant. 31 Voir la synthèse →6.4.3.2. 32 Voir la synthèse →6.4.3.4.
371
8.3.2.2
Autres points de vue
Les résultats encourageants obtenus en tenant le simple pari que la syntaxe est à même d’expliquer seule une grande partie de la ponctuation (→0.1.1.2) ne justifieraient évidemment pas que l’on s’en contente. Nous pouvons à présent nous servir de la ponctuation syntaxique comme d’un cadre de référence pour commencer à travailler sur les relations entre les ponctogrammes et d’autres points de vue33 sur les textes: le plan sémantique et le plan énonciatif. Cependant, l’examen du plan morphosyntaxique ayant conduit à l’identification de faits sémantiques et énonciatifs paraissant particulièrement liés à la ponctuation, il nous paraît envisageable de restreindre la description de ces plans à une série limitée de phénomènes intéressants. Ainsi pensons-nous qu’une grande partie de l’apport du plan sémantique en la matière pourra être appréhendée par la seule catégorisation des nombres et des noms de personnes et d’institutions (→6.2.3). De même, l’étude des structures énonciatives pourra se limiter à l’identification des formules et des éléments les plus stables de la composition du discours diplomatique. 8.3.3
Interférences avec le système graphique
Ayant à notre disposition un ensemble précis d’environnements expliquant la présence de la ponctuation, nous pourrons nous servir de cet ensemble comme d’un nouveau point de référence pour confronter la répartition des ponctogrammes avec celle des hétérogrammes ou des différents topèmes. Par exemple, concernant les hétérogrammes, nous pourrons essayer de répondre à des questions du type: – l’emploi des hétérogrammes permet-il de pallier le manque d’expressivité du punctus? – observe-t-on un phénomène de supplétion? Les hétérogrammes apparaissent-ils aux endroits non marqués où l’on pourrait néanmoins trouver un ponctogramme? – y a-t-il des cas où le marquage par un hétérogramme ne correspond pas du tout à une tendance relevée pour le marquage à l’aide de ponctogrammes? Concernant les topèmes, nous pourrons nous demander ceci: – l’agglutination des mots concerne-t-elle les mêmes unités que celles qui rejettent la ponctuation? – peut-on observer une cohérence entre l’emploi de la ponctuation de mot (coupures de mots au passage à la ligne) et les faits d’agglutination? La réponse à ces questions permettra de mettre en relation les unités de la langue écrite sur la base de faits empiriques et non dans la démarche hypothético-déductive qui a été suivie par tous les travaux posant l’interdépendance de ces unités (→0.1.1). En somme, les travaux à venir seront stimulants, parce qu’ils permettront d’articuler la petite pièce que nous avons révélée au grand ensemble, qui implique tous les aspects du système de la langue. Nous n’avons pas fini de compter les points
33 Sur la théorie des trois points de vue, voir →3.1.3.1.
372
Bibliographie
A
Travaux
Abdi, Hervé, Bonferroni and Šidák corrections for multiple comparisons, in: Neil J. Salkind (ed.), Encyclopedia of Measurement and Statistics, Thousand Oaks, Sage, 2007, 103–107. Adam, Jean-Michel, Linguistique textuelle. Des genres de discours aux textes. Une introduction méthodique à l’analyse textuelle des discours, Paris, Nathan, 1999. Agresti, Alan, Categorical data analysis, Hoboken, New Jersey, John Wiley & Sons, 2 2002. Anis, Jacques, Pour une graphématique autonome, Langue française 59 (1983), 31–44. — Une graphématique autonome?, in: Nina Catach (ed.), Pour une théorie de la langue écrite, Paris, C.N.R.S., 1988, 213–223. — Texte et ordinateur. L’écriture réinventée?, Paris/Bruxelles, De Boeck et Larcier, 1998. — Les linguistes français et la ponctuation, L’information grammaticale 102 (2004), 5–10. Anis, Jacques et al., L’écriture. Théories et descriptions, Bruxelles, De Boeck, 1988. Audrit, Stéphanie, Problématique de l’identification des noms propres dans un corpus de chartes originales en langue française originaires du chapitre de la cathédrale Saint-Lambert (12361270) et du couvent de Robermont (1247-1271), Liège, Université de Liège, 2003. Baader, Franz/Nutt, Werner, Basic Description Logics, in: Franz Baader et al. (ed.), Description Logic Handbook, Cambridge, Cambridge University Press, 2002, 47–100. Baddeley, Susan, La ponctuation de manuscrits français du IXe au XIIe siècle, in: Liselotte Biedermann-Pasques et al. (ed.), Usages graphiques, normes et ponctuation, Paris, C.N.R.S., 2001, 139–149. Barbance, Céline, La ponctuation médiévale: quelques remarques sur cinq manuscrits du début du XVe siècle, Romania 113 (1995), 505–527. Barreau, Hervé, L’épistémologie, Paris, Presses Universitaires de France, 5 2002. Benveniste, Émile, La nature des pronoms, in: Problèmes de linguistique générale, I, Paris, Gallimard, 1946, 251–257. — Les niveaux de l’analyse linguistique, in: Problèmes de linguistique générale, I, Paris, Gallimard, 1964, 119–131. — Problèmes de linguistique générale, I, Paris, Gallimard, 1966. — Problèmes de linguistique générale, II, Paris, Gallimard, 1974. Bertrand, Paul, Commerce avec dame Pauvreté. Structure et fonction des couvents mendiants à Liège (XIIIe et XIVe siècles), Genève, Droz, 2004. Bloomfield, Leonard, Le langage, Paris, Payot, 1970. Boutier, Marie-Guy, Études sur des chartes luxembourgeoises, in: Kurt Gärtner et al. (ed.), Skripta, Schreiblandschaften und Standardisierungstendenzen, Trier, Kliomedia, 2001, 419–447. — Verbes centraux du dispositif des chartes: essai d’analyse, in: Fernando Sánchez Miret (ed.), Actas del XXIII Congreso Internacional de Lingüística y Filología Románica. Salamanca, 24-30 septiembre 2001, Tübingen, Niemeyer, 2003, vol. 4, 39–51. Brugali, Nicolas, Édition de chartes originales françaises de l’abbaye du Val Saint-Lambert (1254-1271), Liège, Université de Liège, 2003. Buridant, Claude, Le strument et et ses rapports avec la ponctuation dans quelques textes médiévaux, in: Anne-Marie Dessaux-Berthonneau (ed.), Théories linguistiques et traditions grammaticales, Lille, Presses universitaires de Lille, 1980, 13–53. — Grammaire nouvelle de l’ancien français, Paris, Sedes, 2000.
373
Carolus-Barré, Louis, Les plus anciennes chartes en langue française. Tome premier. Problèmes généraux et recueil des pièces originales conservées aux archives de l’Oise 1241-1286, Paris, Klincksieck, 1964. Catach, Nina, Le graphème, Pratiques 25 (1979), 21–32. — La ponctuation, Langue française 45 (1980), 16–27. — L’écriture en tant que plurisystème, ou théorie de L prime, in: Nina Catach (ed.), Pour une théorie de la langue écrite, Paris, C.N.R.S., 1988, 243–256 (= 1988a). — (ed.), Pour une théorie de la langue écrite. Actes de la Table Ronde internationale C.N.R.S. – H.E.S.O. Paris, 23-24 octobre 1986, Paris, C.N.R.S., 1988 (= 1988b). — La ponctuation (histoire et système), Paris, Presses Universitaires de France, 2 1996. — L’orthographe, Paris, Presses Universitaires de France, 8 1998. — Graphémique, in: Günter Holtus et al. (ed.), Lexikon der Romanistischen Linguistik 1(1), Tübingen, Niemeyer, 2001, 736–747. Chambon, Jean-Pierre, La déclinaison en ancien occitan, ou: comment s’en débarrasser? Une réanalyse non orthodoxe de la flexion substantivale, Revue de linguistique romane 67 (2003), 342–363. Cibois, Philippe, Les pièges de l’analyse des correspondances, Histoire et Mesure 12 (1997), 299–320. — L’analyse factorielle. Analyse en composantes principales et analyse des corespondances, Paris, Presses Universitaires de France, 5 2000. — Les écarts à l’indépendance, Sciences Humaines, 2003, http://www.scienceshumaines.com/textesInedits/Cibois.pdf (visité le 1er jan. 2007). Cohen, David, L’aspect verbal, Paris, Presses Universitaires de France, 1989. Colombat, Bernard/Savelli, Marie (edd.) Métalangage et terminologie linguistique. Actes du colloque International de Grenoble (Université Stendhal – Grenoble III, 14-16 mai 1998), Leuven et al., Peeters, 2001. Coulmas, Florian, The Blackwell encyclopedy of writing systems, Cambridge, Blackwell, 1996. Creissels, Denis, Éléments de syntaxe générale, Paris, Presses Universitaires de France, 1995. Cárcel Ortí, Milagros, Vocabulaire international de la diplomatique, València, Universitat de València, 1994. Dahlet, Véronique, Ponctuation et énonciation, Matoury, Guyane, Ibis rouge, 2003. Daneš, František, A three-level approach to syntax, in: Travaux linguistiques de Prague. I: l’école de Prague aujourd’hui, Prague, Éditions de l’Académie tchécoslovaque des sciences, 1964, 225–240. Depecker, Loïc, Linguistique et terminologie: problématique ancienne, approches nouvelles, Bulletin de la Société de Linguistique de Paris 97 (2002), 123–152. — Entre signe et concept, Paris, Presses de la Sorbonne Nouvelle, 2003. Dubois, Jean et al., Dictionnaire de linguistique, Paris, Larousse, 2002. Eynde, Karel et al., Structuration segmentale et suprasegmentale en syntaxe. Vers un modèle intégrationniste de l’écrit et de l’oral, in: Mireille Bilger et al. (ed.), Analyse linguistique et approche de l’oral, Louvain/Paris, Peeters, 1998, 33–57. Feuillet, Jack, Se débarrassera-t-on un jour des parties du discours?, Bulletin de la Société de Linguistique de Paris (1983), 23–51. — Introduction à l’analyse morphosyntaxique, Paris, Presses Universitaires de France, 1988. Fónagy, Ivan, Structure sémantique des signes de ponctuation, Bulletin de la Société de Linguistique de Paris 75 (1980), 95–127. Gagnepain, Jean, Du vouloir-dire, traité d’épistémologie des sciences humaines (I: Du signe, de l’outil), Paris, Pergamon Press, 1982. Gak, V[ladimir] G. L’orthographe du français, Paris, Selaf, 1976. Garde, Paul, Des parties du discours, notamment en russe, Bulletin de la Société de Linguistique de Paris 76 (1981), 155–189. Gelb, I[gnace] J. Pour une théorie de l’écriture, Paris, Flammarion, 1973. Gigot, Jean-Gabriel, Chartes en langue française antérieures 1271 conservées dans le département de la Haute-Marne, Paris, C.N.R.S., 1974. Gleason, H[enry]-A[llan], Introduction à la linguistique, Paris, Larousse, 1969. Gleßgen, Martin-Dietrich, Editorische, lexikologische und graphematische Erschließung altfranzösischer Urkundtexte mit Hilfe von TUSTEP. Stand der Arbeiten, in: Kurt Gärtner/
374
Günter Holtus (ed.), Überlieferungs- und Aneignungsprozesse im 13. und 14. Jahrhundert auf dem Gebiet der werstmitteldeutschen und ostfranzösischen Urkunden und Literatursprachen, Trier, Kliomedia, 2005, 91–107. Greenacre, Michael, Correspondance Analysis and its interpretation, in: Michael Greenacre/Jörg Blasius (ed.), Correspondance analysis in the social sciences, London, Academic Press, 1994, 3–22. Greenacre, Michael/Blasius, Jörg (edd.) Correspondance analysis in the social sciences, London, Academic Press, 1994. Grevisse, Maurice, Le bon usage, Gembloux/Paris, Duculot/Hatier, 9 1969. Grevisse, Maurice/Goosse, André, Le bon usage. Grammaire française, Paris/Louvain-la-neuve, De Boeck Université, 14 2007. Gross, Gaston, Les expressions figées en français. Noms composés et autres locutions, Gap/Paris, Ophrys, 1996. Gruaz, Claude, Recherches historiques et actuelles sur la ponctuation. Compte rendu de la table ronde internationale sur la ponctuation, mai 1978, C.N.R.S. Ivry, Langue française 45 (1980), 8–15. — Phonèmes, graphèmes, morphèmes, Pratiques 46 (1985), 97–106. Guyotjeannin, Olivier et al., Diplomatique médiévale, Louvain-la-Neuve, Brepols, 1993. Haas, W. (ed.) Writing without letters, Manchester, Manchester University Press, 1976. Hagège, Claude, Les pièges de la parole. Pour une linguistique socio-opérative, Bulletin de la Société de Linguistique de Paris 79 (1984), 1–47. — L’homme de paroles. Contribution linguistique aux sciences humaines, Paris, Fayard, 2 1986. — La structure des langues, Paris, Presses Universitaires de France, 5 1999. Halliday, M[ichael] A[lexander] K[irkwood], An introduction to functional grammar, London/Victoria, Arnold, 1985. Harris, Roy, La sémiologie de l’écriture, Paris, C.N.R.S., 1993. — Signs of writing, London/New-York, Routledge, 1995. Hirschberg, Lidya, Lois formelles de la ponctuation, Linguistics (1965), 21–63. Hjelmslev, Louis, La structure morphologique, in: Essais Linguistiques, Paris, Minuit, 1939, 122–147. — La stratification du langage, in: Essais Linguistiques, Paris, Minuit, 1954, 45–77. — Prolégomènes à une théorie du langage, Paris, Minuit, 1968. — Essais Linguistiques, Paris, Minuit, 1971. Holtus, Günter et al. (ed.) Luxemburgische Skriptastudien. Edition und Untersuchung der altfranzösischen Urkunden Gräfin Ermesindes (1226-1247) und Graf Heinrichs V. (1247-1281) von Luxemburg, Tübingen, Niemeyer, 2003. Hoˇrejší, Vladimír, Formes parlées, formes écrites et systèmes orthographiques des langues, Folia linguistica 5 (1971), 185–193. Howell, David C. Méthodes statistiques en sciences humaines, Paris/Bruxelles, De Boeck et Larcier, 1998. Jaffré, Jean-Pierre, La ponctuation du français: études linguistiques contemporaines, Pratiques 70 (1991), 61–84. — Écriture(s) et problèmes terminologiques, in: Bernard Colombat/Marie Savelli (ed.), Métalangage et terminologie linguistique, Leuven et al., Peeters, 2001, 529–543. Joly, Geneviève, Précis d’ancien français. Morphologie et syntaxe, Paris, Armand Colin, 1998. Klinkenberg, Jean-Marie, Vers une typologie des fonctions de l’écriture. De la linéarité à la spatialité, Bulletin de la Classe des Lettres 6 (2005), 157–196. Laboratoire de français ancien, http://www.lib. uchicago.edu./efts/ARTFL/projects/TLA (visité le 1er jan. 2007). Lavrentiev, Alexei, À propos de la ponctuation dans l’Image du monde, La licorne 52 (2000), 23–35. — Manuel d’encodage XML-TEI étendu des transcriptions de manuscrits dans le projet BFM-Manuscrits. Normes utilisées à la date du 14 décembre 2005, 2005, http://bfm.enslsh.fr/IMG/pdf/BFM-Mss\_Encodage-XML.pdf (visité le 10 mar. 2006). — Pour une méthodologie d’étude de la ponctuation médiévale basée sur une approche typologique, Verbum (à paraître).
375
Lazard, Gilbert, La distinction entre nom et verbe en syntaxe et en morphologie, Modèles linguistiques 6 (1984), 29–39. — L’actance, Paris, Presses Universitaires de France, 1994. — Thème, rhème: qu’est-ce à dire?, in: Études de linguistique générale, Leuven/Paris, Peeters, 1998, 79–90. — La linguistique est-elle une science?, Bulletin de la Société de Linguistique de Paris 94 (1999), 67–112 (= 1999a). — Pour une terminologie rigoureuse: quelques principes et propositions, Mémoires de la Société de Linguistique de Paris 6 (1999), 111–132 (= 1999b). Lebart, Ludovic/Salem, André, Statistique textuelle, Paris, Dunod, 1994. Lebart, Ludovic et al., Statistique exploratoire multidimensionnelle, Paris, Dunod, 1998. Lemaréchal, Alain, Sur la prétendue homonymie des marques de fonction: la superposition des marques, Bulletin de la Société de Linguistique de Paris 78 (1983), 53–76. — Les parties du discours. Sémantique et syntaxe, Paris, Presses Universitaires de France, 1989. — Zéro(s), Paris, Presses Universitaires de France, 1997. Mantou, Reine, Chartes en langue française antérieures à 1271 conservées en Flandre Orientale et Flandre Occidentale, Paris, C.N.R.S., 1987. Marchello-Nizia, Christiane, Ponctuation et «unités de lecture» dans les manuscrits médiévaux ou: je ponctue, tu lis, il théorise, langue française 40 (1978), 32–44. — Question de méthode, Romania 106 (1985), 481–492. — L’évolution du français. Ordre des mots, démonstratifs, accent tonique, Paris, Armand Colin, 1995. — Le comma dans un manuscrit du 13e s.: grammaticalisation d’un marqueur de corrélation, ou marquage d’une intonation montante?, in: Olivier Bertrand et al. (ed.), Discours, diachronie, stylistique du français. Études en hommage à Bernard Combettes, Berne, Peter Lang, 2007, 293–305. Martin, Robert, Comprendre la linguistique. Épistémologie élémentaire d’une discipline, Paris, Presses Universitaires de France, 2002. Martinet, André (ed.) Grammaire fonctionnelle du français, Paris, Didier/Crédif, 1979. — Éléments de linguistique générale, Paris, Armand Colin, 4 1996. Mazziotta, Nicolas, Chartes originales françaises de l’abbaye du Val-Benoît datant de 1259 à 1297, Liège, Université de Liège, 2001. — Inconstance ou consensus? Marquage de la protase en tête de phrase dans les chartes liégeoises du 13e siècle, in: David Trotter (ed.), Actes du XXIVe Congrès International de Linguistique et de Philologie Romane, Aberystwyth, 1-6 août 2004, Tübingen, Niemeyer, 2007, vol. 2, 225–238 (= 2007a). — Ponctuation et parties du discours diplomatique dans les actes émanés de la cour allodiale de Liège entre 1260 et 1290, in: Alexei Lavrentiev (ed.), Actes de la journée d’étude sur les systèmes graphiques de manuscrits médiévaux et incunables français: ponctuation, segmentation, graphies. Lyon, ENS-LSH, 6 juin 2005, Chambéry, Université de Savoie, 2007, 67–84 (= 2007b). — Étude linguistique de la ponctuation d’une charte originale en langue française (Liège 1272), Orbis (à paraître). Meter, Karl M. Et al., Correspondance analysis: a History and French sociological perspective, in: Michael Greenacre/Jörg Blasius (ed.), Correspondance analysis in the social sciences, London, Academic Press, 1994, 128–137. Moignet, Gérard, Grammaire de l’ancien français. Morphologie – Syntaxe, Paris, Klincksieck, 2 1988. Monfrin, Jacques, Le mode de tradition des actes écrits et les études de dialectologie, Revue de linguistique romane 32 (1968), 17–47. — Introduction, in: Chartes en langue française antérieures 1271 conservées dans le département de la Haute-Marne, Paris, C.N.R.S., 1974, XI – LXXX. Mounin, Georges, Dictionnaire de la linguistique, Paris, Presses Universitaires de France, 1974. Muller, Charles, Initiation aux méthodes de la statistique linguistique, Paris, Hachette, 1973. Murray, K. Sarah-Jane, Medieval scribes, modern scholars: reading Le chevalier de la charrette in the Twenty-First Century, 2005,
376
http://www.germanistik.ch/publikation.php?id=Medieval\_Scribes\_Modern\_Scholars/ (visité le 17 mar. 2006). Ménard, Philippe, Syntaxe de l’ancien français, Bordeaux, Bière, 4 1994. Naïs, Hélène, La ponctuation dans le manuscrit B de Villehardouin, in: Nina Catach (ed.), La ponctuation. Recherches historiques et actuelles. Fascicule deux, Besançon, C.N.R.S./ HESO, 1979, 45–55. Oakes, Michael P. Statistics for corpus linguistics, Edinburgh, Edinburgh University press, 1998. Parkes, M[alcolm] B. Pause and effect. An introduction to the history of punctuation in the West, Cambridge, Scholar Press, 1992. Pergnier, Maurice, Le mot, Paris, Presses Universitaires de France, 1986. Pottier, Bernard, Linguistique générale. Théorie et description, Paris, Klincksieck, 1974. R Development Core Team, R: A language and environment for statistical computing, Vienna, Austria, 2005, http://www.R-project.org (visité le 1er jan. 2007). Reenen, Pieter, Chartes de Champagne en français conservées aux Archives de l’Aube 12701300, Orléans, Paradigme, 2007. Remacle, Louis, Le problème de l’ancien wallon, Liège, Faculté de Philosophie et Lettres, 1948. Rey-Debove, Josette, Spécificité de la terminologie linguistique, in: Bernard Colombat/Marie Savelli (ed.), Métalangage et terminologie linguistique, Leuven et al., Peeters, 2001, 3–9. Rey, Alain, La terminologie: noms et notions, Paris, Presses Universitaires de France, 1979. — La terminologie. Noms et notions, Paris, Presses Universitaires de France, 2 1992. Roques, Mario, Le manuscrit fr. 794 de la Bibliothèque Nationale et le scribe Guiot, Romania 73 (1952), 177–199. Ruelle, Pierre, Chartes en langue française antérieures à 1271 conservées dans la province de Hainaut, Paris, C.N.R.S., 1984. Saussure, de, Cours de linguistique générale. Publié par Charles Bailly et Albert Séchehaye, avec la collaboration de Albert Riedlinger. Édition critique préparée par Tullio de Mauro, Paris, Payot, 1967. Si Alhir, Sinan, Introduction à UML, Sebastopol, O’Reilly/Associates, 2003. Skårup, Povl, Les premières zones de la proposition en ancien français, 1975. Soutet, Olivier, La syntaxe du français, Paris, Presses Universitaires de France, 3 1998. — Linguistique, Paris, Presses Universitaires de France, 3 2001. Stiennon, Jacques, Paléographie du moyen âge, Paris, Armand Colin, 2 1991. Swiggers, Pierre, Pour une systématique de la terminologie linguistique: considérations historiographiques, méthodologiques et épistémologiques, Mémoires de la Société de Linguistique de Paris 6 (1999), 11–49. Swiggers, Pierre/Van Hoecke, Willy, Aspects théoriques de la langue écrite, in: Elisabeth Feldbusch et al. (ed.), Neue Fragen der Linguistik. Akten des 25. Kolloquiums, Padeborn 1991, Band 1: Bestand und Entwicklung, Tübingen, Niemeyer, 1991, 501–508. Tesnière, Lucien, Éléments de syntaxe structurale, Paris, Klincksieck, 2 1965. Togeby, Knud, Structure immanente de la langue française, Paris, Larousse, 2 1965. Tournier, Claude, Histoire des idées sur la ponctuation, des débuts de l’imprimerie à nos jours, Langue française 45 (1980), 28–40. Uitti, Karl D. Informatique et textualité médiévale: l’exemple du projet Charrette, Le médiéviste et l’ordinateur 37 (1998), http://www.irht.cnrs.fr/meto/mo3711.htm (visité le 6 fév. 2003). Upton, Graham/Cook, Ian, Oxford dictionary of statistics, Oxford/New York, Oxford University Press, 2 2006. Vachek, Josef, Written language, general problems and problems of English, La Haye, Mouton, 1973. Védénina, L[udmilla] G. La triple fonction de la ponctuation dans la phrase: syntaxique, communicative et sémantique, Langue française 45 (1980), 60–66. — Pertinence linguistique de la présentation typographique, Paris, Peeters/Selaf, 1989. Wagner, Robert-Léon, L’ancien français. Points de vue. Programmes, Paris, Larousse, 1974. Wall, Larry et al., Programming Perl, Sebastopol, O’Reilly/Associates, 3 2000. Wilmet, Marc, Grammaire critique du français, Bruxelles, Duculot, 3 2003.
377
B Documents d’archives
Document, 15 décembre. Archives de l’État à Liège, Cathédrale Saint-Lambert à Liège, 1236–12–15. — juillet. Archives de l’État à Liège, Cathédrale Saint-Lambert à Liège, 1236–07. — mai. Archives de l’État à Liège, Cathédrale Saint-Lambert à Liège, 1236–05. — 12 octobre. Archives de l’État à Liège, Cathédrale Saint-Lambert à Liège, 1237–10–12. — 16 décembre. Archives de l’État à Liège, Cathédrale Saint-Lambert à Liège, 1237–09–16. — décembre. Archives de l’État à Liège, Cathédrale Saint-Lambert à Liège, 1237–12. — septembre. Archives de l’État à Liège, Cathédrale Saint-Lambert à Liège, 1241–09. — 2 mai. Archives de l’État à Liège, Cathédrale Saint-Lambert à Liège, 1242–05–02. — 15 août. Archives de l’État à Liège, Cathédrale Saint-Lambert à Liège, 1243–08–15. — 9 juillet. Archives de l’État à Liège, Cathédrale Saint-Lambert à Liège, 1243–07–09. — 19 janvier. Archives de l’État à Liège, Cathédrale Saint-Lambert à Liège, 1244–01–19. — juin. Archives de l’État à Liège, Couvent de Robermont à Robermont, 1247–06. — 25 juin. Archives de l’État à Liège, Cathédrale Saint-Lambert à Liège, 1249–06–25. — 1er mars. Archives de l’État à Liège, Couvent de Robermont à Robermont, 1252–03–01 (= 1252–03–01a). — 1er mars. Archives de l’État à Liège, Couvent de Robermont à Robermont, 1252–03–01 (= 1252–03–01b). — 21 mai. Archives de l’État à Liège, Abbaye du Val-Saint-Lambert à Seraing, 1255–05–21. — 16 janvier. Archives de l’État à Liège, Abbaye du Val-Benoît à Liège, 1259–01–16. — mai. Archives de l’État à Liège, Couvent de Robermont à Robermont, 1259–05. — 14 mai. Archives de l’État à Liège, Abbaye du Val-Benoît à Liège, 1260–05–14.
378
— 2 octobre. Archives de l’État à Liège, Abbaye du Val-Benoît à Liège, 1260–10–02. — 21 février. Archives de l’État à Liège, Abbaye du Val-Benoît à Liège, 1260–02–21 (= 1260–02–21a). — 21 février. Archives de l’État à Liège, Couvent de Robermont à Robermont, 1260–02–21 (= 1260–02–21b). — 3 février. Archives de l’État à Liège, Cathédrale Saint-Lambert à Liège, 1260–02–03. — 30 mai. Archives de l’État à Liège, Abbaye du Val-Benoît à Liège, 1260–05–30 (= 1260–05–30a). — 30 mai. Archives de l’État à Liège, Couvent de Robermont à Robermont, 1260–05–30 (= 1260–05–30b). — 9 juin. Archives de l’État à Liège, Couvent de Robermont à Robermont, 1260–06–09. — 9 mai. Archives de l’État à Liège, Abbaye du Val-Benoît à Liège, 1260–05–09. — 15 juillet. Archives de l’État à Liège, Cathédrale Saint-Lambert à Liège, 1263–07–15. — 19 juillet. Archives de l’État à Liège, Abbaye du Val-Benoît à Liège, 1263–07–19. — 20 juillet. Archives de l’État à Liège, Abbaye du Val-Benoît à Liège, 1263–07–20. — 27 mai. Archives de l’État à Liège, Cathédrale Saint-Lambert à Liège, 1263–05–27 (= 1263–05–27a). — 27 mai. Archives de l’État à Liège, Cathédrale Saint-Lambert à Liège, 1263–05–27 (= 1263–05–27b). — 27 mai. Archives de l’État à Liège, Cathédrale Saint-Lambert à Liège, 1263–05–27 (= 1263–05–27c). — 31 mars. Archives de l’État à Liège, Couvent de Robermont à Robermont, 1263–03–31. — novembre. Archives de l’État à Liège, Cathédrale Saint-Lambert à Liège, 1263–11. — 29 novembre. Archives de l’État à Liège, Abbaye du Val-Benoît à Liège, 1264–11–29. — 4. Archives de l’État à Liège, Cathédrale Saint-Lambert à Liège, 1264–04.
— 7 septembre. Archives de l’État à Liège, Abbaye du Val-Benoît à Liège, 1264–09–07. — 13 novembre. Archives de l’État à Liège, Couvent de Robermont à Robermont, 1265–11–13. — 15 avril. Archives de l’État à Liège, Abbaye du Val-Benoît à Liège, 1265–04–15. — 4 juillet. Archives de l’État à Liège, Abbaye du Val-Saint-Lambert à Seraing, 1265–07–04. — mai. Archives de l’État à Liège, Abbaye du Val-Saint-Lambert à Seraing, 1265–05 (= 1265–05a). — mai. Archives de l’État à Liège, Abbaye du Val-Saint-Lambert à Seraing, 1265–05 (= 1265–05b). — 13 juin. Archives de l’État à Liège, Abbaye du Val-Saint-Lambert à Seraing, 1266–06–13. — 22 octobre. Archives de l’État à Liège, Abbaye du Val-Benoît à Liège, 1267–10–22. — 28 août. Archives de l’État à Liège, Abbaye du Val-Saint-Lambert à Seraing, 1267–08–28. — 29 octobre. Archives de l’État à Liège, Abbaye du Val-Benoît à Liège, 1267–10–29. — 6 juillet. Archives de l’État à Liège, Abbaye du Val-Saint-Lambert à Seraing, 1267–07–06. — 1er mars. Archives de l’État à Liège, Abbaye du Val-Benoît à Liège, 1268–03–01. — 2 août. Archives de l’État à Liège, Abbaye du Val-Saint-Lambert à Seraing, 1268–08–02 (= 1268–08–02a). — 2 août. Archives de l’État à Liège, Abbaye du Val-Saint-Lambert à Seraing, 1268–08–02 (= 1268–08–02b). — du 26 février au 10 mars. Archives de l’État à Liège, Abbaye du Val-Benoît à Liège, 1268–03–10. — 23 février. Archives de l’État à Liège, Abbaye du Val-Benoît à Liège, 1269–02–23. — 10 mai. Archives de l’État à Liège, Cathédrale Saint-Lambert à Liège, 1270–05–10. — 16 avril. Archives de l’État à Liège, Cathédrale Saint-Lambert à Liège, 1270–04–16. — 24 mars. Archives de l’État à Liège, Abbaye du Val-Saint-Lambert à Seraing, 1270–03–24.
— 26 novembre. Archives de l’État à Liège, Abbaye du Val-Saint-Lambert à Seraing, 1270–11–26. — 29 septembre. Archives de l’État à Liège, Hôpital des Pauvres-en-Île à Liège, 1270–09–29. — 6 juin. Archives de l’État à Liège, Hôpital Saint-Christophe à Liège, 1270–06–06. — 7 avril. Archives de l’État à Liège, Cathédrale Saint-Lambert à Liège, 1270–04–07. — 16 août. Archives de l’État à Liège, Abbaye du Val-Saint-Lambert à Seraing, 1271–08–16. — 17 septembre. Archives de l’État à Liège, Cathédrale Saint-Lambert à Liège, 1271–09–17. — 20 avril. Archives de l’État à Liège, Abbaye du Val-Saint-Lambert à Seraing, 1271–04–20. — 22 décembre. Archives de l’État à Liège, Abbaye du Val-Saint-Lambert à Seraing, 1271–12–22. — 22 mai. Archives de l’État à Liège, Abbaye du Val-Saint-Lambert à Seraing, 1271–05–22. — 25 juillet. Archives de l’État à Liège, Abbaye du Val-Benoît à Liège, 1271–07–25. — 3 décembre. Archives de l’État à Liège, Cathédrale Saint-Lambert à Liège, 1271–12–03 (= 1271–12–03a). — 3 décembre. Archives de l’État à Liège, Cathédrale Saint-Lambert à Liège, 1271–12–03 (= 1271–12–03b). — 9 décembre. Archives de l’État à Liège, Abbaye du Val-Saint-Lambert à Seraing, 1271–12–09. — après le 3 décembre. Archives de l’État à Liège, Cathédrale Saint-Lambert à Liège, 1271–12–03. — 22 juin. Archives de l’État à Liège, Couvent de Robermont à Robermont, 1272–06–22. — 8 juillet. Archives de l’État à Liège, Collégiale Saint-Martin à Liège, 1272–07–08. — mars. Archives de l’État à Liège, Couvent des Dominicains de Liège, 1272–03. — 12 mai. Archives de l’État à Liège, Abbaye du Val-Benoît à Liège, 1273–05–12. — décembre. Archives de l’État à Liège, Couvent des Dominicains de Liège, 1273–12.
379
Document, 24 février. Archives de l’État à Liège, Couvent de Robermont à Robermont, 1274–02–24. — 30 juin. Archives de l’État à Liège, Abbaye du Val-Saint-Lambert à Seraing, 1274–06–30. — 31 mai. Archives de l’État à Liège, Abbaye du Val-Saint-Lambert à Seraing, 1274–05–31 (= 1274–05–31a). — 31 mai. Archives de l’État à Liège, Abbaye du Val-Saint-Lambert à Seraing, 1274–05–31 (= 1274–05–31b). — 10 janvier. Archives de l’État à Liège, Abbaye du Val-Benoît à Liège, 1275–01–10. — août. Archives de l’État à Liège, Abbaye du Val-Benoît à Liège, 1275–08. — 10 juin. Archives de l’État à Liège, Collégiale Saint-Denis à Liège, 1276–06–10 (= 1276–06–10a). — 10 juin. Archives de l’État à Liège, Collégiale Saint-Denis à Liège, 1276–06–10 (= 1276–06–10b). — 22 juillet. Archives de l’État à Liège, Abbaye du Val-Benoît à Liège, 1276–07–22. — 24 février. Archives de l’État à Liège, Abbaye du Val-Saint-Lambert à Seraing, 1276–02–24. — 1er juillet. Archives de l’État à Liège, Collégiale Saint-Martin à Liège, 1277–07–01. — 23 mars. Archives de l’État à Liège, Collégiale Saint-Martin à Liège, 1277–03–23. — 3 février. Archives de l’État à Liège, Cathédrale Saint-Lambert à Liège, 1277–02–03. — 4 mai. Archives de l’État à Liège, Collégiale Saint-Martin à Liège, 1277–05–04. — 17 octobre. Archives de l’État à Liège, Abbaye du Val-Benoît à Liège, 1278–10–17. — 1er août. Archives de l’État à Liège, Collégiale Saint-Denis à Liège, 1278–08–01. — 3 décembre. Archives de l’État à Liège, Abbaye du Val-Saint-Lambert à Seraing, 1278–12–03. — 6 avril. Archives de l’État à Liège, Collégiale Saint-Martin à Liège, 1278–04–06. — 20 juillet. Archives de l’État à Liège, Abbaye du Val-Benoît à Liège, 1280–07–20. — 4 mai. Archives de l’État à Liège, Abbaye du Val-Benoît à Liège, 1280–05–04.
380
— 6 juin. Archives de l’État à Liège, Hôpital des Pauvres-en-Île à Liège, 1281–06–06. — 2 février. Archives de l’État à Liège, Collégiale Saint-Martin à Liège, 1282–02–01. — 22 décembre. Archives de l’État à Liège, Couvent de Robermont à Robermont, 1282–12–22. — 3 mars. Archives de l’État à Liège, Collégiale Saint-Martin à Liège, 1282–03–03. — 13 février (ajout). Archives de l’État à Liège, Couvent des Dominicains de Liège, 1283–02–13 (= 1283–02–13a). — 13 février (ajout). Archives de l’État à Liège, Couvent des Dominicains de Liège, 1283–02–13 (= 1283–02–13b). — 21 février. Archives de l’État à Liège, Abbaye du Val-Benoît à Liège, 1283–02–21. — 26 décembre. Archives de l’État à Liège, Couvent de Robermont à Robermont, 1283–12–26. — 11 mai. Archives de l’État à Liège, Couvent de Robermont à Robermont, 1284–05–11. — 12 février. Archives de l’État à Liège, Abbaye du Val-Benoît à Liège, 1284–02–12. — 4 octobre. Archives de l’État à Liège, Abbaye du Val-Benoît à Liège, 1284–10–04. — 21 juillet. Archives de l’État à Liège, Hôpital des Pauvres-en-Île à Liège, 1285–07–21. — 4 juillet. Archives de l’État à Liège, Abbaye du Val-Benoît à Liège, 1285–07–04. — 15 mai. Archives de l’État à Liège, Couvent de Robermont à Robermont, 1286–05–15. — 23 mars. Archives de l’État à Liège, Abbaye du Val-Benoît à Liège, 1286–03–23. — 24 juin. Archives de l’État à Liège, Abbaye du Val-Saint-Lambert à Seraing, 1287–06–24. — 8 septembre. Archives de l’État à Liège, Abbaye du Val-Benoît à Liège, 1287–09–08. — octobre. Archives de l’État à Liège, Couvent des Dominicains de Liège, 1287–10. — février (seconde expédition). Archives de l’État à Liège, Couvent des Dominicains de Liège, 1288–02 (= 1288–02b).
— février. Archives de l’État à Liège, Couvent des Dominicains de Liège, 1288–02 (= 1288–02a). — 19 juillet. Archives de l’État à Liège, Couvent de Robermont à Robermont, 1289–07–19. — 1er décembre. Archives de l’État à Liège, Couvent des Dominicains de Liège, 1289–01–12.
— 5 avril. Archives de l’État à Couvent des Dominicains de 1289–04–05. — 5 mars. Archives de l’État à Couvent des Dominicains de 1289–03–05. — 24 août. Archives de l’État à Hôpital des Pauvres-en-Île à 1290–08–24.
Liège, Liège, Liège, Liège, Liège, Liège,
381
Index
Cet index des notions a été conçu pour permettre au lecteur de retrouver facilement les endroits où les notions sont définies ou ceux où elles sont particulièrement impliquées dans le raisonnement. Il ne s’agit donc pas d’un index exhaustif. Les entrées ont été pensées pour permettre une consultation intuitive de l’ouvrage et ne prétendent pas à la même systématicité que le plan du travail. Ainsi, nous n’avons reporté sous l’entrée marquage (ponctuation) que les principales sections traitant la ponctuation des structures que nous avons jugées les plus intéressantes. Reprendre toutes les structures traitées aurait fait double emploi avec la table des matières et aurait nuit à la clarté de l’index. Les ‹–› dans les sous-entrées reprennent la vedette du niveau supérieur. A4, 98–101, 116 abréviation, 36–37 – par graphisme, 36, 37 absorption des ponctogrammes, voir ponctogramme accord, 92, 123 actant, 90–96 – chez G. Lazard, 55, 87 régime 2, 92–93 régime 2 vs régime 3, 95–96, 116– 117 régime 3, 92–93, 107–108 rôle sémantique des –s, 91–92 sujet, 92–93, 106–107 – non exprimé, 84 action juridique, 6 adjectif, 74 adverbe, 74–75, 96, 127–130 relation entre –s, 129–130 AFC, voir analyse factorielle des correspondances ajustement de probabilité – de Bonferroni, 194 – de Šidàk, 193–194 alphagramme (chez J. Anis), 23, 41 ambiguïté, 55, 84 anachronisme, 19, 56, 149 anacoluthe, 81 analyse déductive, voir démarche déductive analyse factorielle des correspondances, 335–341, 344–350 cosinus carré, 337 facteur, 336–337 inertie, 336
plan factoriel, 337–338 point-ligne/point-colonne, 336 analyse synthétique, voir démarche synthétique apposition, 122–124 – d’adverbes, 129 hiérarchie des –s, 143–145 le terme – est peu précis, 172 arbitrarité, 21 argument, 86 – adverbial, 110–111 – nominal, 106–110 – propositionnel, 111–118 mode non personnel, 114–118 mode personnel, 111–114 construction des –s, 106–119 aspect, 72 attraction, 181 attribut – du «complément d’objet direct», 100–101 – du sujet, 94–95, 99–100 infinitif –, 115–116 autogramme, 30–31 autonomisme, 22–24, 40 autonymie, 148 auxiliaire vs auxilié, 104–106 axe, 32–33, 36 rupture d’–, 33–34 «blanc» graphique, 44–45 boîte à moustaches, 155 Bonferroni, voir ajustement de –
383
C5, voir circonstant exprimant le cadre du procès C6, voir circonstant exprimant l’organisation des énoncés caractère (métaconcept), 14, 20, 24 cas «– régime», 107 «– sujet», 106 indéclinable, 76 le – n’est pas une catégorie, 73–74 catégorie, 71 – nominale, 73 – verbale, 72 le cas n’est pas une –, voir cas, le – n’est pas une catégorie caténogramme, 33 cénégramme, 29 cénétope, 29–30 charte – comme un document formalisé, 81 définition diplomatique, 49 définition linguistique, 50 χ2 , voir test du chi-carré circonstance, 55 circonstant, 96–98, 108–109 – chez G. Lazard, 55, 88 classement sémantique des –s, 145– 146 exprimant l’organisation des énoncés, 98 exprimant le cadre du procès, 97–98 «remontée» du –, 212 circularité du raisonnement, 48, 71, 77 code – écrit, 20 indépendance par rapport au code oral, 23 cohésion du texte, 98 combinaison, 92, 124 – chez L. Hjelmslev, 61 schématisation d’une –, 93, 103 commutation, 26, 58–59, 93–96 comparaisons multiples, 193 complément d’«agent», 97, 101 complémentation, 103 portée des –s, 145–146 compréhension, 56, 57 compétence (le linguiste moderne n’a pas de – linguistique en afr.), 57 concept, 14 hiérarchisation des –s, 17 schématisation d’un –, 17 conjonction, voir relateur – n’est pas une «partie du discours», 74 constante (chez L. Hjelmslev), 60 constellation (chez L. Hjelmslev), 60
384
constituant – immédiat, 63, 90 environnement des –s, 230 limite des –s, 43, 79, 118, 187–188 contenu, 54, voir expression contexte immédiat, voir constituant, environnement des –s contrainte, voir marque, 65, 88 contribution – à l’inertie, voir analyse factorielle des correspondances – au chi-carré, 180–181 coordination, 141–143 – chez Cl. Hagège, 62 – des énoncés, 83–85 modèle revu de la –, 305 coorientation, 89, 92, 94, 116, 123, 129, 132, 144 coréférence, voir coorientation cosinus carré, voir analyse factorielle des correspondances définition – en extension, 40 – en intension, 14, 40 degrés de liberté (en statistiques), 179 démarche – déductive, 69, 76–77 identité de statut des unités de même niveau, 76 – sémasiologique, 3 – synthétique, 80 limites de la – analytique, 77 densité (courbe de –), 154–155 dépendance, 60–63, 129 – chez Tesnière, 61 schématisation d’une –, 103 détermination, voir noyau, 124–126 – chez Cl. Hagège, 62 – chez L. Hjelmslev, 60 portée des –s, 146–147 déverbal, 72 discontinuité, 147–148 discours, 50 – vs parole et langue, 51–52 dispersion des données, voir données distinctif (vs significatif), 25 distribution (en statistiques), 153–155 – bimodale, 219 – hypergéométrique, 181 – normale, 155 document, 49–50 donnée –s atypiques, 155 –s catégorielles, 153 –s discrètes, 153 dispersion des –s, 155
hétérogénéité des –s, 6, 152 le mot et le texte comme –s, 49–52 réduction des –s, voir réduction double articulation, 21, 25, 27, 29 écart à l’indépendance, 156 structure de l’–, 178, 180–181 écart-type, 155 échantillon, 152 écriture spatialité de l’–, 24, 30–34, 43 système de l’–, 19 effectif, 152 – insuffisant, 160, 162 empirisme, 19, 25, 79 définition empirique de la phrase, 79–81 énoncé, 53, 54, 77–86 – non phrastique, 81–82, 119–122 – comme reliquat de l’analyse, 81 – exprimant un procès, 119–121 – n’ exprimant pas un procès, 121–122 – non phrastiques assimilation des – à la phrase, 194 phrase-énoncé, 53, 72, 79–81 énonciateur (changement d’–), 83 énonciation, 54 erreur – a priori, 11, 162–163 – accidentelle, 11, 162–163 – de la première espèce (α), 157 – de la seconde espèce (β), 157 eschatocole (en diplomatique), 294 exception (les statistiques mettent en évidence les –s), 163 expression – vs. contenu, 64–65 plan de l’–, 26 extension, voir définition en – facteur, voir analyse factorielle des correspondances factitif – avec agent, 116–117 – sans agent, 115 falsifiabilité, 23, 163 figement, 109, 144 Fisher, voir test exact de – fonction, 66 forme, 27 – et substance, 26 formulaire, 254, 260, 274, 278, 280, 299, 329 genre (catégorie), 73
glossographisme, 22, 23 grammaticalité, 57 grammème, 27–29 combinaison de –s, 32–34 construction d’un –, 32–34 interdépendance entre les –s et les topèmes, 28 graphème – chez Cl. Tournier, 41 – chez J. Anis, 23, 41 – chez N. Catach, 22 graphiques (en statistiques), 153–155 graphisme, voir abréviation H0 , voir hypothèse nulle H1 , voir hypothèse alternative habitudes graphiques, 2 hétérogramme, 30–31 histogramme, 154 hyperonyme, 15 hyponyme, 15 hypothèse – alternative (H1 ), 156–157 – nulle (H0 ), 156–157 test d’–, 155–157 idiolecte, 26 inattendu, 162–163 incidente, voir proposition – indéclinable, voir cas indépendance des observations, 179–180 individu (en statistiques), 152–153 hiérarchie des –s, 174 regrouper ou éliminer les –s, 192 inertie, voir analyse factorielle des correspondances infinitif, voir proposition infinitive, 139– 140 verbes de perception et –, 117–118 ininterprétabilité, 59 intégration (niveau d’–), 77 intension, voir définition en – interdépendance (chez L. Hjelmslev), 60 intonation, 23, voir prosodie intonèmes (chez N. Catach), 41 intuition, 38, 48, 57, 70, 164 jugement d’acceptabilité, 57 Khartês (projet d’édition), 5 langue – vs parole et disours, 51–52 – écrite, 20–24 latin, 148–149 énoncés en – retiré du corpus, 168
385
lexème, 51–52, 70 lexique, 55 linéogramme, 33–41 linguistique générale, 149 littera notabilior, voir «majuscule» logogramme, 35 – chez J. Anis, 23, 41 – chez N. Catach, 22 «majuscule», 2, 30, 44 marquage (ponctuation) – vs non-marquage, 176 – d’A4, 261–282 – dans la phrase, 194–200 – dans la proposition non personnelle argumentale, 205–208 – dans la proposition non personnelle immédiate, 215–216 – dans la proposition personnelle argumentale, 201–204 – dans la proposition personnelle immédiate, 211–215 – dans les arguments non propositionnels, 208–211 – dans les constituants non propositionnels immédiats, 216 – de la coordination, 228, 300–308 – de la phrase, 197, 224–226, 232– 249 – de la proposition personnelle, 232–249 – des C6, 227–228, 317–332 – des actants, 226, 261–282 – des appositions, 227, 308–317 – des circonstants, 226–227, 282– 300 – des coordonnants, 227–228 – des déterminants, 227 – des déterminations, 308–317 – des relateurs, 227–228, 317–332 – du prédicat, 250–260 – selon la fonction syntaxique, 183 – selon la nature, 184 – selon la position, 185–186 – selon la présence d’un relateur, 185 – selon le niveau d’intégration, 182– 183 facultativité du –, 357 force du –, 357 forme du –, voir ponctogramme, forme des –s interdiction de –, 330–331 interférences entre le – et le reste du système graphique, 372 non-marquage du prédicat, 226 synthèse du –, 362–364
386
marque, voir contrainte, 65–67, 88 – intégrative, 62 –s à plusieurs niveaux, 68 hiérarchisation des –s, 65 superposition des –s, 65, 108 matière, 27 médiane, 155 modalité (en statistiques), 153 mode (catégorie), 72 – comme marque de subordination, 85 morphogramme (chez N. Catach), 22 morphologie – vs syntaxe, 59–67 stabilité de la description morphologique, 56–57 morphosyntaxe – vs sémantique, 87 confusion des plans morphosyntaxique et sémantique, 69 mot, 50–52 moyenne, 155 nébulogramme, 33, 41 néologie, voir terminologie nœud (chez L. Tesnière), 61 – des noeuds, 61 nom, 73–74 nombre (catégorie), 73 notes tironiennes, 35, voir abréviation notion floue, 48 noyau, 124, voir détermination – chez A. Martinet, 61 objet, 14 objet (dans le processus de conceptualisation), 20 occurrence, 51–52 organisation de l’espace, 28 orientation, 88–89 paramètre (en statistiques), 155 paraphrasabilité, 34–37 parataxe, 85, 133 parole – vs langue et discours, 51–52 – performative, 50 participant, 55, 87 parties du discours, 69–76 classement traditionnel des –, 75–76 concept flou, 69 définition morphologique des –, 71– 76 définition syntaxique des –, 70–71 définition traditionnelle des –, 69–70 perception (verbes de – et infinitif), voir infinitif
périgramme, 33 pertinence (inaccessible pour le lecteur moderne), 26 phonocentrisme, 22 phonogramme (chez N. Catach), 22 phonographisme, 22–23, 40 phrase, voir énoncé, 77–86 – vs proposition, 101 – définition empirique, 79–81 – «verbale» vs – «nominale», 79–80 phrase-énoncé, voir énoncé plérégramme, 29–31 – indécomposable, 32 autonomie des –s, 30–31 plérétope, 29–30 plurisystème, 22, 34–37 point de vue (théorie des trois –s), 53–55 dialectique entre les –, 55 point-ligne/point-colonne, voir analyse factorielle des correspondances ponctème, 41 ponctogramme, 35, 42 absorption des –s, 175 forme des –s, 161, 333–358 formes rares, 352–358 ponctuation – au sens étendu/restreint, 43 – comme marquage, voir marquage fonction démarcative de la –, 43 population (en statistiques), 152 pragmatique, 56 prédication (chez Cl. Hagège), 62 préposition, voir relateur – n’est pas une «partie du discours», 74 procès, 55, 72, 87 pronom, 74 forme du – de la troisième personne, 91–96 proposition, 86, 101 – avec prédicat non personnel, 135– 137 – avec prédicat personnel, 131–135 – «complétive» en relation avec un adverbe non relateur, 135 en relation avec un nom, 134 – incidente, 85, 113–114 – infinitive, 101, 114–118, 137 – participiale, 101, 136–137 – personnelle, 101 – «relative» en relation avec un adverbe non relateur, 134–135 en relation avec un nom, 131– 134
– «relative» ou «complétive» en relation avec un adverbe relateur, 135 propriété (métaconcept), 14 prosodie, 78–79 proto-science, 13, 23 protocole (en diplomatique), 81 prédicat, 79, 86, 87 – «principal», 111 construction du –, 104–106 R2, voir actant régime 2 R3, voir actant régime 3 rapport de chances, 180 reconstruction, 56 récursivité (des structures syntaxiques), 160, 174–176, 179–180, 221, 230 réduction – des données, 8, 159–160 – sémiotique, 26 regard (cognition), 14, 20 régissant (chez L. Tesnière), 61 relateur, 107–108 – comme délimiteur, 108 – complexe, 130 – de proposition, 111–114 relation entre le – et le reste du syntagme, 127–128 relation, 66 – minimale, 62–63, 65, 89 – médiate, 95, 139 schématisation d’une –, 104 schématisation d’une –, 101–104 représentation (cognition), 20, 24, 26, 27, 87 représentations linguistiques, 5 répulsion, 181 référent, 144 S1, voir actant sujet satellite (chez A. Martinet), 62 schématisation – d’une dépendance, 93 – d’une combinaison, 103 – d’une dépendance, 103 – d’une relation, 103 – d’une relation médiate, 104 scriptème, 27 nombre de –s, 35 seing notarial (en diplomatique), 81 sélection, 125 – chez L. Hjelmslev, 61 portée des –s, 145–147 sémasiologie, voir démarche sémasiologique «semi-auxiliaire», 115
387
sens, 28 Šidàk, voir ajustement de – significatif – vs distinctif, 25 – en statistiques, 156 simplicité de la description, 59, 139 – en statistiques, 160 solidarité (chez L. Hjelmslev), 61 spécification, 65 – analytique segmentale du nom, 107–109 – analytique séquentielle du nom, 109–110 – de la détermination, 126–127 – en discours, 111 – en langue, 111, 129 – segmentale, 66 – synthétique du nom, 106–107 sous-spécification, 107, 112, 118, 149 statistiques (les – résument les données), 153 structure argumentale, 86–104 structure syntaxique, 49 subordonné (chez L. Tesnière), 61 subordonnée, voir proposition «complétive» substance, 24, 27 – graphique vs – phonique, 22 syntaxe – argumentale, 68 – de mot, 68 – immédiate, 68 faits de – argumentale mêlés à des faits de – immédiate, 172 morphologie vs –, voir morphologie niveaux d’analyse syntaxique, 67– 68 parallélisme entre – argumentale et – immédiate, 137–141 tableau de contingence, 177, 334–335 télescopage (dans le flux graphique), 27 temps (catégorie), 72 temps «composés», 104–106 terminologie, 149 choix terminologiques, 19 néologie, 15 recadrage terminologique, 13 récupération de terme, 15, 49 système terminologique, 15 tradition, 48 test – de Shapiro-Wilks, 155 – de Wilcoxon, 219 – du chi-carré, 177–180 – exact de Fisher, 181
388
texte, 49–50, 54 textes non littéraires, 5 texture (en linguistique textuelle), 50, 82 θ, voir rapport de chances thématisation, 140–141 théorie des trois points de vue, 3, voir point de vue titre (sire, dame), 144 topème, voir grammème, 27–30 topogramme (chez J. Anis), 23, 41 tradition (description –nelle), 48 traduction, 56 transcodage, 40 transcription, 25–27, 358 translatif, 70 translation, 70, 109 tri – croisé, voir test exact de Fisher, test du chi-carré et rapport de chances, 177–181 limites des –s par variable, 189– 190 – à plat, 170–171 triple organisation de l’énoncé, voir point de vue, théorie des trois points de vue type discursif, 8 unité – de lecture (chez Chr. MarchelloNizia), 2 – discrète, 28 – non discrète, 28 – ponctuable (chez A. Lavrentiev), 4 – significative, 28 valeur (d’une variable, en statistiques), 152 variable – chez L. Hjelmslev, 60 – en statistiques, 152–153 – morphosyntaxique, 168–169 – ponctuationnelle, 169 – positionnelle, 169 variance, 155 variation libre, 55 verbe, 72–73 – chez G. Lazard, 55 – comme prédicat, 87 – conjugué à un mode personnel comme centre de la phrase, 79 – principal, voir prédicat principal forme «nominale» du –, 72 Wilcoxon, voir test de –