Morris Salkoff

Morris Salkoff, né le 10 avril 1928 à New-York et mort à Paris le 27 août 2017, est un linguiste américain qui a accompli la majeure partie de ses recherches en linguistique au CNRS en France. 

Morris Salkoff

Biographie

Naissance : 10 avril 1928 à New-York (USA)

Décès : 27 août 2017 à Paris (France)

Nationalité : américain

Formation :  Master of Science in Physics, New York University, 1951.

Doctor of Philosophy in Physics,  New York University, 1958.

Doctorat d'Etat en Linguistique, Université Paris 7, 1975.

Activités : Linguiste, Directeur de recherches CNRS.

Biographie et Apports

Après des études et recherches publiées dans les années 1958-1960 en collaboration avec E. Bauer dans le domaine de la physique et avoir travaillé pour IBM, Morris Salkoff va s’orienter vers la linguistique informatique. Disciple de Zellig Harris en même temps que Naomi Sager, il collabore comme chercheur de l’université de New-York,( NYU), de 1963 à 1967 avec celle-ci lorsqu’elle arrive dans cette université, ainsi qu’avec James Morris, à l’élaboration d’un programme d’analyse syntaxique basé sur le traitement du langage naturel : le Linguistic String Project que NYU lance en 1965, sous la direction de Naomi Sager, qui vise à développer des méthodes informatiques pour accéder à l’information dans les textes techniques et scientifiques, l’équipe s’inspirant de la méthodologie de l’analyse du discours de Zellig Harris pour développer un système d’analyse automatique du langage naturel appliqué à l’anglais (i.e. l’Analyse en Chaîne de l’anglais). Il cosigne avec Naomi Sager pendant cette période plusieurs rapports et communications sur le Projet de 1966 à 1969.

Parallèlement, depuis 1960, sa carrière se poursuit en France comme chargé de recherche au CNRS à Paris, d’abord à l’Institut Blaise Pascal sous la direction de René de Possel qui s’entoure de chercheurs étrangers de diverses disciplines ; puis, lors de la réorganisation de cet Institut, Maurice Gross l’invite à prendre part comme chercheur à l’équipe du LADL (Laboratoire d’Automatique Documentaire et Linguistique) que celui-ci vient de constituer à partir de la Section d’Automatique  Documentaire que lui a léguée Jean-Claude Gardin, en 1968.

Il y poursuit à partir de là ses travaux dans la lignée de l’analyse en chaîne harrissienne par des recherches sur le français qu’il mène en s’entourant de jeunes collaborateurs français linguistes : Anne Zribi-Hertz, Jean-Marie Marandin et André Valli dans les débuts, puis avec un jeune docteur ingénieur en informatique linguistique Pascal Pellegrini encore en 1994 : les deux derniers de la liste ayant obtenu leur doctorat sous sa direction. Il obtient lui-même en 1975 son Doctorat d’Etat ès Lettres en Linguistique à Paris à partir de ces recherches sur l’analyse en chaîne du français qui ont donné lieu à deux ouvrages (1973 : Une grammaire en chaînes du français. Analyse distributionnelle, dans la série des Monographies de linguistique mathématique de Dunod, puis 1979 Analyse syntaxique du Français. Grammaire en chaîne, dans la série des Linguisticae Investigationes Supplementa de Benjamins), le dernier prolongeant l’esquisse distributionnelle présentée dans le premier, en présentant quelques aspects additionnels de la grammaire et du programme associé, nécessaire pour analyser un texte scientifique.

A partir des années 1980, il s’oriente vers l’étude des relations syntaxe sémantique des verbes et des noms, et les problèmes que posent la traduction des verbes (supports, et prédicatifs) entre le français et l’anglais ; diverses publications et communications illustrent ces préoccupations. Jusqu’à la parution de son troisième ouvrage spécifiquement consacré à cet objet, une grammaire contrastive de l’anglais et du français : A French English Grammar (1990) : où la comparaison des structures du français et de leurs équivalents de l’anglais est formulée en termes de règles qui associent un schéma du français (pour une structure grammaticale particulière) avec sa traduction dans un schéma équivalent de l’anglais. 

A peu près contemporainement, à partir de 1989, il commence une activité de consultant auprès de la société Cora, où il est plus précisément chargé de la mise au point de la version du logiciel Darwin pour l’anglais qu’a mis au point cette société d’abord pour le français. La mise au point pour l’anglais de ce logiciel de recherche documentaire qui fonctionnait à partir d'une indexation en langage naturel fondée sur la linguistique a pris quelques années. Dans les débuts de la société Sinequa (qui a pris la suite de la société Cora) il continue sa collaboration comme consultant pour l’anglais jusque vers 2008 tout en poursuivant ses propres projets de recherche.

Vers la fin de l’année 2007, il termine son dernier livre Loquatur! Being A Program For Low Quality Automatic Translation Of Unrestricted Range. Dans ce dernier ouvrage, il adopte une approche de traduction automatique basée sur des règles écrites dans la forme d’une grammaire en chaînes telle que décrite par Harris (1962). Le système RBMT (i.e. Rule-Based Machine Translation)  développé par Salkoff repose sur deux modules : une grammaire en chaînes du français qui contient une liste des structures de la langue française, et un module de traduction qui contient la liste des mêmes schémas pour l’anglais. Il traite ainsi notamment des constructions à verbe support et des expressions idiomatiques plus ou moins figées.

Enfin, peu avant 2011, il construit avec André Valli  un lexique décrivant la complémentation verbale du français, outil commode pour les linguistes et en particulier dans le traitement automatique des langues. Ce lexique énumère et classe les constructions spécifiques de 975 entrées des verbes d’emploi le plus fréquent. Ce lexique, converti en une base de données au format html appelée Lexvalf (pour ‘Lexique des valences, verbales, du français’) exploite de façon manuelle les données des tables du Lexique Grammaire de Maurice Gross, (1975), ainsi que les travaux de Boons J.-P., Guillet A., et Leclère Ch. (1976, 1992)  sur les verbes du français. Toujours hébergée depuis octobre 2011 au laboratoire CNRS LIF de l’université d’Aix-Marseille Luminy cette base de données a été réalisée avec le concours de Paul Sabatier et de Laure Brieussel.

Œuvres

(Une sélection de quelques articles et conférences parmi les plus importants qui complètent la liste d’ouvrages présentée ci-dessus)

• Sager, Naomi, Salkoff, Morris., Morris, James. and Raze (Friedman), C. (1966). Report on the String Analysis Programs, Introductory Volume. String Program Reports (SPR) No. 1. Linguistic String Project, New York University & University of Pennsylvania.

• Salkoff, Morris., and Sager, Naomi. (1967). The Elimination of Grammatical Restrictions in a String Grammar of English. 2ème Conference Internationale sur le Traitement Automatique des Langues, Grenoble, August 1967. Theoretical paper: relation of string analysis to context-free grammar.

• 1973 Morris Salkoff: On using Semantic Data in Automatic Syntactic Analysis. COLING 1973: 397-428

• 1980 Morris Salkoff: A Context-Free Grammar Of French. COLING 1980: 38-45 Tokyo, Japan — September 30 - October 04, 1980

• 1988 Morris Salkoff Analysis by Fusion Lingvisticæ Investigationes , Vol. 12:1 (1988) ► pp. 49–84

• 1990 Morris Salkoff: Automatic translation of support verb constructions. COLING 1990: 243-246

• 2002 Morris Salkoff Some. new. results. on Transfer. Grammar in The legacy of Zellig Harris: Language and information into the 21st century, vol. 1: 167-178 [Current Issues in Linguistic Theory 228]  Bruce E. Nevin, ‎Stephen M. Johnson eds- ‎Language Arts & Disciplines. Amsterdam-New York : Benjamins ed.

Notes et références

• Mounier-Kuhn, Pierre E. 1989. The Institut Blaise-Pascal (1946-1969) from Couffignal's Machine to Artificial Intelligence, Bibliometrics Data Bibliometrics. .Annals Hist. Comput. (1989) 11 : 257-261. American Federation Of Information Processing Societies.

• Pellegrini, Pascal, 1995, "La grammaire en chaîne revisitée ou le système de l'araignée", Linguisticae Investigationes XIX:1, Amsterdam/Philadelphia, John Benjamins, pp.123-136.

• Léon, Jacqueline.  2002. Le CNRS et les débuts de la traduction automatique en France. Les années 60 : l’Espace, l’Océan, la Parole In  La revue pour l’histoire du CNRS.CNRS éd.

• Monti, Johanna, 2012 .Multi Word Unit processing in Machine Translation. Thèse. Università di Salerno (Italy).

• LexValf   lexvalf.lif.univ-mrs.fr/LEXVALF.html