Noms et verbes français qui n'existent qu'avec des préfixes
This post is about French, so I only write it in French.
Un problème amusant (merci, Valentine !) : quels sont les verbes et noms français qui existent avec différents préfixes, mais n'existent pas sans le préfixe ?
Par exemple, on peut déférer, référer, préférer, conférer, inférer, proférer, et même transférer, mais on ne peut jamais férer. On peut déduire, réduire, enduire, conduire, induire, et produire, mais pas duire. On peut révoquer, évoquer, convoquer, invoquer, et provoquer, mais pas voquer. Si on sait ce qu'est une déjection, une injection, une surjection, une projection, une bijection, et une interjection, qu'est-ce qu'une jection ? Une révolution, une dévolution, une involution, une convolution ; mais une volution ?
Ce billet cherche à trouver de façon automatique d'autres exemples de ce phénomène. Si seuls les résultats finaux vous intéressent, voici les 100 premières formes nominales et verbales trouvées, assorties des formes préfixées qui existent réellement. Bien sûr, il y a des choses inintéressantes et incorrectes dedans, parce que c'est généré automatiquement.
Voici les verbes :
férer: déférer référer préférer conférer inférer proférer transférer
duire: déduire réduire enduire conduire induire produire
crire: décrire récrire écrire transcrire redécrire
voquer: révoquer évoquer convoquer invoquer provoquer
noncer: dénoncer renoncer énoncer prononcer
sister: désister résister consister insister
ouler: rouler couler bouler fouler remouler
ter: enter conter coter rater acter
puter: députer réputer computer disputer
spirer: respirer aspirer conspirer inspirer
osser: désosser rosser cosser bosser
stituer: restituer constituer instituer prostituer
clure: reclure conclure inclure exclure
cevoir: décevoir recevoir concevoir
gresser: régresser agresser progresser transgresser
treindre: retreindre rétreindre étreindre
iser: riser coniser biser remiser
gurgiter: dégurgiter régurgiter ingurgiter
charner: décharner écharner acharner
purer: dépurer épurer apurer
vier: dévier envier convier
voyer: dévoyer envoyer convoyer
baucher: débaucher ébaucher embaucher
iller: ailler ciller piller railler
arder: darder carder barder farder
tamer: rétamer entamer étamer
soler: désoler consoler insoler
iler: piler biler filer exiler
valer: dévaler avaler ravaler
onder: inonder bonder fonder exonder
iger: piger figer transiger exiger
gir: régir surgir agir
mailloter: démailloter emmailloter remmailloter
mancher: démancher emmancher remmancher
boîter: déboîter emboîter remboîter
poter: dépoter empoter rempoter
barquer: débarquer embarquer rembarquer
paqueter: dépaqueter empaqueter rempaqueter
créter: décréter concréter excréter
ssortir: ressortir assortir rassortir
ssembler: ressembler assembler rassembler
sumer: résumer présumer consumer
server: réserver préserver conserver
specter: respecter inspecter prospecter
irer: désirer airer cirer
sulter: résulter consulter insulter
membrer: démembrer remembrer
oter: roter doter coter
amer: ramer damer camer
tribuer: rétribuer contribuer distribuer
ocher: rocher cocher pocher
outer: router douter bouter
aguer: raguer daguer baguer
aliser: réaliser coaliser baliser
criminer: récriminer incriminer discriminer
ire: rire dire raire
incer: rincer pincer coincer
aser: raser caser baser
pliquer: répliquer compliquer expliquer
ister: désister pister exister
ayer: rayer payer bayer
endre: rendre pendre fendre
uer: ruer puer remuer
coler: récoler racoler accoler
cuser: récuser excuser accuser
ifier: déifier réifier
vertir: avertir convertir invertir
piner: épiner copiner rapiner
pier: épier copier expier
iner: suriner biner rainer
volvériser: revolvériser révolvériser
champir: rechampir réchampir
fréner: refréner réfréner
véler: revéler révéler
oucher: doucher coucher boucher
ciser: préciser inciser exciser
courager: décourager encourager
caisser: décaisser encaisser
visager: dévisager envisager
tourer: détourer entourer
dommager: dédommager endommager
grosser: dégrosser engrosser
crasser: décrasser encrasser
clencher: déclencher enclencher
velopper: développer envelopper
fourner: défourner enfourner
verguer: déverguer enverguer
tartrer: détartrer entartrer
gourdir: dégourdir engourdir
gluer: dégluer engluer
asser: casser passer coasser
cimer: décimer écimer
pouiller: dépouiller épouiller
valuer: dévaluer évaluer
ller: aller coller raller
anner: canner panner banner
aver: caver paver baver
aner: caner paner faner
eindre: ceindre peindre feindre
uver: cuver couver prouver
Et les noms :
duction: déduction réduction induction enduction conduction production diduction transduction
quet: coquet caquet biquet baquet paquet triquet parquet taquet piquet
jection: déjection rejection injection surjection projection bijection interjection
férence: déférence référence inférence conférence préférence interférence
ception: déception réception conception interception exception perception
chet: déchet cochet cachet parchet archet pichet
tention: détention rétention intention contention prétention
fection: défection réfection infection confection perfection
cision: décision incision concision précision excision
putation: députation réputation imputation computation disputation
céphale: encéphale bicéphale polycéphale tricéphale microcéphale hydrocéphale
quette: coquette raquette biquette maquette disquette piquette
quetage: coquetage caquetage baquetage paquetage parquetage piquetage
ille: caille baille paille maille taille arille
ssement: cassement passement massement trissement tassement pissement
ducteur: réducteur inducteur conducteur producteur transducteur
sseur: casseur masseur passeur tasseur pisseur chasseur
ssage: cassage massage passage tassage pissage chassage
posant: déposant proposant composant disposant exposant
gression: régression ingression progression digression transgression
venance: survenance convenance prévenance provenance contrevenance
cepteur: récepteur concepteur précepteur intercepteur percepteur
volution: dévolution révolution involution convolution
tage: cotage contage ratage matage partage
lation: délation relation dilation translation
clamation: déclamation réclamation proclamation exclamation
scrit: rescrit inscrit conscrit proscrit
stitution: restitution institution constitution prostitution
scription: rescription inscription conscription proscription
chage: cochage cachage trichage tachage perchage
sque: casque bisque disque basque masque
logue: prologue autologue radiologue trilogue hydrologue
nche: canche ranche banche manche tanche
illage: caillage maillage paillage entreillage taillage
métrie: télémétrie radiométrie micrométrie photométrie hydrométrie
spiration: respiration inspiration conspiration perspiration
quage: caquage parquage taquage arquage piquage
clusion: réclusion inclusion conclusion exclusion
sistance: résistance insistance consistance persistance
potement: dépotement empotement tripotement tapotement
portation: déportation importation exportation transportation
ction: rection coction diction paction
posante: déposante composante disposante exposante
vention: invention convention prévention intervention
hibition: inhibition cohibition prohibition exhibition
clinaison: déclinaison reclinaison inclinaison
plication: réplication implication complication explication
collement: décollement recollement encollement
tine: rétine ratine patine matine
gurgitation: dégurgitation régurgitation ingurgitation
noncement: dénoncement renoncement prononcement
nonciation: dénonciation renonciation prononciation
ture: enture rature biture triture
posé: imposé préposé composé exposé
niement: déniement reniement maniement
calement: décalement recalement intercalement
sane: insane basane persane pisane
posement: déposement reposement entreposement
solation: désolation insolation consolation
bordement: débordement rebordement transbordement
rdon: cordon cardon pardon chardon
bine: cabine bibine combine babine
vage: cavage ravage bavage pavage
llage: collage billage tallage pillage
sultante: resultante résultante consultante
ngue: cangue dingue mangue tangue
illeuse: railleuse bailleuse pailleuse tailleuse
illeur: railleur bailleur pailleur tailleur
spirateur: respirateur inspirateur conspirateur
tiste: protiste batiste artiste altiste
crément: décrément incrément excrément
testation: détestation contestation protestation
èdre: polyèdre trièdre parèdre exèdre
ssette: cassette massette tassette pissette
pier: papier polypier tripier pipier
lèvement: relèvement enlèvement prélèvement
lier: calier palier perlier pilier
logie: trilogie radiologie électrologie hydrologie
sseuse: casseuse masseuse pisseuse chasseuse
nière: panière manière tanière pinière
lage: calage parlage perlage pilage
vasement: dévasement envasement transvasement
primé: déprimé imprimé comprimé
pette: tripette tapette arpette pipette
pilation: dépilation empilation compilation
cernement: décernement concernement discernement
pense: dépense impense dispense
ploration: déploration imploration exploration
hérence: inhérence déshérence cohérence
valement: dévalement cavalement ravalement
quillage: requillage coquillage maquillage
crimination: récrimination incrimination discrimination
quin: requin coquin taquin
servation: réservation conservation préservation
quisition: réquisition inquisition perquisition
formé: réformé informé transformé
sonance: résonance consonance dissonance
tribution: rétribution contribution distribution
sonnance: résonnance consonnance dissonnance
paration: réparation préparation disparation
Des détails, pour ceux que ça amuse. La liste de mots utilisée est Lefff, d'où je ne garde, soit que les verbes à l'infinitif, soit que les noms communs au singulier. Il y a 7817 infinitifs et 41680 noms.
La première question qu'il faut élucider, c'est de déterminer ce qu'est un préfixe. Pour cela, j'utilise la méthode suivante : pour chaque mot de la liste, pour chaque façon de le couper en un préfixe et un radical (c'est-à-dire toutes les longueurs possibles de préfixe) qui soit non-triviale (c'est-à-dire que radical et préfixe ne sont pas vides), si le radical est également un mot de la liste, alors cela compte comme une preuve que le préfixe considéré est effectivement un préfixe. Je trie les préfixes par nombre décroissant d'occurrences en ce sens, et je garde les meilleurs avec leur score.
Le code est ici. Pour les verbes, je garde les 30 meilleurs ; pour les noms, les 60 meilleurs, mais j'exclus ensuite ceux qui font une seule lettre, car il y a trop de bruit sinon. Voici les préfixes obtenus et leur nombre d'occurrences, pour les verbes :
dé 542
re 387
ré 166
dés 139
r 120
en 97
sur 97
é 87
auto 60
pré 58
a 49
d 44
em 43
con 39
c 37
p 32
in 30
co 28
com 26
b 23
f 22
pro 21
dis 20
ra 20
entre 20
trans 19
ex 19
redé 19
ac 18
rem 18
Et pour les noms :
dé 651
re 394
ré 223
in 195
dés 166
sur 150
en 147
co 105
con 91
im 90
pré 88
pro 81
em 81
télé 77
sous- 63
contre- 61
ca 59
anti 56
ra 55
auto 53
bi 52
com 52
di 50
ba 49
ma 48
pa 48
poly 47
radio 46
demi- 46
inter 46
tri 46
dis 44
contre 43
par 42
entre 41
électro 40
micro 40
ex 39
ta 38
ar 37
photo 36
hydro 35
trans 34
per 34
pi 32
cha 31
al 31
Ensuite, étant donnée cette liste pondérée de préfixes, je regarde chaque mot du dictionnaire et chaque préfixe. Si on peut retirer ce préfixe au mot, et que le résultat n'existe pas, alors c'est une forme manquante : son poids est la somme du poids de tous les préfixes tels quel la forme avec préfixe existe, mais que j'élève à un exposant (0.2, arbitrairement choisi) pour donner un meilleur score aux situations où de nombreux préfixes sont possibles.
Le code est ici.
Pour les noms, j'élimine les propositions de longueur 3 ou moins. L'espacement
final est réalisé avec column -t
. Le fichier principal qui fait tout est
duire.sh ; vous pouvez l'utiliser
pour calculer davantage de formes que celles que j'inclus ici. Certains des
fichiers intermédiaires sont également inclus dans le dépôt, par commodité.
Comme améliorations supplémentaires possibles, on pourrait appliquer des filtres plus sérieux pour identifier les propositions intéressantes : exiger notamment que le début du mot, par exemple les trois premières lettres, existe déjà dans un mot français ; peut-être filtrer les formes attestées avec préfixe pour vérifier que la prononciation correspond bien. On pourrait aussi imaginer de faire le même travail en tenant compte de la fréquence des mots : pour l'identification des préfixes et des formes manquantes, le vote de tous les mots se valent, mais ce n'est pas réaliste vu que certains mots sont beaucoup plus fréquents que d'autres ; et une forme sans préfixe qui existe mais est beaucoup plus rare que les formes avec préfixe qui existent, cela pourrait aussi être une réponse intéressante.
On peut s'interroger sur la raison pour laquelle certains de ces mots sont manquants. Je reprends ici un commentaire qui m'a été adressé par Maxime (merci à lui) pour décrire certaines situations possibles :
-
Pour certains mots, la racine fut un jour un mot à part entière et elle a cessé de l'être, j'imagine par affaiblissement de sens. Ainsi de "duire" (du latin "ducere", qu'on doit souvent traduire par "conduire"), de "férer" ("ferre", "porter") ou de "voquer" ("vocare", "appeler").
-
Pour d'autres, la racine est toujours un mot à part entière mais elle a subi des modifications et n'est plus perçue comme tel (par les locuteurs ou par l'algorithme). Ainsi "écrire" ne se décompose pas en "é+crire" mais est bien une racine en soi : le "s" initial de "scribere" a pu devenir (ou fusionner avec) une voyelle en début de mot ou derrière une voyelle ("écrire", "décrire") ou survivre après une consonne ("transcrire"). Plus fourbe, "régir" est un mot en soi ; avec le préfixe "sub-", il a donné "surgir" (la transformation "sub+rego" -> "surrego" -> "surgo" avait déjà eu lieu en latin). Quant à "agir", il semble venir d'une autre racine.
-
Parfois, la racine existe encore, mais pas dans la même catégorie grammaticale. Ainsi les verbes "dévaler", "avaler", "ravaler", sur le substantif "val", ou "contribuer", "rétribuer", sur "tribu" (mais ceux-ci entrent aussi dans la première catégorie de cette liste : le verbe "tribuere" existait en latin).
-
Évidemment, il y a dans la liste de simples ressemblances orthographiques ("damer", "ramer"), parfois liées à la suffixation ("passage", "massage", "tassage"), parfois à des résultats identiques partant de racines distinctes ("ratine", "rétine" vs "matine").