homophones_lexique.sh (235B)
1 cut -f 1-4,7 lexique | tr ' ' '_' | awk '$1 == $3' | sort | uniq | awk 'cnt[$2 $4]++{if (cnt[$2 $4]==2) print prev[$2 $4]; print} {prev[$2 $4]=$0}' | sort -k2,2 | cut -f1 | sort | uniq | tr '_' ' ' | wc -l > ~/git/homophones_lexique