html2text

html2text

html2text est un utilitaire de ligne de commande, écrit en C ++, qui convertit les documents HTML en texte brut.
html2text est un utilitaire de ligne de commande, écrit en C ++, qui convertit les documents HTML en texte brut.Chaque document HTML est chargé à partir d'un emplacement indiqué par un URI ou lu à partir d'une entrée standard, et formaté en un flux de caractères en texte brut qui est écrit sur la sortie standard ou dans un fichier de sortie.L'URI d'entrée peut spécifier un site distant, à partir duquel les documents sont chargés via le protocole de transfert hypertexte (HTTP).Le programme est capable de conserver les positions d'origine des champs de table, vous permet de définir la largeur de l'écran (à un nombre donné de caractères de sortie), et accepte également une entrée syntaxiquement incorrecte (en essayant de l'interpréter "raisonnablement").Le texte en gras et souligné est rendu par défaut avec des séquences de retour arrière (ce qui est particulièrement utile lorsque vous canalisez la sortie du programme dans "moins" ou un autre téléavertisseur).Toutes les propriétés de rendu peuvent être largement personnalisées via un fichier RC.

Les catégories

Alternatives à html2text pour Windows avec licence commerciale