Documents HTML
La plupart des pages Web sont des documents HTML. HTML signifie Langage de balisage hypertexte. C’était le premier standard de balisage traditionnel qui codait des éléments comme <title>Document Import Settings</title>.
memoQ peut importer n’importe quel document HTML, y compris ceux qui contiennent des scripts, et toutes les versions HTML connues au moment de l’écriture. memoQ prend même en charge le format HTML 5.
memoQ fonctionne aussi avec PHP. Utilisez ce filtre HTML pour traduire des scripts PHP ou des pages avec des scripts PHP.
Comment se rendre ici
- Commencer l’importation d’un document HTML.
- Dans la fenêtre Options d’importation de documents, sélectionnez les documents HTML, puis cliquez sur Modifier le filtre et la configuration.
- La fenêtre Paramètres d’importation de document apparaît. Dans la liste déroulante Filtre, choisissez filtre HTML.
Que pouvez-vous faire?

Sous Sélectionner le type d’importation, cliquez sur Importer les balises en tant que balises internes.
Il existe divers paramètres qui contrôlent comment certaines parties du document HTML sont importées.
- Ignorer le contenu des listes déroulantes: Vérifiez ceci pour omettre le contenu des listes déroulantes dans le code HTML. Normalement, memoQ importe ceux-ci. Vous devez généralement les traduire. Mais parfois il y a du code de programme qui attend une valeur de liste déroulante - qui est perdue lors de la traduction.
- Importer les espaces insécables en tant qu’entités: Normalement, memoQ importe les espaces insécables en tant que balises internes. Si vous voulez les voir comme des caractères normaux, décochez cette case. Mais si vous les importez en tant que caractères normaux, ils seront également exportés en tant que caractères, et non en tant qu’entités. (L’espace insécable est en HTML.)
- Appliquer des balises vides <img/> et <br/> : Normalement, memoQ reconnaît les balises anciennes <img> et <br> comme des balises vides. HTML moderne les écrit comme <img/> et <br/>. Ne décochez pas cette case.
- Traiter les balises <br/> en tant que balises internes: Normalement, memoQ importe <br/> balises en tant que balises internes. Ils ne commencent pas un nouveau segment. Si vous voulez que memoQ commence un nouveau segment lorsqu’il y a un <br/>, décochez cette case.
- Importer les clés d’accès: Normalement, memoQ importe des clés d’accès pour la traduction. Les touches d’accès sont des raccourcis clavier dans les formulaires qui aident le lecteur à passer à un champ ou à un bouton dans le formulaire. Si vous ne voulez pas traduire cela, décochez cette case.
- Importer les entités HTML en tant que caractères: Normalement, memoQ importe les entités de caractères HTML comme des caractères normaux. Cela rend le texte plus facile à lire. Pour importer ces entités en tant que balises internes (pour une plus grande précision), décochez cette case.
- Toujours utiliser les entités HTML à l’exportation: Normalement, memoQ exporte chaque caractère en tant que caractère. Sauf pour les caractères qui ont été importés d’entités, ou ceux qui manquent dans l’encodage cible: Elles sont également exportées en tant qu’entités. Si vous cochez cette case, memoQ exporte chaque caractère qui a une entité HTML - en tant qu’entité.
- Saut de ligne à chaque nouveaux caractères: Parfois, les gens utilisent des sauts de ligne supplémentaires pour rendre les fichiers HTML plus faciles à lire. Pour importer ces sauts de ligne dans des segments séparés et les conserver dans le document traduit, laissez la case à cocher cochée. Pour omettre ces sauts de ligne (à la fois de memoQ et du document traduit), décochez cette case.
- Importer les instructions de traitement en tant que balises internes: Normalement, memoQ importe les instructions de traitement qui commencent par '<$' comme balises {1} non interprétées. Les importer en tant que balises internes: Cochez cette case. Ensuite, memoQ les importe en tant que balises internes de type mq:pi (traitement-instruction).

Normalement, un document HTML spécifie l’encodage dans lequel il se trouve. Cela s’appelle aussi une page de code.
La plupart du temps, un document HTML est encodé en Unicode (l’une des formes de Unicode), et vous n’avez pas besoin de modifier les paramètres ici.
Cependant, si memoQ ne peut pas reconnaître la page de code d’un document HTML, le texte importé sera illisible.
Dans ce cas, vous devez choisir l’encodage pour le document source: Choisissez-le dans la page de code Importer si non spécifié dans le menu déroulant.
Si l’encodage est dans le fichier, mais qu’il est incorrect, et que vous n’obtenez pas de texte lisible: Choisissez l’encodage dans la page de code Importer si non spécifiée, et cochez la case Utiliser cette page de code même s’il y a une déclaration différente dans le fichier.
Si l’encodage source n’est pas Unicode, et que la langue cible utilise un script différent: Choisissez l’encodage pour le document traduit dans le menu déroulant Exporter la page de code.

Si certaines parties du document n’ont pas besoin de traduction, elles peuvent être omises de l’entrée.
Vous pouvez lister les éléments au bas de la fenêtre Paramètres d’importation de document.
Pour lister les éléments exclus, cliquez sur Modifier la liste des balises exclues. La fenêtre Modifier les balises exclues apparaît.
Pour ajouter un élément à la liste: Dans la zone de texte en bas, tapez le nom de sa balise ouvrante. Par exemple, si vous voulez ignorer les éléments <title>...</title>, tapez le titre là. Cliquez sur le signe plus.
Le nom de l’élément apparaît sur la liste.
Après avoir terminé la liste, cliquez sur OK. La fenêtre des paramètres d’importation de document revient.
Pour retirer un élément de la liste: Cliquez sur le nom de l’élément. Cliquez sur le signe moins en bas.
Ne pas importer les balises en tant que memoQ {balises} : memoQ a un ancien filtre HTML qui a été écrit avant l’introduction des balises internes. Ce filtre est seulement là pour la compatibilité. Ne l’utilisez pas dans de nouveaux projets. Ne cliquez pas sur Importer les balises en tant que memoQ {tags}.

PHP signifie PHP HyperText Preprocessor. C’est un environnement de programmation puissant pour créer des sites Web interactifs. Le code PHP apparaît généralement dans des fichiers PHP sur le serveur Web.
Mais les scripts PHP peuvent également se trouver dans des documents HTML. Ces scripts sont traités par le serveur. Lorsqu’ils sont traités, le serveur Web les remplace par du texte HTML avant de l’envoyer au navigateur Web du lecteur.
Le point est que les scripts PHP - qui apparaissent dans des documents HTML - peuvent contenir du texte qui peut avoir besoin d’être traduit. Ils ressemblent à ceci à l’intérieur des documents HTML:
(Source: Le manuel d’utilisation PHP
Normalement, memoQ n’importe pas de texte de ces scripts PHP. Si vous voulez traduire cela, utilisez les paramètres sur l’onglet configuration PHP:
Importer du texte à partir de scripts PHP: Cochez la case Importer les chaînes dans les scripts PHP.
Si le texte dans les scripts contient du balisage HTML: Cochez la case Interpréter les chaînes PHP en HTML. Normalement, memoQ ne le fait pas, mais vous avez de bonnes raisons de supposer que les balises HTML seront présentes.
memoQ importe du texte qui est utilisé comme arguments dans les commandes PHP (appelées fonctions). Cela signifie que memoQ importera ceci:
Et memoQ importera cela aussi:
(Source: Le manuel d’utilisation PHP
Si vous décochez la case Importer des chaînes des fonctions PHP, memoQ n’importe que le deuxième exemple.
Si la case à cocher Importer des chaînes des fonctions PHP est cochée: Vous pouvez ajouter d’autres commandes (fonctions) à la liste. Tapez le nom de la fonction dans la zone de texte en bas. Cliquez sur le signe plus.

Lorsque vous importez un document HTML 5, memoQ reconnaît l’attribut translate. Cela marque les éléments à traduire ou terme à ne pas traduire.
- Si l’attribut translate est « oui »: memoQ importe l’élément comme à traduire. L’élément est importé même s’il est marqué terme à ne pas traduire dans la configuration du filtre intégré. Cela signifie qu’il est défini comme terme à ne pas traduire (exclu) par la configuration du filtre. Ou, c’est l’enfant d’un terme à ne pas traduire.
- Si l’attribut translate est « non »: memoQ n’importe pas l’élément. L’élément est omis même s’il est marqué comme traduisible dans la configuration du filtre.
Les éléments HTML peuvent aussi avoir une langue. Un élément HTML peut avoir l’attribut « lang ». Il spécifie la langue du contenu. memoQ prend en charge l’attribut lang. Lorsque vous exportez le document, memoQ change l’attribut lang à la langue cible. Cela fonctionne pour les éléments qui ont été réellement importés pour la traduction. memoQ ne change pas le code de langue s’il ne correspond pas à la langue source du projet. Par exemple, si une partie du document était marquée comme étant en japonais dans un document autrement en anglais, memoQ suppose que c’était intentionnel. Lors de la correspondance des langues, memoQ ignore les variantes régionales: L’ anglais et l’anglais américain s’accorderont.
Lorsque vous avez terminé
-
Pour confirmer les paramètres et revenir à la fenêtre Options d’importation de documents: Cliquez sur OK.
Dans la fenêtre Options d’importation de documents: Cliquez à nouveau sur OK pour commencer l’importation des documents.
-
Pour revenir à la fenêtre des options d’importation de documents, et ne pas changer les paramètres du filtre: Cliquez sur Annuler.
-
Si c’est un filtre en cascade, vous pouvez modifier les paramètres d’un autre filtre dans la chaîne : Cliquez sur le nom du filtre en haut de la fenêtre.