123
ArchiveBox

ArchiveBox

🗃 L'archive Web auto-hébergée open source.Prend l'historique du navigateur / signets / Pocket / Pinboard / etc., Enregistre HTML, JS, PDF, médias, et plus encore.
  • Gratuite
Parce que les sites Web modernes sont compliqués et reposent souvent sur du contenu dynamique, ArchiveBox archive les sites dans plusieurs formats différents au-delà de ce que les services d'archivage publics comme Archive.org et Archive.is sont capables de sauvegarder.ArchiveBox importe une liste d'URL à partir de stdin, d'une URL distante ou d'un fichier, puis ajoute les pages à un dossier d'archive local à l'aide de wget pour créer un clone html consultable, youtube-dl pour extraire le média et une instance complète de Chrome sans tête pour PDF,Capture d'écran et vidages DOM, et plus encore ... L'utilisation de plusieurs méthodes et du navigateur dominant sur le marché pour exécuter JS nous permet de sauvegarder même les sites Web les plus complexes et les plus exigeants dans au moins quelques formats de données à long terme de haute qualité.### Peut importer des liens depuis: - Pocket, Pinboard, Instapaper - RSS, XML, JSON ou listes de texte brut - Historique du navigateur ou signets (Chrome, Firefox, Safari, IE, Opera, et plus) - Shaarli, Delicious, RedditMessages enregistrés, Wallabag, Unmark.it et tout autre texte contenant des liens!### Peut enregistrer ces choses pour chaque site: - favicon.ico` favicon du site - `example.com / page-name.html` clone wget du site, avec .html ajouté s'il n'est pas présent -` sortie.pdf` PDF imprimé du site utilisant chrome sans tête - `screenshot.png` 1440x900 capture d'écran du site utilisant chrome sans tête -` output.html` DOM Dump du HTML après rendu avec chrome sans tête - `archive.org.txt` Un lien vers lesite enregistré sur archive.org - `warc /` pour le fichier warc html + gzippé.gz - `media /` tout mp4, mp3, sous-titres et métadonnées trouvés en utilisant youtube-dl - `git /` clone de n'importe quel référentiel pour les liens github, bitbucket ou gitlab - `index.html` &` index.json`Fichiers d'index HTML et JSON contenant des métadonnées et des détails L'archivage est additif, vous pouvez donc planifier l'exécution régulière de `. / Archive` et insérer de nouveaux liens dans l'index.Tout le contenu enregistré est statique et indexé avec des fichiers JSON, donc il vit pour toujours et est facilement analysable, il ne nécessite aucun back-end toujours en cours d'exécution.

Les catégories

Alternatives à ArchiveBox pour Linux

Wget

Wget

GNU Wget est un logiciel gratuit pour récupérer des fichiers en utilisant HTTP (S) et FTP, les protocoles Internet les plus utilisés.
HTTrack

HTTrack

Un service de copie de sites Web qui télécharge des sites Web entiers et les construit de manière récursive localement.
wallabag

wallabag

wallabag est une application open source auto-hébergeable pour la sauvegarde de pages Web. ## Lecture confortable
Stash.ai

Stash.ai

Stash est une application de signet intelligente, multi-appareils, soutenue par l'intelligence artificielle.Enregistrez des articles, des vidéos et toute autre chose.Ils sont automatiquement classés pour vous.
PageArchiver

PageArchiver

PageArchiver (précédemment appelé "Scrapbook for SingleFile") est une extension Chrome qui vous aide à archiver des pages Web pour une lecture hors ligne. Les principales fonctionnalités sont:
Fossilo

Fossilo

Fossilo.com archive continuellement des sites Web complets au format PDF et plusieurs autres formats pour être facilement ouverts et consultés sans aucune dépendance à l'avenir.Vous pouvez parcourir les archives dans la plate-forme ou la télécharger en tant que package indépendant.
WebArchives

WebArchives

Un visualiseur d'archives Web offrant la possibilité de parcourir des millions d'articles hors ligne à partir de grands projets communautaires tels que Wikipedia ou Wikisource.