ArchiveBox

ArchiveBox

🗃 L'archive Web auto-hébergée open source.Prend l'historique du navigateur / signets / Pocket / Pinboard / etc., Enregistre HTML, JS, PDF, médias, et plus encore.
  • Gratuite
Parce que les sites Web modernes sont compliqués et reposent souvent sur du contenu dynamique, ArchiveBox archive les sites dans plusieurs formats différents au-delà de ce que les services d'archivage publics comme Archive.org et Archive.is sont capables de sauvegarder.ArchiveBox importe une liste d'URL à partir de stdin, d'une URL distante ou d'un fichier, puis ajoute les pages à un dossier d'archive local à l'aide de wget pour créer un clone html consultable, youtube-dl pour extraire le média et une instance complète de Chrome sans tête pour PDF,Capture d'écran et vidages DOM, et plus encore ... L'utilisation de plusieurs méthodes et du navigateur dominant sur le marché pour exécuter JS nous permet de sauvegarder même les sites Web les plus complexes et les plus exigeants dans au moins quelques formats de données à long terme de haute qualité.### Peut importer des liens depuis: - Pocket, Pinboard, Instapaper - RSS, XML, JSON ou listes de texte brut - Historique du navigateur ou signets (Chrome, Firefox, Safari, IE, Opera, et plus) - Shaarli, Delicious, RedditMessages enregistrés, Wallabag, Unmark.it et tout autre texte contenant des liens!### Peut enregistrer ces choses pour chaque site: - favicon.ico` favicon du site - `example.com / page-name.html` clone wget du site, avec .html ajouté s'il n'est pas présent -` sortie.pdf` PDF imprimé du site utilisant chrome sans tête - `screenshot.png` 1440x900 capture d'écran du site utilisant chrome sans tête -` output.html` DOM Dump du HTML après rendu avec chrome sans tête - `archive.org.txt` Un lien vers lesite enregistré sur archive.org - `warc /` pour le fichier warc html + gzippé.gz - `media /` tout mp4, mp3, sous-titres et métadonnées trouvés en utilisant youtube-dl - `git /` clone de n'importe quel référentiel pour les liens github, bitbucket ou gitlab - `index.html` &` index.json`Fichiers d'index HTML et JSON contenant des métadonnées et des détails L'archivage est additif, vous pouvez donc planifier l'exécution régulière de `. / Archive` et insérer de nouveaux liens dans l'index.Tout le contenu enregistré est statique et indexé avec des fichiers JSON, donc il vit pour toujours et est facilement analysable, il ne nécessite aucun back-end toujours en cours d'exécution.
archivebox

Les catégories

Alternatives à ArchiveBox pour toutes les plateformes avec n'importe quelle licence

Pocket

Pocket

Enregistrez les pages Web pour les lire plus tard et éliminez l'encombrement des signets avec des sites qui ne présentent qu'un intérêt ponctuel.
Wget

Wget

GNU Wget est un logiciel gratuit pour récupérer des fichiers en utilisant HTTP (S) et FTP, les protocoles Internet les plus utilisés.
HTTrack

HTTrack

Un service de copie de sites Web qui télécharge des sites Web entiers et les construit de manière récursive localement.
Wayback Machine

Wayback Machine

Parcourez plus de 150 milliards de pages Web archivées de 1996 à il y a quelques mois.
wallabag

wallabag

wallabag est une application open source auto-hébergeable pour la sauvegarde de pages Web. ## Lecture confortable
Pinboard

Pinboard

Pinboard est une archive personnelle pour les choses que vous trouvez en ligne et que vous ne voulez pas oublier.
Evernote Web Clipper

Evernote Web Clipper

Enregistrez tout ce que vous voyez en ligne - y compris le texte, les liens et les images - dans votre compte Evernote en un seul clic.
Archive.is

Archive.is

Archive.is vous permet de "prendre une photo" d'une page Web qui sera toujours disponible même si la page d'origine change ou est supprimée.
Internet Archive

Internet Archive

Internet Archive est une bibliothèque numérique à but non lucratif offrant un accès universel gratuit aux livres, films et musique, ainsi que 150 milliards de pages Web archivées.
Stash.ai

Stash.ai

Stash est une application de signet intelligente, multi-appareils, soutenue par l'intelligence artificielle.Enregistrez des articles, des vidéos et toute autre chose.Ils sont automatiquement classés pour vous.
SiteSucker

SiteSucker

application macOS qui télécharge automatiquement les sites Web à partir d'Internet.Pour ce faire, il copie de manière asynchrone les pages Web, les images, les fichiers PDF, les feuilles de style et d'autres fichiers du site sur votre disque dur local, en dupliquant la structure de répertoires du site.
PageArchiver

PageArchiver

PageArchiver (précédemment appelé "Scrapbook for SingleFile") est une extension Chrome qui vous aide à archiver des pages Web pour une lecture hors ligne. Les principales fonctionnalités sont:
Reminiscence

Reminiscence

Gestionnaire de signets et d'archives auto-hébergé.Ajoutez des liens aux signets et modifiez ses métadonnées (comme le titre, les balises, le résumé) via l'interface Web.
Fossilo

Fossilo

Fossilo.com archive continuellement des sites Web complets au format PDF et plusieurs autres formats pour être facilement ouverts et consultés sans aucune dépendance à l'avenir.Vous pouvez parcourir les archives dans la plate-forme ou la télécharger en tant que package indépendant.
WebCull

WebCull

WebCull est un organisateur de liens conçu pour vous aider à devenir plus productif et organisé tout en utilisant le Web.