30
Gigablast
Gigablast est un nouveau moteur de recherche puissant, open source, qui effectue une indexation en temps réel!
- Gratuite
- Web
- Self-Hosted
Gigablast est un nouveau moteur de recherche puissant, open source, qui effectue une indexation en temps réel!Fonctionnalités Extensible à des milliers de serveurs.A atteint plus de 12 milliards de pages Web sur plus de 200 serveurs.Un double quad core, avec 32 Go de RAM et deux SSD Intel de 160 Go, exécutant 8 instances Gigablast, peut faire environ 8 qps (requêtes par seconde) sur un index de 10 millions de pages.Les disques seront proches de la capacité de stockage maximale.Le doublement de la taille de l'indice divisera plus ou moins le taux de qps de moitié.(Les mesures de performances peuvent être réalisées environ dix fois plus rapidement mais je n'y suis pas encore parvenu. L'utilisation de l'espace disque restera probablement à peu près la même car elle est déjà assez efficace.) 1 million de pages Web nécessitent 28,6 Go d'espace disque.Cela inclut l'index, les méta-informations et le HTML compressé de toutes les pages Web.Le taux d'araignée est d'environ 1 page par seconde par cœur.Ainsi, un double quad core peut générer et indexer 8 pages par seconde, soit 691 200 pages par jour.4 Go de RAM requis par instance Gigablast.(instance = processus) Démo en direct sur Written en C / C ++ pour des performances optimales.Plus de 500 000 lignes de C / C ++.100% personnalisé.Un seul binaire.Le serveur Web, la base de données et tout le reste sont tous contenus dans ce code source de manière très efficace.Facilite l'administration et le dépannage.Fiable.A été testé en production live depuis 2002 sur des milliards de requêtes sur un index de plus de 12 milliards de pages web uniques, 24 milliards en miroir.Super rapide et efficace.L'un des rares moteurs de recherche qui ont atteint un si grand nombre.Le seul moteur de recherche open source qui a.Prend en charge toutes les langues.Peut donner un coup de pouce aux résultats dans les langues spécifiées par rapport aux autres au moment de la requête.Utilise la représentation UTF-8 en interne.Historique.A été utilisé par de nombreux clients.A été utilisé avec succès dans les logiciels d'entreprise distribués.Pages Web mises en cache avec mise en évidence des termes de requête ....