Skip to main content

Solr

Solr


Solr (si pronuncia “Solar”) è un “Enterprise Search Server”, ovvero una piattaforma di ricerca aziendale open source basata sulla libreria Java per motori di ricerca Apache Lucene. Viene utilizzato per le ricerche nella maggior parte dei grandi siti web mondiali, come http://www.cnet.com o http://sourceforge.net e addirittura http://www.whitehouse.gov, in quanto garantisce una velocità di ricerca vicina alla ricerca nella rete locale Intranet. Solr opera tra il Database e il Web, permette cioè ai siti web di interrogare il database in modo rapido ed efficiente.

Solr è scritto in Java e lo stesso Java può essere utilizzato per modificare o estendere la piattaforma software. Viene eseguito come un server di ricerca indipendente all'interno di un contenitore servlet (applicazione eseguita su un server web) come Tomcat. Il potente sistema di configurazione esterno permette di adattare Solr alla maggior parte delle applicazioni senza la scrittura di codice Java.

Caratteristiche principali:

Oltre alla caratteristica principale, ovvero una potente ricerca full- text, Solr offre numerose funzioni:

• elaborazione delle richieste HTTP per l'indicizzazione e la ricerca di documenti;

numerose cache per risposte veloci alle interrogazioni;

  • un'interfaccia amministrativa web-based che include:

    • statistiche delle prestazioni in fase di esecuzione;

    • un modulo di ricerca nell'indice;

    • un visualizzatore dello schema con istogrammi dei termini

      più comuni con alcune statistiche;

  • file di configurazione per lo schema (descrizione dei dati) e il

    server stesso in XML:

    • Solr estende la libreria di analisi del testo di Lucene

      rendendola configurabile in XML;

    • introduce la nozione di “tipo di campo”, utili per le date e

      speciali algoritmi di ordinamento;

  • sfaccettatura dei risultati della ricerca (utile nei siti di e-

    commerce);

  • permette di evidenziare i risultati;

  • un plugin di controllo dello spelling, usato per suggerire query

    alternative (come il “forse cercavi” di Google);

  • un plugin per elencare i documenti simili ad un documento

    scelto;

  • un modello di server Solr distribuito con supporto di script per

    consentire uno sviluppo di larga scala;

  • clustering dinamico, ovvero selezione e raggruppamento di

    elementi omogenei in un insieme di dati;

  • integrazione nelle basi di dati;

  • gestione di documenti di testo ricco, come i documenti scritti

    con un Word Processor (Write, Word, ...) o i PDF (Portable Document Format);

• altamente scalabile, ovvero può facilmente incrementare le proprie prestazioni se si aumentano le risorse a disposizione.