Sulla macchina devono essere presenti: la jre 8 e il pacchetto "xvfb" per permettere al web driver (Selenium) di funzionare.
Scarica Go dal sito e configuralo (anche GOBIN)
Scarica e configura git: user.name, user.email
Installazione:
go get -v github.com/return55/tirocinio
Copia la cartella neo4j-enterprise-3.4.7 dentro tirocinio/docDatabase
Utilizzo
Al momento per usare il progetto e' necessario andare nella directory del preogetto (dovrebbe essere "go/src/github.com/return55/tirocinio"):
avvia Neo4j: ./docDatabase/neo4j-enterprise-3.4.7/bin/neo4j start (stop per fermare)
lancia "go run main_MA.go " senza parametri per mostrare le operazioni disponibili
se invece viene laciato con un parametro avvia uno script che pulisce il database e effettua 5 ricerche (guarda il main per piu' dettagli)
*(fai riferimento al file "main_MA.go" per piu' dettagli)
Note
Main
main.go (solo per Scholar) ha le seguenti funzionalita':
firstN : Prendo i primi n articoli che citano quello iniziale.
everFirst : Prendo per n volte il primo tra gli articoli che citano quello precedente.
thread : guarda la funzione concurrency() per piu' dettagli.
main_MA.go (solo per Academic): se avviato senza parametri vengono mostrate le operazioni disponibili:
Avvia una ricerca
Stampa la classifica dei campi di studio degli articoli
Elimina i risultati di una o piu' ricerche
Stampa file .dot che rappresenta il grafo delle citazioni degli articoli
File .dot
Per ottenere le immmagini (.svg) dai .dot devi entrare nella cartella tirocinio/draw/fileDOT e avvia lo script createSVG. Questo creera' un file .svg per ogni .dot nella cartella.
File .dot dei campi di studio
Per poter creare il .dot dei campi e' prima necessaario eseguie le query nell'ordine:
1_aggiungi_archi (che ha effetto solo sul grafo num 5)
2_crea_campi_MAFieldOfStudy2
3_crea_rel_CITE2
A questo punto e' possibile eseguire l'operazione numero 6 del main "Print graph of fields"
Per ottenere il file svg: "dot -Tsvg -o nome_file.svg altro_file.dot"
Neo4j
Se le prestazioni di neo4j sono scarse o se da errore per mancanza di memoria heap, puo' essere utile modificare nel file:
"docDatabase/neo4j-enterprise-3.4.7/conf/neo4j.conf" il campo "dbms.memory.heap.max_size" e dare al dbms piu' memoria.
All'avvio di neo4j, il dbms si potrebbe lamentare del max numero di file open. E' possibile modificarne il valore tra le
impostazioni di sicurezza ma anche facendolo non ho notato cambiamenti nelle prestazioni.
Per vedere il grafo:
Vai all'indirizzo "localhost:7687", accedi a neo4j (se richiesto: username: neo4j - password: neo4j)
Esegui "match (n) return n"
Microsoft Academic
I file con la sigla MA alla fine sono specifici per gli articoli di Academic, tuttavia non sono sufficienti.
Alcune delle funzionalita' di base sono nei rispettivi file senza sigla (es creo_db.go - creo_db_MA.go)