la spaccricerca

Ieri pomeriggio, letteralmente così, mi è venuta un'idea un po' 𝓯𝓻𝓮𝓪𝓴𝔂... (anche in questo caso, la categoria si dimostra quella con le pensate migliori). In pratica, stavo pensando che mi serve assolutamente un #sito archivio (...l'archivi.octt?) dove conservare tutti quei miei #dati un po' sparsi per vari (troppi) siti e piattaforme, sia da server miei che non, principalmente per avere un backup tosto e affidabile di tutti essi; ma, in secondo luogo, avendoli tutti centralizzati in un solo sistema, quindi tutti bene o male filtrabili e ricercabili insieme, indipendentemente dalla fonte originaria... 🌊️

Ebbene, 'sto ennesimo sito non è una cazzata, è un vero disastro, semplicemente perché al mondo esistono centinaia di generatori statici, ma nemmeno uno buono (nemmeno il mio, che perciò è deprecato). Non vado nello specifico su quali sono tutte le fonti di dati (sarà per la prossima volta), e come mai è complicato gestirle con generatori di siti generici (al punto che forse la risolverei prima facendo degli script di rendering specifici in PHP: Hypertext Preprocessor), ma... almeno la ricerca olistica posso già averla per le fonti originali, con i motori di ricerca #web... che, però, non indicizzano per niente bene le mie tremila cose (neanche quelle altrui, a onor del vero). La conclusione logica è solo 1 e, ordunque, il mio #motore di #ricerca è ora reale. 🙃️

Risultati di una ricerca testuale per "gaming manine unghie" e una ad immagini per "Minecraft forlong incident"
Spanne sopra la ricerca interna di WordPress, anche considerando eventuali plugin (non-premium), con non solo la ricerca testuale filtrabile, ma anche le immagini, e strumenti di ricerca più avanzati. Per il momento ho fatto il crawl completo di soltanto i miei siti e qualcuno amico... chiedetemi pure di aggiungere il vostro, se anche voi siete odiati dai crawler commerciali, mi fa piacere. E insomma, provate su https://yacy.spacc.eu.org/! 🤩️

Schermata del pannello admin che mostra la rete dei collegamenti ipertestuali tra i vari domini incontrati con un grafico.
Ora, non è propriamente "il mio motore" come avevo immaginato mesi fa (e a cui non ho mai lavorato!), ma invece è YaCy. La UX è abbastanza buona, ma si sono impegnati a rendere la parte amministrativa qualcosa di veramente iperconfusionario, che mi ha impiegato fino a stamane per capire come fare i crawl correttamente (senza perdere pezzi per strada e, soprattutto, senza cancellare le pagine già fatte), ma ora è ufficiale: è bono. Non so se sarebbe utile indicizzare anche certi subreddit, oppure Wikipedia e Stackoverflow, ma certamente alcuni canali Telegram andrò a farli... una volta aggirati i problemi creati artificialmente da Durov, si intende!!! ☠️
@octospacc



  • Tags: dati, motore, ricerca, sito, web, YaCy
  • Categories: Senza categoria