1. 4

    Mi rispondo da solo, con un giorno di distanza per non fare proprio tristezza.

    Quest’anno voglio affinare quelle skill, sia teoriche che di “occhio” per i dati, necessarie a migliorare nell’ambito del machine learning: è uno strumento che uso in maniera sistematica, sia nello studio che in piccoli side project, ma che non padroneggio per niente.

    Un’altra cosa che voglio fare è de-mouseizzarmi, imparare ad usare meno il puntatore e più la tastiera.

    1. 3

      Come ho già commentato da un’altra parte, “Singapore è Disneyland con la pena di morte”, quindi niente di tutto ciò mi stupisce.

      1. 2

        Da loro e dalla Corea del Sud, in effetti, me lo aspettavo

      1. 2

        Buone feste a tutti i gamberi, di cuore

        1. 4

          Per farsi venire due brividi gratis potete dare un’occhiata al loro report State of Revenge.

          1. 2

            Non ho ancora letto tutto il report, ma solo la situazione Telegram è spaventosa…

          1. 6

            Montaggio scaffali nello sgabuzzino. Ogni tanto bisogna dare entusiastiche martellate (non eufemistiche) per rilassarsi.

            1. 2

              Bella l’informatica, per carità. Ma due martellate…

            1. 4

              Il problema non è sull’infrastruttura, ma risiede nella mentalità retrogada della PA che continua ad affidarsi a soluzioni software proprietarie, anche sui server di loro proprietà.

              Per esempio, da anni hanno un cloud privato dove ospitare le piattaforme applicative, perché non hanno usato il cloud che stanno pagando con i vostri soldi per ospitare Moodle o Jitsi invece di affidarsi a Google e Microsoft?

              Quindi è inutile che continuano con la scusa dell’infrastruttura, ormai con le nuove tecnologie è diventata una commodity, quello che conta è come la usi.

              1. 1

                Finché i bandi CONSIP saranno strutturati in modo tale che per vincerli ci sia bisogno di aziende appositamente costruite (da Accenture et similia) che li vincono e poi subappaltano, vincerà sempre la mentalità “lavora il meno possibile per guadagnare il più possibile”

                1. 2

                  Il subappalto non centra, quello al massimo riguarda lo sviluppo del software, sto parlando di IaaS acquistato dai provider, come ad esempio quello del contratto quadro dei servizi Cloud per la Pubblica Amministrazione, nato nel 2015, quindi ormai 5 anni fa. Si tratta di infrastruttura dedicata alla PA e fornita direttamente dai vincitori della gara. I data center sono tutti in Italia.

                  Ripeto: il cloud ce l’hanno, il problema non è quello. Lo comprano, è ovvio, non hanno la capacità ed i data center per gestire una cosa del genere. Ma poi tutto dipende da cosa ci fai.

                  Preferisco che mia figlia utilizzi una piattaforma educativa open source ospitata su un cloud privato di un’azienda fornitrice in Italia piuttosto che merda Microsoft che gira su un cloud di proprietà della PA. Quello che conta è il software ed i dati, non la ferraglia che c’è sotto.

              1. 1

                Approccio interessante.

                Peccato che il peccato originale dei programmatori statistici (credersi divintà capaci di copiare l’intelligenza umana) continui ad inquinare questo campo di ricerca.

                1. 1

                  La maggior parte di quelli che ho conosciuto io erano carpentieri del software buoni ad appiccicare insieme una libreria dopo l’altra finché l’accrocchio non funziona. L’idea di copiare l’intelligenza umana è morta negli anni ’90, nel frattempo vedo emergere schiere di gente che prima fitta il training set e poi pensa, e se il training set fitta bene non ti serve neanche pensare.

                1. 5

                  Sto leggendo armi di distruzione matematica e implementando i modelli di machine learning che trovo nel libro. Finora mi sono occupato di approvazione di carte di credito e previsione di reati. Ho pubblicato tutto nel mio wikibook e continuerò a farlo.

                  1. 1

                    Bella idea

                      1. 1

                        Penso che nella maggior parte dei casi se conosci il male lo eviti…

                      2. 1

                        Beh, che dire, sono dati e modelli parecchio problematici da trattare. Sarebbe interessare usare un po’ di Explanatory AI per catturare i rapporti causa/effetto che portano alla discriminazione di cui si parla nel libro.

                      1. 3

                        Sto scrivendo un parser e validator per il formato COCO. Le specifiche non sono fatte male (sembra) ma le “librerie” ufficiali sono fatte parecchio male. Chiaramente hanno preso il lavoro di un data scientist, l’hanno impacchettato in 10 minuti e messo sul repo.

                        Sto usando pydantic per fare parsing e validazione aggressiva perché vogliamo usare questi formati in una pipeline totalmente automatica e quando si fa l’ingestion del file e lo si accetta, bisogna essere sicuri che non si spacchi a runtime in altri servizi, cosa che le librerie esistenti non concepiscono.

                        1. 2

                          Come quasi tutti i formati usciti da un’università è roba mai uscita da Jupyter, mai seriamente testata, probabilmente tirata via per un progetto di ricerca e mai più toccata. Per fortuna pare che il paradigma stia cambiando: sono venuto a contatto con accademici che lavorano su progetti i cui deliverable sono vere librerie, non proof of concept buttati su GitHub solo per fare scena.

                          1. 1

                            eh ma dietro a ’sta roba in teoria ci sta microsoft ed è uno dei formati più diffusi lol

                            1. 1

                              Sponsorizza, quindi ci alloca un pezzetto di budget e, se va bene, qualche PhD di Microsoft Research a firmare il paper. Il fatto che sia il più diffuso non so quanto c’entri, ma finché qualcuno non si lamenta neanche se ci fossi io lo sistemerei.

                        1. 3

                          Fino a “by Cloudflare” mi aveva convinto.

                          1. 2

                            dici che è come cadere dalla padella alla brace?

                            1. 2
                              1. 1

                                Direi piuttosto da una padella ad un’altra.

                                Ma il fuoco è sempre lo stesso. ;-)

                                1. 1

                                  Però… Cloudflare non guadagna da dati e pubblicità online, no?

                                  1. 1

                                    Non vende dati.

                                    Ma se li cedesse al Governo tu come potresti accoggertene?

                                    1. 1

                                      ok, ma questo vale per qualunque operatore.

                                      1. 1

                                        I dati da operatori diversi sono nettamente più difficili da correlare rispetto a quelli di un singolo operatore che dispone del “God Eye” sulla rete, come Cloudflare, Google, Microsoft (Azure) o Amazon (AWS).

                                        D’altronde come sai “who own the server, own the user”.

                                        1. 1

                                          insomma, dicono di volerlo fare per il bene del web, ma l’unica cosa che conterà, nel medio periodo, è il loro ritorno economico?

                            1. 4

                              Gerace era un genio. Chiunque abbia studiato architettura degli elaboratori sa che il suo linguaggio a struttura di frase semplifica enormemente la definizione del microcodice rispetto a qualunque altro metodo (es. Verilog). Avevo già letto sue citazioni su questa pagina, ma mi stupisce il fatto di come fosse, straordinariamente, cinquant’anni avanti a tutti.

                              Resta da dire che il commento iniziale del redattore della pagina è piuttosto ampolloso rispetto alla spietata asciuttezza delle citazioni riportate.

                              1. 2

                                Grazie per aver menzionato il commento iniziale ampolloso, mi aveva gia’ fatto chiudere il tab.

                              1. 3

                                Io l’ho visto ieri sera ma non mi ha fatto impazzire. È tutto sommato un documentario limitatamente utile ma è veramente naive e superficiale. Inoltre il conflitto di interessi di Netflix che pubblica una cosa del genere è imbarazzante

                                1. 1

                                  Ma Netflix fa soldi con gli abbonamenti e non con gli ads no?

                                  1. 1

                                    in che senso conflitto di interessi di Netflix ?

                                    1. 3

                                      beh, Netflix andrebbe a pieno diritto nella lista di aziende citate nel documentario. Usano gli stessi trucchi con lo stesso risultato. L’idea che l’economia dell’attenzione esista solo nella forma dei social network è una narrativa che fa molto molto comodo a Netflix e distoglie l’attenzione da quello che fanno loro.

                                      1. 1

                                        ah, senza dubbio!

                                        il loro CEO ha dichiarato che il loro vero competitor è il sonno…

                                    2. 1

                                      Più che altro (non l’ho ancora visto, ma ho visto il video commento di Flora) mi lascia un po’ perplesso che non ci sia neanche una menzione ad un modo per uscirne se non quello reazionario di buttare i cellulari e i computer. Neanche un legislatore, uno studioso di privacy-preserving data mining, un giurista…

                                      1. 3

                                        beh oddio, in realtà parlano di una vaga idea di intervento statale, cosa ovviamente totalmente impensabile in USA.

                                        1. 1

                                          Sì certo, lo stato, in USA, come no. Ma un accenno al fatto che una terza via esiste, o vorrebbe esistere, a me sarebbe piaciuto. “La via umana al data mining”, quando mi studio le fonti giuste ci sta un articolo.

                                    1. 2

                                      Parole sante! Ma… fuck anche Gambe.ro? :P

                                      1. 2

                                        Eh, se non c’è il Glenlivet 17, direi di sì! ;-)

                                        1. 1

                                          Se Gambero è una startappe col Marco Zuccherbergo italiano che usa il Macche Bucche Ultimo Modello trascurando i figli, allora sì.

                                          1. 1

                                            Gambe.ro è una startup nei termini in cui chi la manda avanti non ci prende una lira, anzi un po’ ci rimette. A parte gli scherzi, questo è un progetto che non mira a monetizzare un bel nulla, e anzi è in aperta contrapposizione con quel mondo. Per ora ci salviamo. Per ora…

                                          1. 5

                                            In vista dello switch-off del DVB-T in favore del DVB-T2 (chissà quando!), avendo un paio di TV che non supportano il nuovo protocollo, sto raffinando la mia soluzione per evitare di dover ricomprare le TV o attaccarci uno scomodo decoder:

                                            • server TVHeadend su una economicissima board ARM
                                            • ricevitore DVB-T2 dual tuner USB
                                            • Kodi lato client che ha un comodissimo plugin per TVHeadend

                                            In pratica il segnale viene decodificato dal ricevitore USB e TVHeadend si preoccupa di fare lo streaming sulla rete domestica.

                                            Sui TV la soluzione migliore secondo me è usare un Amazon Fire Stick sul quale Kodi gira benissimo. Il risultato è praticamente identico ad un normale TV con decoder integrato. Se poi avete un TV con Android TV (io ho un videoproiettore che lo monta) allora potete installare Kodi direttamente sul TV.

                                            TVHeadend è fatto molto bene, gestisce un pool di ricevitori e Kodi può sfruttarli per il predictive tuning: quando si fa lo zapping il secondo tuner si sintonizza subito sul canale successivo e poi si alternano in maniera da passare da un canale all’altro in maniera molto più rapida. Inoltre gestisce le registrazioni, l’EPG, le icone dei canali, ecc. Installando Kodi sul PC si può tranquillamente vedere la TV anche sul PC.

                                            Tempo fa usavo MythTV, ma TVHeadend è più versatile.

                                            1. 1

                                              E questa soluzione la usi perché hai problemi di ricezione o per le registrazioni?

                                              1. 2

                                                Semplicemente come soluzione alternativa a cambiare i TV o comprare decoder, cosa che tra l’altro su un TV avrei problemi a fare in quanto è appeso al muro. Un Amazon Stick sono riuscito ad incastrarlo dietro la TV ma non penso ci riuscirei con un decoder. Si vendono dei mini-decoder che probabilmente ci entrerebbero, ma questa soluzione ha il vantaggio di essere centralizzata: posso vedere la TV ovunque, sul cellulare, sul PC, ecc. e da dovunque accedere alle eventuali registrazioni.

                                                Inoltre è l’unico modo che ho per vedere la TV sul videoproiettore.

                                            1. 5

                                              Ho finalmente e seriamente iniziato a fare la maglia. Per ora solo dritto e rovescio, ma spero in breve di passare a robe più interessanti dal punto di vista algoritmico/matematico.

                                              1. 4

                                                La macchina di Babbage è dietro l’angolo.

                                                1. 2

                                                  Complimenti!

                                                  Uno dei rimpianti della mia infanzia è che mia madre rifiutò di insegnarmi a ricamare. Era una vera artista. Non si limitava a punti semplici come il punto croce, ne conosceva moltissimi, e riusciva a combinarli per creare rilievi bellissimi.

                                                  Ora la sua vista è calata troppo.

                                                  Così per uno sciocco pregiudizio (“è un lavoro da donne”) non posso insegnarlo alle mie figlie.

                                                  1. 1

                                                    il ricamo magari no, ma iniziare la maglia è veramente easy e c’è un sacco di materiale su youtube

                                                  2. 1

                                                    A Natale puoi regalare un berretto a tua nonna :D

                                                  1. 5

                                                    Per una volta scrivo anch’io: sto lavorando alla mia tesi sul privacy preserving data mining scrivendo in prima battuta una libreria che implementa l’identificazione dei quasi-identifiers in un file di testo.

                                                    Dopodiché il prossimo passo sarà proporre un framework che stima il rischio di reidentificazione di un autore all’interno di un dataset - stiamo pensando di applicarlo a un insieme anonimizzato di post di Reddit - una cosa che in letteratura non esiste per cui sto (stiamo) brancolando un po’ nel buio.

                                                    1. 2

                                                      una cosa che in letteratura non esiste per cui sto (stiamo) brancolando un po’ nel buio.

                                                      E’ la parte migliore delle tesi!

                                                    1. 1

                                                      Sì ma, a parte Oracle JET, quali altri framework si possono fregiare di essere di “seconda generazione”? Mi sa che stia parlando di un fenomeno che (ancora?) non esiste.

                                                      1. 2

                                                        Ciao e grazie per l’AMA.

                                                        Con un gruppo di ragazzi da un po’ di tempo stiamo cercando di mettere in piedi una startup, e non ci dispiacerebbe la formula cooperativa.

                                                        Che cosa consigliate a chi inizia oggi il percorso che avete fatto voi?

                                                        1. 5

                                                          E’ importantissimo appoggiarsi da subito ad una delle associazioni di categoria come Lega Coop e Confcooperative che hanno una visione di insieme degli adempimenti burocratici e delle possibilità di networking e finanziamento all’interno del mondo Cooperativo e vi possono seguire in modo puntuale anche per gli aspetti più tecnici.

                                                          Fondamentale definire un sistema di governance chiaro da subito che sia un terreno condiviso da tutti in modo da non alimentare tensioni.

                                                          Ti consigliamo anche di seguire anche le possibilità offerte dal fare parte di https://platform.coop/ , una possibilità di networking internazionale veramente unica.

                                                          E poi ci siamo noi se avete bisogno di una chiacchierata orientativa ;-)

                                                        1. 3

                                                          Per una volta rispondo anche io: mi sto studiando i pochi paper disponibili in giro per quanto riguarda la stima del rischio di violazione della privacy nel trattamento dei testi.

                                                          In particolare sto raccogliendo le possibili tipologie di attacco alla privacy in una presentazione da fare alla mia relatrice per la tesi e a una dottoranda dello stesso gruppo di ricerca che dovrebbe seguirmi. Per ora ho individuato:

                                                          • Riconoscimento delle parole offuscate o generalizzate, es. da un report medico dove AIDS viene redatta o trasformata in Malattia del sistema immunitario.
                                                          • Riconoscimento dell’autore di un testo, anche eventualmente dopo l’offuscamento dello stile di scrittura.
                                                          • Riconoscimento delle informazioni sensibili lasciate nelle mail o nei messaggi privati.
                                                          1. 1

                                                            Il demone dell’efficienza a tutti i costi colpisce ancora.