Principini, Gianluca
 
(2021)
Data Mesh: decentralizzare l'ownership dei dati mantenendo una governance centralizzata attraverso l'adozione di standard di processo e di interoperabilità.
[Laurea magistrale], Università di Bologna, Corso di Studio in 
Informatica [LM-DM270], Documento full-text non disponibile
  
 
  
  
        
        
	
  
  
  
  
  
  
  
    
      Il full-text non è disponibile per scelta dell'autore.
      
        (
Contatta l'autore)
      
    
  
    
  
  
    
      Abstract
      Nel corso degli ultimi due decenni i progressi delle tecnologie cloud hanno consentito alle imprese di poter puntare su nuovi paradigmi implementativi per le Data Platform. Tuttavia, questi sono caratterizzati da centralizzazione e monoliticità, stretto accoppiamento tra gli stage di pipeline e da un'ownership dei dati centralizzata in team di data engineers altamente specializzati, ma lontani dal dominio. Queste caratteristiche, con l'aumentare delle sorgenti e dei consumatori dei dati, evidenziano un collo di bottiglia che rischia di pregiudicare la buona riuscita di progetti che spesso comportano grossi investimenti. Problemi simili sono stati affrontati dall'ingegneria del software con l'adozione del Domain Driven Design, con il passaggio da architetture monolitiche ad architetture orientate ai servizi e sistemi basati su microservizi, che ben si prestano ad operare in ambienti cloud. Nella tesi, svolta nel contesto aziendale di Agile Lab, viene illustrato come le stesse migliorie possano essere applicate alla progettazione delle Data Platform adottando il paradigma del Data Mesh, in cui ciascun dominio espone dati analitici attraverso i Data Product. Per dimostrare come sia possibile ridurre gli attriti nella predisposizione dell'infrastruttura di un Data Product attraverso l'adozione di standard di processo e di interoperabilità, che guidino l'interazione tra le diverse componenti all'interno della piattaforma, viene illustrata la progettazione e l'implementazione di un meccanismo di Infrastructure as Code per le risorse di observability di quest'ultimo.
     
    
      Abstract
      Nel corso degli ultimi due decenni i progressi delle tecnologie cloud hanno consentito alle imprese di poter puntare su nuovi paradigmi implementativi per le Data Platform. Tuttavia, questi sono caratterizzati da centralizzazione e monoliticità, stretto accoppiamento tra gli stage di pipeline e da un'ownership dei dati centralizzata in team di data engineers altamente specializzati, ma lontani dal dominio. Queste caratteristiche, con l'aumentare delle sorgenti e dei consumatori dei dati, evidenziano un collo di bottiglia che rischia di pregiudicare la buona riuscita di progetti che spesso comportano grossi investimenti. Problemi simili sono stati affrontati dall'ingegneria del software con l'adozione del Domain Driven Design, con il passaggio da architetture monolitiche ad architetture orientate ai servizi e sistemi basati su microservizi, che ben si prestano ad operare in ambienti cloud. Nella tesi, svolta nel contesto aziendale di Agile Lab, viene illustrato come le stesse migliorie possano essere applicate alla progettazione delle Data Platform adottando il paradigma del Data Mesh, in cui ciascun dominio espone dati analitici attraverso i Data Product. Per dimostrare come sia possibile ridurre gli attriti nella predisposizione dell'infrastruttura di un Data Product attraverso l'adozione di standard di processo e di interoperabilità, che guidino l'interazione tra le diverse componenti all'interno della piattaforma, viene illustrata la progettazione e l'implementazione di un meccanismo di Infrastructure as Code per le risorse di observability di quest'ultimo.
     
  
  
    
    
      Tipologia del documento
      Tesi di laurea
(Laurea magistrale)
      
      
      
      
        
      
        
          Autore della tesi
          Principini, Gianluca
          
        
      
        
          Relatore della tesi
          
          
        
      
        
          Correlatore della tesi
          
          
        
      
        
          Scuola
          
          
        
      
        
          Corso di studio
          
          
        
      
        
          Indirizzo
          CURRICULUM A: TECNICHE DEL SOFTWARE
          
        
      
        
      
        
          Ordinamento Cds
          DM270
          
        
      
        
          Parole chiave
          Big Data,Domain Driven Design,Service Oriented Architecture,Cloud,AWS,Serverless,Microservice,Data Mesh,API Gateway,AWS Lambda
          
        
      
        
          Data di discussione della Tesi
          16 Dicembre 2021
          
        
      
      URI
      
      
     
   
  
    Altri metadati
    
      Tipologia del documento
      Tesi di laurea
(NON SPECIFICATO)
      
      
      
      
        
      
        
          Autore della tesi
          Principini, Gianluca
          
        
      
        
          Relatore della tesi
          
          
        
      
        
          Correlatore della tesi
          
          
        
      
        
          Scuola
          
          
        
      
        
          Corso di studio
          
          
        
      
        
          Indirizzo
          CURRICULUM A: TECNICHE DEL SOFTWARE
          
        
      
        
      
        
          Ordinamento Cds
          DM270
          
        
      
        
          Parole chiave
          Big Data,Domain Driven Design,Service Oriented Architecture,Cloud,AWS,Serverless,Microservice,Data Mesh,API Gateway,AWS Lambda
          
        
      
        
          Data di discussione della Tesi
          16 Dicembre 2021
          
        
      
      URI
      
      
     
   
  
  
  
  
  
  
    
      Gestione del documento: 
      
        