Project

Back to overview

The Dynamics of Innovation: latent space modelling of patent citations

English title The Dynamics of Innovation: latent space modelling of patent citations
Applicant Wit Ernst
Number 192549
Funding scheme Project funding (Div. I-III)
Research institution Istituto del Software (SI) Facoltà di scienze informatiche
Institution of higher education Università della Svizzera italiana - USI
Main discipline Science of management
Start/End 01.01.2021 - 31.12.2024
Approved amount 674'950.00
Show all

All Disciplines (2)

Discipline
Science of management
Mathematics

Keywords (6)

statistical network models; patent citations; event history models; knowledge creation; latent space models; Innovation dynamics

Lay Summary (Italian)

Lead
La dinamica dell'innovazione: modellazione spaziale latente di citazioni di brevetti
Lay summary

In sintesi

Che la conoscenza sia un processo cumulativo è fatto da molto tempo ormai riconosciuto. Nel XII secolo il filosofo francese Bernard di Chartres pensava alla nuova generazione di pensatori come "nani appollaiati sulle spalle dei giganti". Per quanto questa metafora della conoscenza possa essere utile, essa è incapace di indicare sulle spalle di quale gigante, esattamente, noi siamo effettivamente seduti, né ci aiuta a capire se la conoscenza sia meglio compresa come una singola torre o piuttosto come una città in continua evoluzione con torri multiple e diversa altezza.

In questo studio ci concentriamo sulla conoscenza contenuta nei brevetti e operiamo in piedi su quelle spalle della conoscenza come citazione di brevetto. Analizzando la rete di citazioni di brevetti, ci proponiamo di studiare il carattere endogeno e auto-organizzante della rete. L'idea principale alla base di questa “svolta della rete” nella creazione di innovazione e conoscenza dello studio è che le idee (e i brevetti che le incarnano) possono esistere solo in una complessa rete di connessioni con altre idee.  La premessa e la promessa di questo approccio è che la struttura della rete di idee rappresentata dagli stessi sistemi di citazione brevettuale ha un valore predittivo circa le idee che verranno generate in seguito, e quanto queste saranno influenti e di successo. La risposta alla domanda sulle origini dell'innovazione che questi studi cercano di articolare è: le innovazioni provengono dalla ricombinazione innovativa di conoscenze già disponibili.

Oggetto e obiettivi

Esamineremo le reti di citazioni di brevetti estratte da due banche dati accessibili al pubblico del European Patent Office e del United States Patent and Trademark Office.  Il progetto di ricerca mira a documentare dinamiche dell'innovazione sviluppando un nuovo quadro di modellizzazione statistica delle reti di citazioni di brevetti. Il modello riconosce esplicitamente che sebbene le citazioni siano direttamente osservabili nei dati ufficiali sui brevetti, i flussi di conoscenza implicati da queste citazioni non sono direttamente osservabili. Il modello affronta questo problema ipotizzando che la posizione che i brevetti occupano in uno spazio di conoscenza latente influisce sulla loro posizione nelle reti di citazione dei brevetti effettivamente osservate.

Contesto socio-scientifico

La diffusione della convinzione che viviamo in una “società della conoscenza” è promossa da un riconoscimento sempre più generale che l’innovazione è il motore fondamentale della crescita economica per le imprese, i settori economici e paesi. Da dove viene l'innovazione? Negli ultimi quarant'anni circa, la ricerca empirica ha tentato di affrontare questa questione cruciale analizzando i dati sui brevetti, i documenti legali creati per proteggere il diritto degli inventori di appropriarsi dei rendimenti delle loro attività inventive precludendo temporaneamente l’erosione competitiva dei profitti.

 

Direct link to Lay Summary Last update: 02.04.2020

Responsible applicant and co-applicants

Employees

Associated projects

Number Title Start Funding scheme
167326 The Global Structure of Knowledge Networks: Data, Models and Empirical Results 01.07.2017 NRP 75 Big Data

Abstract

The diffusion of the conviction that we live in a “knowledge society” is promoted by an increasingly general recognition that the growth of knowledge - innovation - is the fundamental driver of economic growth for companies, economic sectors and countries. Where does innovation come from?During the last forty years or so, empirical research has attempted to address this crucial question by analyzing data on patents - legal documents created to protect the right of inventors to appropriate the returns on their inventive activities by temporarily precluding competitive exploitation. Underlying this line of research is the general idea that patents are proxies for innovation and knowledge creation. Earlier studies used patent data to compute statistical indicators that could help measuring the productivity and value of investment in R&D at the company or country level. The answer that these studies attempt to provide to our orienting question about the origins of innovation may be summarized as follows: innovation comes from investments in innovative activities.More recently, attention has turned to the endogenous, self-organizing character of patent citation networks. The main idea underlying this “network turn” in the study innovation and knowledge creation is that ideas (and the patents that embody them) can exist only in a complex network of connections with other ideas (the “prior art”). The premise and promise of this approach is that the structure of the network of ideas represented by patent citation systems itself has predictive value for which ideas will be generated next, and how influential and successful they will be. The answer to the question about the origins of innovation that these studies try to articulate is: innovations come from knowledge itself.The research project we propose intends to contribute to this more recent line of research by providing a new statistical modelling framework for the analysis of data routinely produced by patent citation networks. The model explicitly recognizes that patent citation networks may be reconstructed from official patent data, but knowledge is itself not directly unobservable. The model addresses this issue by positing that the position that patents occupy in a latent knowledge space affects their position in the actually observed patent citation network. The distinction between the observed network and the latent knowledge space gives us leverage over the generative mechanisms underlying patent citation activities. More importantly, the model we propose is fully dynamic and, in the more general case, allows the structure of latent knowledge spaces to coevolve with the temporal and spatial structure of the observed patent citation network. This possibility is obtained by designing a new analytical framework that integrates in a novel way event-history and latent space modelling techniques. The outcome is the possibility of testing hypotheses about the relation between the position that ideas occupy in the latent knowledge space that generates them, and patterns of patents citations that are actually observed. We are not aware of existing statistical models that can be adopted to support this inferential task at a level of rigor and generality that is comparable to that afforded by our methodological proposal.To establish the empirical value of our methodological proposal, we will be examining patent citation networks extracted from publicly available databases. The first is the European Patent Office (EPO) data base. At the time of this writing, the EPO dataset at our disposal contains complete high-quality information on approximately more than 1M patents deposited during the period 1978-2008. For comparative purposes, we will also be testing our models on a second dataset, the well-known United States Patent and Trademark Office (USPTO) dataset. This is a publicly available dataset containing information on approximately 3M patents granted by the United States Patent and Trademark Office (USPTO) between 1975 and 1999. The public availability and maintenance of the data is insured by third parties making the data available. The project being proposed involves a direct collaboration between mathematical statistics and the economic sociology of technological innovation. The interdisciplinary approach that we intend to articulate makes dissemination of the computational tools via a software package a core objective of the project itself.
-