Portuguese Chinese (Simplified) English French German Italian Japanese Russian Spanish

Desenvolvimento de projetos conjuntos Universidade - Empresas/Instituições Públicas ou Privadas


A USP tem modelos de contrato para parcerias envolvendo Empresas ou Instituições.
Confira abaixo algumas definições e modelo padrão da Universidade para cada tipo de
parceria:

Convênio

Convênio de pesquisa - É o documento que expressa as obrigações por todos os parceiros nele
envolvidos visando a objetivos comuns para pesquisa e desenvolvimento, com metas a serem
cumpridas pela Universidade e Empresa/Instituição envolvida de acordo com plano de
trabalho bem definido.
Trâmite: Docente e Empresa/Instituição definem objetivo do convênio, bem como as metas a
serem atingidas. É redigido um plano de trabalho.
Minuta e plano de trabalho são encaminhados para o jurídico da Empresa/Instituição e para a
USP para trâmite e aprovações.
Anexos:

Minuta de Convênio
Modelo para Plano de Trabalho

Termo de Confidencialidade

É utilizado quando os parceiros tem interesse na troca prévia de informações técnicas para
análise da viabilidade de parceria para pesquisa ou desenvolvimento.
Trâmite: Termo é encaminhado para o jurídico da Empresa/Instituição e para a USP para
trâmite e aprovações.
Anexo:

Termo de Confidencialidade

Prestação de Serviço: USP Contratada

Neste tipo de parceria a USP, através de um docente, presta determinado serviço à uma
Empresa ou Instituição. É utilizada a infra-estrutura da Universidade.
Trâmite: Empresa propõe metas a serem atingidas, plano de desembolso de recursos e
apresenta a proposta ao docente. É redigido um plano de trabalho. Contrato e plano de
trabalho são encaminhados para o jurídico da Empresa/Instituição e para a USP para trâmite e
aprovações.

Anexos:

Contrato de prestação de Serviços - USP contratada
Modelo para Plano de Trabalho

Consultoria: Docente / Empresa

Docentes autorizados pela Universidade podem prestar serviço para Empresas ou Instituições.
A consultoria é uma forma de contrato para a realização de serviços pontuais, sem a utilização
da infra-estrutura da Universidade.

Trâmite: Empresa propõe metas a serem atingidas, plano de desembolso de recursos e
apresenta a proposta ao docente.
Como se trata de uma parceria direta entre docente, não há modelo padrão da Universidade.
A definição do contrato é de responsabilidade dos partícipes.
Contrato segue para aprovação do departamento e da Diretoria da Unidade à qual o docente
está vinculado que verifica se o mesmo tem a autorização necessária para prestar este tipo de
serviço.

Observações:
A Habilitação Jurídica e a comprovação da Regularidade Fiscal são necessárias para celebração
de convênios e contratos.
Conforme normas da Universidade, apenas após aprovação dos contratos pela
Universidade/Empresa e assinaturas dos responsáveis o projeto pode ser iniciado.

MATHEMATICAL MODELLING OF INFECTION DYNAMICS

Osvaldo Anacleto

Course outline

Day 1 (Monday):

• Introduction to infectious disease modelling. Deterministic and stochastic compartmental models (Lecture and R tutorial)
• Introduction to probability distributions and counting processes
• Introduction to R (optional))

Day 2 (Tuesday):

• Introduction to statistical Inference and maximum likelihood estimation (Lecture and R tutorial)
• Frequentist inference for the basic reproduction ratio and stochastic epidemic models

Day 3 (Wednesday):

• Frequentist inference for basic reproduction ratio and design of transmission experiments (R tutorial and discussion)
• Introduction to Bayesian inference

Day 4 (Thursday): 

• Conjugate Bayesian analysis for the beta-binomial model (fish infection data) and for stochastic SIR models (Lecture and R tutorial)
• Introduction to MCMC, Gibbs sampling and Metropolis-Hastings algorithms (Lecture and interactive tutorial)
• Bayesian inference and MCMC for epidemics - example 1: basic reproduction ratio and stochastic epidemic models

Day 5 (Friday):

• Bayesian inference and MCMC for epidemics - example 2: the dynamic non-linear indirect genetic effects model
• Case study 1: a Bayesian non-linear hierarchical model for pig infection data (Lecture and R tutorial)

Day 6 (Saturday):

• Case study 2: Transmission experimental design and a Bayesian survival model for fish infection data
• Review of some course topics based on participants’ suggestions

 

AN INTRODUCTION TO DATA-DRIVEN MODELLING & GRAPH CLUSTERING

Dr. Dante Conti

9.3.1 Summary

Nowadays when society is immersed at the era of Information and Communication Technologies, the presence of massive data in different fields and real-world applications has encouraged the use of Data Mining, Machine Learning and Artificial Intelligence approaches aimed to discover and extract non-trivial information from databases. These novel approaches are the result of multidisciplinary researches and advances associated to Applied Mathematics, Statistics, Computer Sciences, Engineering and Physics. Someauthors mention the new era of Data Science and Data Scientists by referring to academic and professional profiles with skills focused on analytics, IT and multidisciplinary thinking to solve problems under the idea of knowledge discovery in databases.

Currently, the so-called data-driven models (DDM) are becoming more and more common.DDM is based on analysing the data about a system, in particular finding connections between the system state variables (input, internal and output variables) without explicit knowledge of the physical behaviour of the system. These methods represent large advances on conventional empirical modelling with many applications which include Finance, Marketing, Medicine, Management and Environmental Sciences and so on.

Job market is seeking for experts in Analytics. Most demanded profiles include mathematicians, statisticians and engineers. Some European and American universities already include data science and data modelling in their academic curricula for undergraduate and graduate programs in Applied Mathematics, Statistics and Systems Engineering and similar disciplines.

Data-driven modelling assumes the presence of a considerable and sufficient amount ofdata describing the underlying system. Data are used to perform basically tasks of classification, pattern recognition, associative & predictive analysis.

Under these premises, the objective of this course is to introduce students in data-driven modelling. A brief overview of the concepts and methodology will be presented. Also, the main methods will be described with the support of specialized software (in this case R: A language and environment for statistical computing). An emphasis on classification and clustering will be presented in order to solve two real problems where data-driven modelling has been implemented with successful results: (1) detecting consumption patterns in urban water networks and (2) graph analysis in flow networks – A case study in air transport.

The course is designed to interact directly with the participants. Two sessions of lectures arescheduled (about 6 hours). The rest of the time will be reserved to solve real-problems underthe basis of the Hydroinformatics application or/and the flow networks (graph theory) bysupporting and coaching the participants.

9.3.2 Prerequisites:

Participants should have attended some previous courses in Operations Research or Linear Programming, Basic Statistics and some knowledge in computer software (R) is advisable.

For those with no R knowledge, an introduction to this software is available at:

https://cran.r-project.org/doc/contrib/Paradis-rdebuts_en.pdf
http://ocw.mit.edu/courses/sloan-school-of-management/15-097-prediction-machinelearning-and-statistics-spring-2012/lecture-notes/MIT15_097S12_lec02.pdf
https://cran.r-project.org/web/views/MachineLearning.html

9.3.3 Software:

R: A language and environment for statistical computing
Available at:
https://cran.r-project.org/
Main packages to be used: igraph, igraphdata, randomForest, rpart, tree, e1071, Nbclust.

9.3.4 Scheduling:

9.3.4.1 Monday July 03th:Lecture 1

An introduction to Data-driven Modelling and main algorithms (3-4 hours). Afternoon (from 2 p.m. or 3 p.m.). Homework: some R examples andpresentation of the first problem related to Water consumption patterns: (Milan – Italy &London U.K.)

9.3.4.2 Tuesday July 04th: Lecture 2

Graph Theory and Graph Clustering: emphasis on shortest path applications and max-flow min-cut (3-4 hours). Afternoon (from 2 p.m. or 3 p.m.).Presentation of the second problem related to Air transport in US airports. Homework: Practice of igraph:
http://kateto.net/networks-r-igraph

9.3.4.3 From July 05th to 07th

Coaching for participants and solving of the proposed problems.Participants will be divided in groups in order to facilitate the solution of the problems. Myavailability will be from 9.00 a.m. till 7 p.m.

9.3.4.4 Saturday July 08th

Final reports and oral presentations.

9.3.5 Languages:

Presentations and coaching activities will be in Portuguese. Bibliography is 100% English.

9.3.6 Bibliography:

It is necessary and advisable to read (or at least, a quick review) the following paperswhich will be used all the week long:
1) Survey: Graph clustering by Satu Elisa Schaeffer. Available at:
http://www.leonidzhukov.net/hse/2016/networks/papers/GraphClustering_Schaeffer07.pdf
2) Data-driven modelling: some past experiences and new approaches by Dimitri P. Solomatine and AviOstfeld. Available at:
http://jh.iwaponline.com/content/ppiwajhydro/10/1/3.full.pdf
3) Predictive models for forecasting hourly urban water demand. By Manuel Herrera etal. Available at:
https://www.researchgate.net/publication/223694461_Predictive_models_for_forecasting_hourly_urban_water_demand_J_Hydrol_3871-2141-150
For further information, do not hesitate to contact me at:
Este endereço de email está sendo protegido de spambots. Você precisa do JavaScript ativado para vê-lo. or Este endereço de email está sendo protegido de spambots. Você precisa do JavaScript ativado para vê-lo.

MÉTODOS MULTI-ESCALA PARA A SIMULAÇÃO NUMÉRICA DE RESERVATÓRIOS DE PETRÓLEO

Professor: Luis Felipe Feres Pereira

9.2.1 Resumo:

Os reservatórios de petróleo localizados no pré-sal brasileiro são bastante profundos (podendo chegar a 1 Km de profundidade), em contraste com reservatórios usuais que possuem apenas alguns metros na direção vertical. A simulação numérica eficiente (rápida e precisa) de escoamentos multifásicos nos reservatórios grandes do pré-sal apresenta novos desafios (ligados aos problemas computacionais de grande porte) que não são resolvidos adequadamente por simuladores comerciais disponíveis no mercado. Estes simuladores, que foram desenvolvidos com o objetivo de realizar simulações numéricas de reservatórios consideravelmente menores do que os encontrados no pré-sal, são muito lentos quando utilizados em reservatórios de interesse para a indústria do petróleo brasileira. Simuladores devem fazer uso de métodos numéricos inovadores, capazes de tirar proveito de arquiteturas de última geração do tipo multicore, na simulação eficiente de problemas de recuperação de petróleo de grande porte.

Métodos numéricos multi-escala para problemas elípticos e parabólicos possuem potencial para tirar proveito de tais arquiteturas, pois problemas grandes são decompostos em diversos problemas menores que podem ser resolvidos em cores distintos. O desenvolvimento de simuladores para a indústria de petróleo que fazem uso de técnicas multi-escala é um tópico que tem atraído a atenção de diversos grupos de pesquisa. Mencionamos, por exemplo, os trabalhos recentes de [2,3]. No entanto, cabe ressaltar que nestes dois trabalhos os algoritmos não foram desenhados para processamento em paralelo.

O problema modelo para o desenvolvimento de técnicas multi-escala é a equação para pressão em escoamentos monofásicos em meios porosos. Sugerimos ao leitor a publicação [4] para referencias e também para uma comparação de vários procedimentos deste tipo desenvolvidos até 2008. Estes métodos utilizavam condições de fronteiras ad-hoc na construção de funções de base multi-escala. Desenvolvimentos mais recentes incluem [1,5,6,7], nos quais procedimentos mais precisos tem sido investigados. O grupo de pesquisa ligado ao Prof. Pereira fez uso de técnicas de decomposição de domínios no desenvolvimento do método MuMM (Multiscale Mixed Method, veja [1]) evitando assim o uso de condições de fronteira que geram imprecisões no cálculo da velocidade. No trabalho apresentado em [1] um algoritmo iterativo para a decomposição de domínios é definido, tirando proveito de malhas múltiplas e uma nova família de funções de base multi-escala. As novas funções de base são definidas para representar soluções discretas em subdomínios. Este procedimento apresenta algumas propriedades que devem ser ressaltadas:

A aproximação é localmente conservativa por conta da utilização de elementos finitos mistos. Coeficientes descontínuos (situação típica encontrada na simulação de reservatórios de petróleo) e termos de fonte podem ser considerados.

Três escalas de comprimento são introduzidas na definição do procedimento: a solução é procurada na escala mais fina; funções de base multi-escala são definidas nos subdomínios associados à maior das três escalas. A conservação do fluxo, indispensável para no estudo de escoamentos em meios porosos, é diretamente imposta em uma escala intermediária.

Se a maior e a menor escala coincidem então o novo método reproduz exatamente a solução por elementos finitos mistos na escala mais refinada.

O esquema iterativo entre subdomínios, que é baseado nas condições de interface de Robin impostas na escala intermediária, é de implementação simples.

O procedimento se adequa bem a unidades de processamento heterogêneas (CPU-GPU): todos os problemas locais podem ser eficientemente resolvidos em GPUs.

Os objetivos deste mini-curso são: (i) Apresentar uma introdução à modelagem de escoamentos multifásicos em meios porosos e (ii) Desenvolver software paralelo para o método multiescala MuMM, que se baseia em uma técnica de decomposição de domínio de [2].

9.2.2 Pré-requisitos:

Experiência com uma das seguintes linguagens de programação: C, C++ ou Fortran. Por exemplo, no caso da linguagem C, os alunos devem ter familiaridade com os primeiros 5 capítulos de [9]. Uma observação: Se você tem bons conhecimentos de MATLAB e deseja fazer este curso, com três ou quatro dias de trabalho você tem condições de entender o material citado do livro [9].

9.2.3 Ementa:

Os seguintes tópicos serão discutidos neste mini-curso:

1. Introdução a escoamentos em reservatórios de petróleo: escoamentos monofásicos e bifasicos
2. A pressão global para problemas bifásicos; Quebra de operadores
3. O problema elíptico
4. Discretização por elementos finitos mistos
5. O método de [8]
6. O método de [1]
7. Introdução a MPI, “messagepassing interface” (http://mpitutorial.com/tutorials/)
8. Desenvolvimento de códigos para processamento serial e em paralel

9.2.4 Programa para as aulas:

Aula #1: Serão discutidos os tópicos 1-6 da ementa.
Aula #2: Desenvolvimento de software para processamento serial.
Aulas #3-5: Tópico 7 da ementa. Desenvolvimento de software para processamento em paralelo.
Aula #6: Conclusão dos projetos e competição final. Serão outorgados prêmios para os dois códigos paralelos mais rápidos desenvolvidos no curso.

9.2.5 Arquivos:

9.2.6 Referências:

[1] A. Francisco, V. Ginting, F. Pereira, J. Rigelo, Design and Implementation of a Multiscale Mixed Method for Porous Media Flows, Mathematics and Computers in Simulation, 99, (2014) 125-138.
[2] H. Hajibeygi, H. Tchelepi, Compositional Mutiscale Finite-Volume Formulation SPE-163664-PA, SPE Journal, 2014.
[3] A. Kozlova, J. R. Natvig, S. Watanabe, Y. Zhou, K. Bratvedt, S. H. Lee, A Real-Field Multiscale Black-Oil Reservoir Simulator, SPE-173226-MS, 2015.
[4] V. Kippe, J. E. Aarnes and K. Lie, A comparison of multiscale methods for elliptic problems in porous media flows, Computational Geosciences, Vol. 12, Number 3, (2008) 377-398.
[5] Y. Efendiev, T. Hou, Multiscale finite element methods: theory and applications. Springer, (2009).
[6] M. Wheeler, T. Wildey and G. Xue, Efficient algorithms for multiscale modeling in porous media flows, Numer. Linear Algebra Appl., 17, (2010) 771-785.
[7] B. Ganis and I. Yotov, Implementation of a mortar mixed finite element method using a multiscale flux basis, Computer Methods in Applied Mechanics and Engineering, 198 (2009) 3989-3998.
[8] J. Douglas, Jr., P. J. PaesLeme, J. E. Roberts, and J. Wang, A parallel iterative procedure applicable to the approximate solution of second order partial differential equations by mixed finite element methods, Numer. Math., 65 (1993) 95--108.
[9] B. Kernighan and D. Richtie, The C Programming Language, 2nd Edition, Prentice Hall Software Series.

SCALING LIMITS OF MARKOV PROCESSES AND APPLICATIONS TO COMMUNICATION SYSTEMS

Matthieu Jonckheere

The constant technological evolution and developments in the area of telecommunication lead to challenging research questions regarding performance evaluation and design of actual and future communication systems. Stochastic networks are mathematical models describing a wide variety of high dimensional complex systems, seemingly of very different nature, from telecommunication and information systems to manufacturing environments. An in-depth understanding of their dynamics is of critical importance for many applications, e.g., the dimensioning and implementing efficient control schemes for a wide range of wireless networks. In particular, characterizing the stability region (set of parameters where the network can function properly) of large networks is both a complex theoretical problem and the most crucial benchmark of performance analysis.

However, the scale of the order of components of these systems often makes low-dimensional tools of classical queuing theory useless to obtain appropriate performance evaluation tools and design efficient algorithms. On the contrary, scaling methods that have a lot in common with mechanical statistics, particle systems or large random graphs might be of great help to deal with such high-dimensionality.

In each case, the effect of local interactions are studied at a macroscopic scale, raising drastically different behaviors depending on a small number of macroscopic parameters like temperature and pressure, which can be translated for communication and information networks in terms of probability of transmissions and density of users. Another important component of many communication systems is the random locations of the components. An interesting line of research combines stochastic geometry and scaling techniques.

We provide here an introduction to various scaling techniques intervening in the analysis of stochastic networks and random graphs, allowing to connect the analysis and optimisation of very complex stochastic systems to simpler ones (deterministic dynamical systems or diffusions). 

The course is designed to interact directly with the participants. Three sessions of lectures are scheduled (about 12 hours). The rest of the time will be reserved to solve networking problems by supporting and coaching the participants.

9.1.1 Scheduling:

Lecture 1 – An introduction to Markov processes and their scaling limits via martingales.
One dimensional examples: MM1 and MMinfinity.(4 hours).
Homework: some matlab examples of functional law of large numbers and diffusions approximations of MM1 and MMinfinity.
Lecture 2 – Multidimensional examples. Jackson networks.
Averaging principles. Connections with stability analysis.
Presentation of the problem of optimizing the transmission of a downlink wireless base station. Asymptotically optimal policies. (4 hours)
Home work: Code a two-dimensional example.
Lecture 3. Mean-field scaling limits. Principle and examples.
Presentation of a last example on communication on random graphs. (3 hours)
Home work: simulation of random graphs and exploration processes.
Lecture 4: questions and answers on the examples considered.(3 hours)

Languages: Presentations and coaching activities will be in english.

9.1.2 Bibliography

1) Markov Chains: Gibbs Fields, Monte Carlo Simulation, and Queues, P. Brémaud Springer
2) Convergence of Markov processes, notes, M. Hairer,
3) Markov chains and stochastic stability, S. Meyn and R. Tweedie,
4) Cambridge Stochastic networks and queues, Ph. Robert Springer

Study Groups

Histórico e Objetivos

A qualidade da pesquisa em Ciências Matemáticas (CM) no Brasil é considerada de muito bom nível, como atestam a recente concessão de uma medalha Fields para um brasileiro ou a classificação do Brasil como nível IV na IMU (International Mathematical Union). No entanto, essa pesquisa tem cunho quase que exclusivamente acadêmico. Várias experiências em países desenvolvidos atestam que as Ciências Matemáticas podem contribuir de maneira decisiva para a inovação, geração de novos conhecimentos e tecnologias e agregar valor a produtos e processos (Relatório Deloitte sobre o Benefício Econômico da Pesquisa em Matemática na Inglaterra).

No CEPID-CeMEAI nos propusemos a modificar essa realidade promovendo contacto com problemas industriais por meio dos workshops com a indústria que realizamos periodicamente. É bastante comum em outros centros, por exemplo, no OCIAM em Oxford, realizar-se uma Escola de modelagem na semana anterior ao Workshop para proporcionar aos alunos de Pós-graduação, como treinamento para o evento da semana posterior. Nessa Escola são apresentados problemas reais já estudados em ocasiões anteriores para os quais se tem uma boa base de conhecimento e os alunos trabalham durante uma semana, guiados pelo tutor na solução ou estudo desses problemas. Com isso espera-se que esses alunos estejam mais bem preparados para o workshop a seguir e possam contribuir de maneira efetiva para a solução dos problemas reais a serem trabalhados. (Outros Study Groups with Industry no mundo)

 

NOTÍCIAS RELACIONADAS 
 
 

Scriptlattes

MODELAGEM ESTOCÁSTICA E QUANTIFICAÇÃO DE INCERTEZAS

Rubens Sampaio


Trata-se de um curso de uma semana. Uma parte das aulas serão teóricas, e outras de exercícios. Os alunos tomaram parte ativa fazendo exercicios e apresentações de alguns artigos escolhidos. Dois livros de Notas de Matematica Aplicada da SBMAC serão usados como texto.

1. Motivação. Conceito de evento e probabilidade. Independência. Exemplos.

2. Espaço de probabilidades. Probabilidade discreta e enumerável. Regras de contagem. Caminhos aleatórios.

3. Variáveis aleatórias inteiras. Esperança. Momentos. Variáveis aleatórias reais. Processos estocásticos.

4. Probabilidade Condicional. Convergência de sequências de variáveis aleatórias. Desigualdades.

5. Geração de variáveis aleatórias e método de Monte Carlo. Simulações com Matlab.

6. Estatísticas e distribuição normal. Teorema do limite central. Lei dos grandes números.

7. Processos de Poisson. Confiabilidade.

8. Entropia e Informação. Princípio do máximo de entropia.

9. Cadeias de Markov. MCMC

9.4.1 Referências

[1] Geoffrey Grimmett and DominicWelsh Probability: an introduction Claredon Press, Oxford, 1986.
[2] José Eduardo Souza de Cursi e Rubens Sampaio Modelagem Estocástica e Quantificação de Incertezas Notas de Matematica Aplicada da SBMAC, volume 66
[3] R. Sampaio e R. Lima Modelagem estocástica e geração de amostras de variáveis e vetores aleatórios Notas em Matemática Aplicada da SBMAC, volume 70

Voltar para a Escola de Matemática Aplicada

AN INTRODUCTION TO DATA-DRIVEN MODELLING & GRAPH CLUSTERING

Dr. Dante Conti

9.3.1 Summary

Nowadays when society is immersed at the era of Information and Communication Technologies, the presence of massive data in different fields and real-world applications has encouraged the use of Data Mining, Machine Learning and Artificial Intelligence approaches aimed to discover and extract non-trivial information from databases. These novel approaches are the result of multidisciplinary researches and advances associated to Applied Mathematics, Statistics, Computer Sciences, Engineering and Physics. Some authors mention the new era of Data Science and Data Scientists by referring to academic and professional profiles with skills focused on analytics, IT and multidisciplinary thinking to solve problems under the idea of knowledge discovery in databases.
Currently, the so-called data-driven models (DDM) are becoming more and more common. DDM is based on analysing the data about a system, in particular finding connections between the system state variables (input, internal and output variables) without explicit knowledge of the physical behaviour of the system. These methods represent large advances on conventional empirical modelling with many applications which include Finance, Marketing, Medicine, Management and Environmental Sciences and so on.
Job market is seeking for experts in Analytics. Most demanded profiles include mathematicians, statisticians and engineers. Some European and American universities already include data science and data modelling in their academic curricula for undergraduate and graduate programs in Applied Mathematics, Statistics and Systems Engineering and similar disciplines.
Data-driven modelling assumes the presence of a considerable and sufficient amount of data describing the underlying system. Data are used to perform basically tasks of classification, pattern recognition, associative & predictive analysis.
Under these premises, the objective of this course is to introduce students in data-driven
modelling. A brief overview of the concepts and methodology will be presented. Also, the main methods will be described with the support of specialized software (in this case R: A language and environment for statistical computing). An emphasis on classification and clustering will be presented in order to solve two real problems where data-driven modelling has been implemented with successful results: (1) detecting consumption patterns in urban water networks and (2) graph analysis in flow networks – A case study in air transport.
The course is designed to interact directly with the participants. Two sessions of lectures are scheduled (about 6 hours). The rest of the time will be reserved to solve real-problems under the basis of the Hydroinformatics application or/and the flow networks (graph theory) by supporting and coaching the participants.

9.3.2 Prerequisites:

Participants should have attended some previous courses in Operations Research or Linear Programming, Basic Statistics and some knowledge in computer software (R) is advisable.
For those with no R knowledge, an introduction to this software is available at:
https://cran.r-project.org/doc/contrib/Paradis-rdebuts_en.pdf
http://ocw.mit.edu/courses/sloan-school-of-management/15-097-prediction-machinelearning-and-statistics-spring-2012/lecture-notes/MIT15_097S12_lec02.pdf
https://cran.r-project.org/web/views/MachineLearning.html

9.3.3 Software:

R: A language and environment for statistical computing
Available at:
https://cran.r-project.org/

Main packages to be used: igraph, igraphdata, randomForest, rpart, tree, e1071, Nbclust.

9.3.4 Scheduling:

9.3.4.1 Monday July 04th:Lecture 1

An introduction to Data-driven Modelling and main algorithms (3-4 hours). Afternoon (from 2 p.m. or 3 p.m.). Homework: some R examples and presentation of the first problem related to Water consumption patterns: (Milan – Italy & London U.K.)

9.3.4.2 Tuesday July 05th: Lecture 2

Graph Theory and Graph Clustering: emphasis on shortest path applications and max-flow min-cut (3-4 hours). Afternoon (from 2 p.m. or 3 p.m.). Presentation of the second problem related to Air transport in US airports. Homework: Practice of igraph:
http://kateto.net/networks-r-igraph

9.3.4.3 From July 06th to 08th

Coaching for participants and solving of the proposed problems. Participants will be divided in groups in order to facilitate the solution of the problems. My availability will be from 9.00 a.m. till 7 p.m.

9.3.4.4 Saturday July 09th

Final reports and oral presentations.

9.3.5 Languages:

Presentations and coaching activities will be in Portuguese. Bibliography is 100% English.

9.3.6 Bibliography:

It is necessary and advisable to read (or at least, a quick review) the following papers which will be used all the week long:

1) Survey: Graph clustering by Satu Elisa Schaeffer. Available at:
http://www.leonidzhukov.net/hse/2016/networks/papers/GraphClustering_Schaeffer07.pdf

2) Data-driven modelling: some past experiences and new approaches by Dimitri P. Solomatine and Avi Ostfeld. Available at:
http://jh.iwaponline.com/content/ppiwajhydro/10/1/3.full.pdf

3) Predictive models for forecasting hourly urban water demand. By Manuel Herrera et al. Available at:
https://www.researchgate.net/publication/223694461_Predictive_models_for_forecasting_hourly_urban_water_demand_J_Hydrol_3871-2141-150

Voltar para a Escola de Matemática Aplicada

Página 1 de 6