Dr. Achim Reineke · • PCs, Laptops und Untersuchungsgeräte in den einzelnen Studienzentren •...
Transcript of Dr. Achim Reineke · • PCs, Laptops und Untersuchungsgeräte in den einzelnen Studienzentren •...
![Page 1: Dr. Achim Reineke · • PCs, Laptops und Untersuchungsgeräte in den einzelnen Studienzentren • Zentraler Datenaufbereitungs- und Auswertungsserver (Central Data Server, CDS) für:](https://reader035.fdocument.pub/reader035/viewer/2022071018/5fd26058e6b0927d5b2c9e08/html5/thumbnails/1.jpg)
1
Dr. Achim ReinekeLeibniz-Institut für Präventionsforschung und Epidemiologie – BIPS
- on behalf of the I.Family consortium
5. Workshop AK-ForschungsdatenBerlin, 28.06.2016
![Page 2: Dr. Achim Reineke · • PCs, Laptops und Untersuchungsgeräte in den einzelnen Studienzentren • Zentraler Datenaufbereitungs- und Auswertungsserver (Central Data Server, CDS) für:](https://reader035.fdocument.pub/reader035/viewer/2022071018/5fd26058e6b0927d5b2c9e08/html5/thumbnails/2.jpg)
2
Studie(n)Einleitung
www.ifamilystudy.eu
![Page 3: Dr. Achim Reineke · • PCs, Laptops und Untersuchungsgeräte in den einzelnen Studienzentren • Zentraler Datenaufbereitungs- und Auswertungsserver (Central Data Server, CDS) für:](https://reader035.fdocument.pub/reader035/viewer/2022071018/5fd26058e6b0927d5b2c9e08/html5/thumbnails/3.jpg)
3
• Multizentrische Follow-Up-Studie
• Ziel: Erforschung von Einflussfaktoren auf das Ernährungsverhalten europäischer Kinder, Jugendlicher und ihrer Eltern
• 2013: Start der Erhebung
• Über 2000 Variablen bei mehr als 17.000 Probanden
• BIPS als Koordinator
Beschreibung I.FamilyEinleitung
![Page 4: Dr. Achim Reineke · • PCs, Laptops und Untersuchungsgeräte in den einzelnen Studienzentren • Zentraler Datenaufbereitungs- und Auswertungsserver (Central Data Server, CDS) für:](https://reader035.fdocument.pub/reader035/viewer/2022071018/5fd26058e6b0927d5b2c9e08/html5/thumbnails/4.jpg)
4
PartnerEinleitung
Partner:
• Strovolos, Cyprus • Ghent, Belgium• Copenhagen, Denmark • Tallin, Estonia• Helsinki, Finland• Bremen, Germany• Pécs, Hungary• Avellino, Italy• Milan, Italy• Utrecht, Netherlands• Palma de Mallorca, Spain• Zaragoza, Spain• Gothenburg, Sweden• Bristol, United Kingdom• Lancaster, United Kingdom• Monxton, United Kingdom
![Page 5: Dr. Achim Reineke · • PCs, Laptops und Untersuchungsgeräte in den einzelnen Studienzentren • Zentraler Datenaufbereitungs- und Auswertungsserver (Central Data Server, CDS) für:](https://reader035.fdocument.pub/reader035/viewer/2022071018/5fd26058e6b0927d5b2c9e08/html5/thumbnails/5.jpg)
5
• T3: Follow-up der Index-Kinder (mit Geschwistern und Eltern)
• CG: Zusätzliche Untersuchungen in den Contrasting Groups/ und Untergruppen
TimelineEinleitung
IDEFICS I.FamilyT0 T1 T3T2
CG
2007 2008 2009 2010 2011 2012 2013 2014 2015 2016 20172006
Today
![Page 6: Dr. Achim Reineke · • PCs, Laptops und Untersuchungsgeräte in den einzelnen Studienzentren • Zentraler Datenaufbereitungs- und Auswertungsserver (Central Data Server, CDS) für:](https://reader035.fdocument.pub/reader035/viewer/2022071018/5fd26058e6b0927d5b2c9e08/html5/thumbnails/6.jpg)
6
• Fragebögen (Eltern + Kind) • Medienkonsum, soziales Umfeld,
Lebensstil
• Medizinische Vorgeschichte, Medikamente
• Ernährungsgewohnheiten, Ernährungsprotokoll
• Körperliche Aktivität
• 24-Std Ernährungsprotokoll• SACANA: web-basierter „24-h
dietary recall“
• Bewegungsverhalten• Accelerometer: 7 Tage
Instrumente
![Page 7: Dr. Achim Reineke · • PCs, Laptops und Untersuchungsgeräte in den einzelnen Studienzentren • Zentraler Datenaufbereitungs- und Auswertungsserver (Central Data Server, CDS) für:](https://reader035.fdocument.pub/reader035/viewer/2022071018/5fd26058e6b0927d5b2c9e08/html5/thumbnails/7.jpg)
7
• Ärztl. Untersuchung• Anthropometrie + Blutdruck
• Muskuloskelettale Störungen
• Bioproben• Blut, Speichel, Urin
• Add-ons, z.B.• Körperliche Fitness
• Geschmackssensorik
• Bebaute Umgebung: GIS + GPS
• Auswirkung von Lebensmittelwerbung
• Neuropsychologische Tests
Untersuchungen und Messungen
![Page 8: Dr. Achim Reineke · • PCs, Laptops und Untersuchungsgeräte in den einzelnen Studienzentren • Zentraler Datenaufbereitungs- und Auswertungsserver (Central Data Server, CDS) für:](https://reader035.fdocument.pub/reader035/viewer/2022071018/5fd26058e6b0927d5b2c9e08/html5/thumbnails/8.jpg)
8
• Erhebung in acht Zentren • In verschiedenen Ländern
• In unterschiedlichen Sprachen
• Konzeption der Instrumente erfolgte durch die jeweiligen Experten im Konsortium
• Umsetzung der Instrumente in Datenbanken (Datenbankapplikationen) und Eingabewerkzeuge erfolgte zentral durch das BIPS
• Datenmanagement erfolgt zentral
Erhebung der DatenDatenmanagement
![Page 9: Dr. Achim Reineke · • PCs, Laptops und Untersuchungsgeräte in den einzelnen Studienzentren • Zentraler Datenaufbereitungs- und Auswertungsserver (Central Data Server, CDS) für:](https://reader035.fdocument.pub/reader035/viewer/2022071018/5fd26058e6b0927d5b2c9e08/html5/thumbnails/9.jpg)
9
Datentransfer IDEFICS I
BIPS
Interne Projekt-Web-Plattform
Studien-zentrum
![Page 10: Dr. Achim Reineke · • PCs, Laptops und Untersuchungsgeräte in den einzelnen Studienzentren • Zentraler Datenaufbereitungs- und Auswertungsserver (Central Data Server, CDS) für:](https://reader035.fdocument.pub/reader035/viewer/2022071018/5fd26058e6b0927d5b2c9e08/html5/thumbnails/10.jpg)
10
Datentransfer IDEFICS II
Dateneingabe
BIPSStudien-zentrum
Interne Projekt-Web-Plattform
![Page 11: Dr. Achim Reineke · • PCs, Laptops und Untersuchungsgeräte in den einzelnen Studienzentren • Zentraler Datenaufbereitungs- und Auswertungsserver (Central Data Server, CDS) für:](https://reader035.fdocument.pub/reader035/viewer/2022071018/5fd26058e6b0927d5b2c9e08/html5/thumbnails/11.jpg)
11
Datentransfer IDEFICS III
?
Interne Projekt-Web-Plattform
BIPS Studienzentrum
?
![Page 12: Dr. Achim Reineke · • PCs, Laptops und Untersuchungsgeräte in den einzelnen Studienzentren • Zentraler Datenaufbereitungs- und Auswertungsserver (Central Data Server, CDS) für:](https://reader035.fdocument.pub/reader035/viewer/2022071018/5fd26058e6b0927d5b2c9e08/html5/thumbnails/12.jpg)
12
• Große Arbeitsbelastung durch Austausch der Datenbanken und der Daten� Doppelte Datensätze (mehrfach erfasst / Kopie der
Eingabedatenbank) bzw. Testdatensätze mit ungültigen IDs
� Verwendung alter Versionen der Eingabedatenbanken
• Probleme durch verzögerte Entwicklung einiger Instrumente� Verfügbare Zeit für die Programmierung und Verteilung aller
Datenbanken reichte nicht aus
� Dateneingabe konnte für einige Instrumente erst mit einigen Wochen Verzögerung gestartet werden
• Verzögerung nach dem Ende der Feldphase bis zur Verfügbarkeit des ersten bereinigten Datensatzes
Probleme in IDEFICS
![Page 13: Dr. Achim Reineke · • PCs, Laptops und Untersuchungsgeräte in den einzelnen Studienzentren • Zentraler Datenaufbereitungs- und Auswertungsserver (Central Data Server, CDS) für:](https://reader035.fdocument.pub/reader035/viewer/2022071018/5fd26058e6b0927d5b2c9e08/html5/thumbnails/13.jpg)
13
• PCs, Laptops und Untersuchungsgeräte in den einzelnen Studienzentren
• Zentraler Datenaufbereitungs- und Auswertungsserver (Central Data Server, CDS) für:• Dateneingabe (mit Prüfeingabe)
• Upload (automatisch) der gesammelten (Mess-)Daten
• Plausibilitätsprüfungen
• Datenaufbereitung
• Datenanalyse
�Lokale Verarbeitung der personenidentifizierenden Daten (Name, Adresse, …) in den Zentren
I.Family Datenmanagement-InfrastrukturDatenmanagement
![Page 14: Dr. Achim Reineke · • PCs, Laptops und Untersuchungsgeräte in den einzelnen Studienzentren • Zentraler Datenaufbereitungs- und Auswertungsserver (Central Data Server, CDS) für:](https://reader035.fdocument.pub/reader035/viewer/2022071018/5fd26058e6b0927d5b2c9e08/html5/thumbnails/14.jpg)
14
Datentransfer I.Family I
BIPS Studienzentrum
CDS
![Page 15: Dr. Achim Reineke · • PCs, Laptops und Untersuchungsgeräte in den einzelnen Studienzentren • Zentraler Datenaufbereitungs- und Auswertungsserver (Central Data Server, CDS) für:](https://reader035.fdocument.pub/reader035/viewer/2022071018/5fd26058e6b0927d5b2c9e08/html5/thumbnails/15.jpg)
15
Datentransfer I.Family II
Dateneingabe
CDS
BIPS Studienzentrum
![Page 16: Dr. Achim Reineke · • PCs, Laptops und Untersuchungsgeräte in den einzelnen Studienzentren • Zentraler Datenaufbereitungs- und Auswertungsserver (Central Data Server, CDS) für:](https://reader035.fdocument.pub/reader035/viewer/2022071018/5fd26058e6b0927d5b2c9e08/html5/thumbnails/16.jpg)
16
• Eingabe, Prüfung und Korrektur erfolgt direkt auf dem CDS
• Daten von Messgeräten wurden automatisch auf den CDS hochgeladen• Vorbereitete Kopier- und Archivierungsprogramme
�Vorteile• Sämtliche Daten stehen kurzfristig auf dem CDS zur Verfügung
→ keine gesammelte Lieferung am Ende der Studie
• Konsistenz und Plausibilitätsprüfungen können sowohl die eingegeben Daten als auch die Messdaten umfassen (Crosschecks)
• Zeitnahe Rückmeldungen an die Partner möglich
Datentransfer I.Family III
![Page 17: Dr. Achim Reineke · • PCs, Laptops und Untersuchungsgeräte in den einzelnen Studienzentren • Zentraler Datenaufbereitungs- und Auswertungsserver (Central Data Server, CDS) für:](https://reader035.fdocument.pub/reader035/viewer/2022071018/5fd26058e6b0927d5b2c9e08/html5/thumbnails/17.jpg)
17
Datenverarbeitung
![Page 18: Dr. Achim Reineke · • PCs, Laptops und Untersuchungsgeräte in den einzelnen Studienzentren • Zentraler Datenaufbereitungs- und Auswertungsserver (Central Data Server, CDS) für:](https://reader035.fdocument.pub/reader035/viewer/2022071018/5fd26058e6b0927d5b2c9e08/html5/thumbnails/18.jpg)
18
• Heterogener Datenkörper: • Befragungsdaten
• Daten aus ärztl. Untersuchung
• Messdaten (Accelerometer, GPS, fMRT)
• Bioproben
• Volumen: • 500 MB Befragungsdaten (pro Snapshot)
• 250 GB Accelerometerdaten
• Zusammenfassung zu einen Core-Dataset
• Regelmäßige Bereitstellung von bereinigten Auswertungsdatensätzen (Snapshots)
Datenkörper
![Page 19: Dr. Achim Reineke · • PCs, Laptops und Untersuchungsgeräte in den einzelnen Studienzentren • Zentraler Datenaufbereitungs- und Auswertungsserver (Central Data Server, CDS) für:](https://reader035.fdocument.pub/reader035/viewer/2022071018/5fd26058e6b0927d5b2c9e08/html5/thumbnails/19.jpg)
19
• Informationen zu einzelnen Objekten (Codebook, annotierter Fragebogen, Datensatzbeschreibung, … )• Beschreibung
• Quelle (Instrument, Zeitpunkt)
• Wertebereiche
• Algorithmus / Verfahren der Berechnung
• Änderungshistorie zu einzelnen Objekten
• Änderungshistorie zu den Analysedatensätzen
Dokumentation
![Page 20: Dr. Achim Reineke · • PCs, Laptops und Untersuchungsgeräte in den einzelnen Studienzentren • Zentraler Datenaufbereitungs- und Auswertungsserver (Central Data Server, CDS) für:](https://reader035.fdocument.pub/reader035/viewer/2022071018/5fd26058e6b0927d5b2c9e08/html5/thumbnails/20.jpg)
20
• Studienzentren• Kontaktierung der Probanden (personenidentifizierende Daten)
• Datenerhebung
• Dateneingabe / Upload
• Datenkorrekturen / Abgleich mit Originaldaten (Fragebogen)
• Koordinierendes Zentrum (BIPS)• Bereitstellung der gemeinsam genutzten Infrastruktur
• Definition und Koordination der Datenverarbeitungsprozesse
• Plausibilitäts- und Konsistenzprüfungen
• Speicherung (und später Archivierung) der Daten
• Bereitstellung der Daten für Analysen
Organisation / Rollenverteilung
![Page 21: Dr. Achim Reineke · • PCs, Laptops und Untersuchungsgeräte in den einzelnen Studienzentren • Zentraler Datenaufbereitungs- und Auswertungsserver (Central Data Server, CDS) für:](https://reader035.fdocument.pub/reader035/viewer/2022071018/5fd26058e6b0927d5b2c9e08/html5/thumbnails/21.jpg)
21
• Studienzentren• Wissenschaftliche Team
• Erhebungskräfte
• Lokale IT
• Koordinierendes Zentrum (BIPS)• Medizinische Dokumentare (Datenbanken, Datenmanagement)
• Mitarbeiter aus den statistischen Fachgruppen ( Plausibilitätsprüfungen)
• IT (Betrieb des CDS, Upload-Programme, …)
Organisation / Rollenverteilung II
![Page 22: Dr. Achim Reineke · • PCs, Laptops und Untersuchungsgeräte in den einzelnen Studienzentren • Zentraler Datenaufbereitungs- und Auswertungsserver (Central Data Server, CDS) für:](https://reader035.fdocument.pub/reader035/viewer/2022071018/5fd26058e6b0927d5b2c9e08/html5/thumbnails/22.jpg)
22
• Für alle Partner erreichbar
• Verfügbar
• Ausreichend dimensioniert (Speicher / Leistung)
• Bereitstellung benötigter Funktionalitäten (Software)
• Gesicherte Kommunikation / Zugriffskontrolle• Zugang über VPN
• Vergabe von Benutzerkennungen und Passwörtern
• Definition von Verfahren zur Vergabe der Zugriffsberechtigungen
• Anleitungen und Vorgaben für die Nutzung
�Sonderregelungen für HPC-Cluster für Genomanalysen
Anforderungen an den CDS
![Page 23: Dr. Achim Reineke · • PCs, Laptops und Untersuchungsgeräte in den einzelnen Studienzentren • Zentraler Datenaufbereitungs- und Auswertungsserver (Central Data Server, CDS) für:](https://reader035.fdocument.pub/reader035/viewer/2022071018/5fd26058e6b0927d5b2c9e08/html5/thumbnails/23.jpg)
23
• Standardsoftware auf dem CDS (englische Versionen)• MS Office / MS Access
• SAS / SPSS / STATA / R
• MySQL
• Spezialsoftware (ArcGis, Nährwertberechnung, …)
• Datenaufbereitungs- und Datenmanagementprogramme
• Konvention zur Nutzung von UTF-8 als Kodierung für Dateien
Software / Umgebung
![Page 24: Dr. Achim Reineke · • PCs, Laptops und Untersuchungsgeräte in den einzelnen Studienzentren • Zentraler Datenaufbereitungs- und Auswertungsserver (Central Data Server, CDS) für:](https://reader035.fdocument.pub/reader035/viewer/2022071018/5fd26058e6b0927d5b2c9e08/html5/thumbnails/24.jpg)
24
• Vergabe mehrerer IDs pro Individuum (IDEFICS-ID, I.Fam-ID, Familien-ID, Bioproben-IDs, …)
• Vorgabe der Struktur und der gültigen Bereiche (pro Zentrum) durch das BIPS
• Aufbau der IDsStelle 1 - Studie
Stelle 2 - Land
Stelle 3 - Region
Stelle 4 bis n - Proband
• Zuordnung der IDs zu realen Probanden verbleibt im jeweiligen Studienzentrum
Vergabe der IDs
![Page 25: Dr. Achim Reineke · • PCs, Laptops und Untersuchungsgeräte in den einzelnen Studienzentren • Zentraler Datenaufbereitungs- und Auswertungsserver (Central Data Server, CDS) für:](https://reader035.fdocument.pub/reader035/viewer/2022071018/5fd26058e6b0927d5b2c9e08/html5/thumbnails/25.jpg)
25
• Kontrolle der Datennutzung durch projektübergreifendes Gremium
• Austausch ist begrenzt auf pseudonymisierte Daten
• Alle Partner kommen aus Ländern der EU
• Bereitstellung zur Nutzung für die nächsten X Jahre
• Anschließend Archivierung für 10 Jahre gem. GEP
Nutzung und Bereitstellung der Daten
![Page 26: Dr. Achim Reineke · • PCs, Laptops und Untersuchungsgeräte in den einzelnen Studienzentren • Zentraler Datenaufbereitungs- und Auswertungsserver (Central Data Server, CDS) für:](https://reader035.fdocument.pub/reader035/viewer/2022071018/5fd26058e6b0927d5b2c9e08/html5/thumbnails/26.jpg)
26
• Gesamtprojekt: 13 Millionen Euro zuzüglich weiterer Eigenanteile der Partner1. Erhebung der Daten in der Feldphase
2. Erstellung der notwendigen Datenbanken etc.
3. Datenaufbereitung / Datenkorrekturen
4. Betrieb des CDS (Hardware, Lizenzen und Personal)
• Zusätzliche Kosten für Internationalisierung• Berücksichtigung der lokalen Gegebenheiten und Vorgaben
• Mehrsprachigkeit der Werkzeuge
• Aufwand für Erstellung der Dokumentationen
• Kommunikation
Kosten
![Page 27: Dr. Achim Reineke · • PCs, Laptops und Untersuchungsgeräte in den einzelnen Studienzentren • Zentraler Datenaufbereitungs- und Auswertungsserver (Central Data Server, CDS) für:](https://reader035.fdocument.pub/reader035/viewer/2022071018/5fd26058e6b0927d5b2c9e08/html5/thumbnails/27.jpg)
Kontakt
www.bips.eu
Leibniz-Institut für Präventionsforschung und Epidemiologie – BIPS
Achterstraße 3028359 Bremen
Vielen Dank für IhreAufmerksamkeit
Achim Reineke