Westfälische Wilhelms-Universität Münster Diploma thesis Master of Science in Geospatial technologies SDAR: A Package for Plotting and Analyzing Stratigraphy Data in R John Ortiz Münster, February 26, 2015 1st supervisor: Prof. Dr. Edzer Pebesma, Institute for Geoinformatics, University of Münster 2nd supervisor: Prof. Dr. Sébastien Castelltort, Department of Earth Sciences, University of Geneva 3rd supervisor: Prof. Dr. Jorge Mateu, Department of Mathematics, University Jaume I [This page intentionally left blank] Abstract Stratigraphic Columns (SC) are the most useful and common ways to repre- sent the field descriptions (e.g., grain size, thickness of rock packages, and fossil and lithological components) of rock sequences and well logs. In these representa- tions the width of SC vary according to the grain size (i.e., the wider the strata, the coarser the rocks (Miall 1990; Tucker 2011)), and the thickness of each layer is represented at the vertical axis of the diagram. Typically these representa- tions are drawn ’manually’ using vector graphic editors (e.g., Adobe Illustrator® , CorelDRAW® , Inskape). Nowadays there are various software which automati- cally plot SCs, but there are not versatile open-source tools and it is very difficult to both store and analyse stratigraphic information. This document presents Stratigraphic Data Analysis in R (SDAR), an analyti- cal package1 designed for both plotting and facilitate the analysis of Stratigraphic Data in R (R Core Team 2014). SDAR, uses simple stratigraphic data and takes advantage of the flexible plotting tools available in R to produce detailed SCs. The main benefits of SDAR are: (i) used to generate accurate and complete SC plot including multiple features (e.g., sedimentary structures, samples, fossil content, color, structural data, contacts between beds), (ii) developed in a free software environment for statistical computing and graphics, (iii) run on a wide variety of platforms (i.e., UNIX, Windows, and MacOS), (iv) both plotting and analysing functions can be executed directly on R’s command-line interface (CLI), conse- quently this feature enables users to integrate SDAR’s functions with several oth- ers add-on packages available for R from The Comprehensive R Archive Network (CRAN). Keywords: Quantitative Stratigraphy, Stratigraphic log, R package, Geosciences software. 1 A package is a collection of functions and programs that can be used within R (Braun and Murdoch 2014). Zusammenfassung Stratigraphische Profile (Stratigraphic Column, SC ) sind die hilfreichsten und üblichsten Methoden, um die stratigraphischen und sedimentologischen Beschrei- bungen (z.B. Korngröße, der Schichtmächtigkeit, fossilen und lithologischen Kom- ponenten) von stratigraphischen Folgen und Bohrlog darzustellen. In diesen Darstel- lungen verändert sich die Breite von SC je nach Korngröße (d.h., je grobkörniger das klastische Sediment ist, desto breiter ist die Darstellung der Schicht) während die vertikale Achse die Dicke jeder Schicht dargestellt. Typischerweise sind diese Darstellungen ’manuell’ mit Vektor-Grafik-Editoren (z.B. Adobe Illustrator® , Corel DRAW® , Inkscape) abgebildet. Es gibt Sofwaren um SCs automatisch zu plot- ten, aber sie sind keine vielseitig verwendbaren Open-Source Arbeitsgeräte und es ist sehr schwierig mit ihnen stratigraphische Informationen zu speichern und zu analysieren. Dieses Arbeit zeigt stratigraphische Datenanalyse in R (Stratigraphich Data Analyisis; SDAR), ein analytisches Paket, welches für das Plotten und Analysieren stratigraphischer Daten in R konzipiert ist. SDAR verwendet und nutzt die für das Plotten verfügbaren Tools auf R, um detaillierte SCs darzustellen. Der Hauptvorteil von SDAR ist: (i) Es ist möglich genaue und vollständige SCs mit mehreren erzeugten Funktionen (z.B. Sedimentstrukturen, Proben, Fossilienge- halt, Farbe, Beschreibung von geologischen Strukturen, Kontakte zwischen den Schichten) zu machen, (ii) Es ist in einer freien Software-Umgebung für statistis- che Berechnungen und Grafik entwickelt, (iii) Es läuft auf verschiedenen Plattfor- men (d.h. UNIX, Windows und MacOS), (iv) Die Plott- und Analysefunktionen können direkt am R Command Line Interface (CLI) ausgeführt werden, damit können die Benutzer Funktionen von SDAR mit anderen Zusatzpaketen für R aus The Comprehensive R Archive Network (CRAN) integrieren. ii Declaration I hereby certify that this diploma thesis ”SDAR: A Package for Plotting and Analyzing Stratigraphy Data in R” contains no material which has been accepted for the award of any other degree or diploma in my name, in any university or other tertiary institution and, to the best of my knowledge an

