, um zu prüfen, ob Sie einen Vollzugriff auf diese Publikation haben.
Monographie Kein Zugriff

Compression of DNA Sequencing Data

Autor:innen:
Verlag:
 2022

Zusammenfassung

Mit der Einführung der neuesten Generationen von Sequenziermaschinen sind die Kosten für die Sequenzierung eines menschlichen Genoms auf weniger als 1.000 US-Dollar gesunken. Es wird prognostiziert, dass die Menge der Sequenzierungsdaten bald die Menge anderer Datentypen, wie z.B. Videodaten, übersteigen wird. Daher werden in dieser Arbeit drei neue Datenkompressionsverfahren zur Verbesserung der Speicherung, Übertragung und Verarbeitung von Sequenzierungsdaten vorgestellt. Die drei Verfahren beschäftigen sich mit der Komprimierung von Sequenzfragmenten, der Quantisierung und Komprimierung von Sequenzierungs-Qualitätswerten, sowie der MPEG-G-konformen Entropiecodierung von Sequenzierungsdaten. Im Vergleich zum Stand der Technik erzielen die Verfahren in separaten Experimenten die jeweils besten Ergebnisse. Abschließend wird die Integration der vorgeschlagenen Verfahren in den MPEG-G-Standard diskutiert

C O N T E N T S

1 introduction 1

1.1 Motivation . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2

1.2 State of the Art and Contributions . . . . . . . . . . . . . . 7

1.2.1 Compression of Aligned Reads . . . . . . . . . . . 7

1.2.2 Compression of Quality Scores . . . ...

Schlagworte


Publikation durchsuchen


Bibliographische Angaben

Copyrightjahr
2022
ISBN-Print
978-3-18-387810-9
ISBN-Online
978-3-18-687810-6
Verlag
VDI Verlag, Düsseldorf
Reihe
Informatik/ Kommunikation
Band
878
Sprache
Deutsch
Seiten
166
Produkttyp
Monographie

Inhaltsverzeichnis

KapitelSeiten
  1. Titelei/Inhaltsverzeichnis Kein Zugriff Seiten I - XVIII
    1. Motivation Kein Zugriff
      1. Compression of Aligned Reads Kein Zugriff
      2. Compression of Quality Scores Kein Zugriff
      3. Entropy Coding of DNA Sequencing Data Kein Zugriff
      4. Standards and Implementations Kein Zugriff
    2. Outline Kein Zugriff
    1. The Central Dogma of Molecular Biology Kein Zugriff
      1. Basic Methods Kein Zugriff
      2. High-Throughput Methods Kein Zugriff
      1. The FASTA Format Kein Zugriff
      2. The FASTQ Format Kein Zugriff
      3. The SAM/BAM Format Kein Zugriff
      1. Mathematical Preliminaries Kein Zugriff
      2. Information Theory Kein Zugriff
      3. Modeling Kein Zugriff
      4. Coding Kein Zugriff
      5. Quantization Kein Zugriff
      1. Genome Compression Kein Zugriff
      2. Read Compression Kein Zugriff
      3. Compression of Aligned Reads Kein Zugriff
    1. TSC Architecture Kein Zugriff
    2. Integration of TSC in MPEG-G Kein Zugriff
    3. Experiment Setup Kein Zugriff
    4. Results and Discussion Kein Zugriff
    5. Conclusion Kein Zugriff
    1. State of the Art and Contribution Kein Zugriff
      1. Genotype Likelihood Model Kein Zugriff
      2. Activity-Based Posterior Model Kein Zugriff
      3. Entropy Coding Kein Zugriff
    2. Integration of CALQ in MPEG-G Kein Zugriff
    3. Experiment Setup Kein Zugriff
    4. Results and Discussion Kein Zugriff
    5. Conclusion Kein Zugriff
    1. State of the Art and Contribution Kein Zugriff
      1. Input Parsing Kein Zugriff
      2. 3-Step Transformation Kein Zugriff
      3. Binarization Kein Zugriff
      4. Context Selection and CABAC Kein Zugriff
      1. Entropy Coding Methods Kein Zugriff
      2. Test Data Kein Zugriff
    2. Results and Discussion Kein Zugriff
    3. Conclusion Kein Zugriff
    1. The Standardization Landscape Kein Zugriff
      1. Transport and Storage of Genomic Information Kein Zugriff
      2. Coding of Genomic Information Kein Zugriff
      3. Metadata and Application Programming Interfaces Kein Zugriff
      4. Reference Software and Conformance Kein Zugriff
    2. An Open-Source MPEG-G Codec Kein Zugriff
  2. Conclusions Kein Zugriff Seiten 129 - 132
  3. Appendix Kein Zugriff Seiten 133 - 133
  4. Bibliography Kein Zugriff Seiten 133 - 152
  5. Publications Kein Zugriff Seiten 153 - 166

Ähnliche Veröffentlichungen

aus dem Schwerpunkt "Informatik & Kommunikationstechnik", "IT & Informatik allgemein"