Simon Anders

@simon-anders

Joined on Mar 29, 2019

  • The simplex's missing coordinate Consider the following two ways to write the $d$-dimensional simplex: First as subset of $\mathbb{R}^{d+1}$ $$ \Delta^d = \bigg{x\in\mathbb{R}^{d+1} ,\bigg|, x_i>0,\sum_{i=1}^{d+1}x_i=1\bigg},$$ and second as subset of $\mathbb{R}^d$ $$\Delta_\text{I}^d = \bigg{x\in\mathbb{R}^d ,\bigg|, x_i>0,\sum_{i=1}^d x_i\le 1\bigg}.$$
     Like  Bookmark
  • Diese Hausaufgabe ermöglicht Ihnen, über die Weihnachtsferien etwas R und Data Science zu üben. Wenn Sie bis zum 19. Januar 2025 eine ausgearbeitete Hausarbeit abgeben, zumindest für die Aufgaben 1 bis 4, dann erhalten Sie Bonuspunkte, die ich Ihnen bei der Bewertung der Klausur am Ende des Semesters angerechnen werde. Bitte bearbeiten Sie die Aufgaben mit R. Am besten erstellen Sie ein Quarto-Dokument, so dass Sie ihre ferige Arbeit als HTML-Datei an mich schicken können. Ihre Arbeit sollte neben dem vollständigen R-Code ind den Ergebnissen auch etwas Text enthalten, in dem Sie erläutern, was die Ergebnisse darstellen, wie Ihr R-Code funktioniert und wie Sie die Ergebnisse interpretieren. Wenn Sie Fragen zu den Aufgaben haben, können Sie diese im Moodle-Forum stellen. Der "DHQ-9 Depression Screener" In dieser Aufgabe arbeiten wir, wie in der Vorlesung, mit den Daten aus dem Durchgang "J" (2017/18) der NHANES-Studie. Spezifisch betrachten wir Daten zur psychischen Gesundheit. Bei Studien zur psychischen Gesundheit wird gerne ein als "DHQ9" bezeichneter Fragebogen verwendet, den K. Kroenke und R. L. Spitzer entworfen haben. Die deutsche Version dieses Fragebogens finden Sie auf Wikipedia, hier; in NHANES wurde natürlich eine englischsprachige Version verwendet.
     Like  Bookmark
  • Matrix-vector multiplication Given two length-$n$ vectors $\vec v$ and $\vec w$, we define the scalar product $\vec v \vec w$ as the value obtained by multiplying each element of $v$ with the corresponding element of $w$ and summing up the products: $$ \vec v \vec w = \sum_{i=1}^n v_i w_i $$ Given an $m\times n$ matrix $M$ and a length-$n$ vector $\vec v$, we define the matrix-vector product $M\vec v$ as the $m$ dimensional vector $\vec w$, whose $i$-th element is the scalar product of the $i$-th row vector of $M$ with the vector $\vec v$: $$ \vec w = M\vec v \quad\text{means}\quad w_i=\sum_j m_{ij} v_j.$$ For $M\vec v$ to be defined, the number of columns of $M$ must be equal to the length of $\vec v$.
     Like  Bookmark
  • Modulbeschreibung Title Applied Mathematics in Biology: Single-cell omics Lecturer Simon Anders, BioQuant Center (simon.anders@bioquant.uni-heidelberg.de) Date and time
     Like  Bookmark
  • Vacation Canaries 24. arrival 13:10 in Lanzarote(ACE) / 20:30 in Gran Canaria (LPA) Flight from ACE to LPA, 15:45--16:30, UX2148, PB5VWE 24.-25. Sarah Kite Playa del Burrero, right south of Gran Canaria airport Calle Periodista Jorde, 2A, 35240 Playa del Burrero, Spain
     Like  Bookmark
  • Betr.: Antrag auf kostenneutrale Verlängerung DFG-Projekt 497768044 (GZ: AN 1381/3-1; AOBJ: 686014) "Mechanismen der Tumorzelldissemination und Metastasierung des Pankreaskarzinoms über den Blutkreislauf" Sehr geehrte Frau Dr. Benjak mit diesem Schreiben möchte ich Ihnen ein kurzes Update zu o.g. Projekt übermitteln. Diese Projekt hat drei Antragssteller, und entsprechend drei Teile. Wie Sie vielleicht bereits bemerkt haben, habe ich den mir zugewiesenen Teil der Mittel bisher nicht abgerufen. Den Grund hierfür möchte ich Ihnen hiermit mitteilen, und Sie und die DFG um Verständnis für diese diese Verzögerung bitten, sowie eine kostenneutrale Verlängerung der Laufzeit des Projekts beantragen. Inhalt des Projekts ist es, zirkulierende Tumorzellen aus Pankreaskarzinomen durch Sequenzierung von DNA und RNA zu charaktisieren und mit Zeelen aus dem primären Tumor und zu vergleichen, sowie zu ermitteln, ob sich Tumorzellen, die während einer Operation am Pankreas freigesetzt werden, von anderen unterscheiden.
     Like  Bookmark
  • Wenn man mit RStudio ein Notebook so speichern will, dass man eine einzige HTML-Datei enthält, die alles enthält (Text, Code, Ergebnisse und Plots), geht man wie folgt vor: bei Quarto-Notebooks Am Anfang des Notebooks sollte der sog. YAML-Block stehen. Dieser muss die Angabe enthalten, dass eine HTML-Datei gewünscht wird, die alle Teile eingebettet enthält. Dazu muss eine format-Angabe wie folgt eingefügt werden. --- title: "Zwischen-Hausarbeit" author: "Martina Musterfrau" format: html:
     Like  Bookmark
  • Vorlesung "Datenanalyse für Biologen" (WS 2022/23) Vorbemerkungen Keine Sorge, die Angabe sieht sehr viel länger aus als sie ist. Sie enthält sehr viel mehr Hinweise und Erläuterungen als Aufgaben. Damit Sie die eigentlichen Aufgaben in dem vielen Text nicht übersehen, habe ich sie mit einem Hand-Symbol (☛) gekennzeichnet. Von der freiwilligen Hausarbeit wissen Sie schon, wie die Abgebe aussehen sollte: Erstellen Sie Ihre Hausarbeit, wie Sie einen Praktikumsbericht erstellen würden. Fügen Sie also genug Text ein, so dass auch ein Leser, der die Aufgabenstellung nicht kennt, versteht, um was es geht. Wenn Sie also Daten laden, erläutern Sie kurz, was die daten bedeuten. Erklären Sie vor jeder Analyse, was Sie herausfinden möchten, und nach jedem Ergebnis, was es bedeutet. Die Qualität des Textes geht in die Bewertung ein. (Schreiben Sie aber bitte nicht zu viel, sonst muss ich so viel lesen.) Wenn Sie Analysen durchführen, geben Sie den R-Code hierzu an und erklären Sie ganz kurz, was die einzelnen Zeilen bewirken sollen, damit ich erkennen kann, dass Sie Ihren Code auch verstehen. Ich empfehle, die Arbeit als R-Notebook oder Quarto-Dokument mit R-Studio anzufertigen. Laden Sie die fertige Arbeit bitte als PDF- oder HTML-Datei auf Moodle hoch. Achten Sie bitte darauf, dass Ihre fertige Arbeit alle Plots und Ergebnis-Tabellen enthält (siehe dazu hier). Achten Sie bitte auch darauf, dass sich keine seitenlangen Tabellen mit (Zwischen-)Ergebnissen irgendwo in der Mitte einschleichen. Abgabetermin ist der 23. April 2023. Laden Sie Ihre Arbeit bitte hier auf Moodle hoch.
     Like  Bookmark
  • Quality control of scRNA-Seq Alexey made UMAPs showing how well genotypes and batches mixed. He checked percentage of mitochondrial genes. He did not remove any cells due to too high percentages. He similarly checked the percentage of expression of mup genes, i.e. genes whose name starts with "mup" (whatever these are). For the hepatocytes, he performed clustering with Seurat and found one cluster with strong expression of markers indicating other cell types than hepatocytes (markers for LSECs, stAellate cells, and/or Kupffer cells) and removed the cells of this cluster for subsequent analysis For the LSECs, he did the same and also found one cluster that needed removal I have some plots, if needed. Assignment of zonation position "Raw" position score To each sequenced cell $c$, we assigned a "zonation position" $\eta_c$, which is a quantity indicating the cell's position along the central-to-portal zonation axis, as inferred from the cell's expression of zonation markers. We summed up the cell's expression of portal and central markers, yielding sums $S_c^\text{P}$ and $S_c^\text{P}$, and transform this into a zonation position $\eta$, such that a cell expressing only the portal and none of the central marker genes is assigned $\eta_c=0$, while a cell expressing only central and no portal markers gets $\eta_c=1$. Values in between indicate mixed expression and hence an intermediate position. Details on how the expression sum are calculated are given below.
     Like  Bookmark
  • zur Vorlesung "Datenanalyse in der Biologie", Wintersemester 2021/22 Vorbemerkungen Keine Sorge, die Angabe sieht länger aus als sie ist. Sie enthält mehr Hinweise und Erläuterungen als Aufgaben. Sie müssen nicht alle Aufgaben bearbeiten, um zu bestehen (aber um volle Punktzahl zu erhalten, natürlich schon). Erstellen Sie Ihre Hausarbeit, wie Sie einen Praktikumsbericht erstellen würden. Fügen Sie also genug Text ein, so dass auch ein Leser, der die Aufgabenstellung nicht kennt, versteht, um was es geht. Wenn Sie also Daten laden, erläutern Sie kurz, wo die Daten herkommen und wie sie erhoben wurden. Erklären Sie also vor jeder Analyse, was Sie herausfinden möchten, und nach jedem Ergebnis, was es bedeutet. Die Qualität des Textes geht in die Bewertung ein. (Schreiben Sie aber bitte nicht zu viel, sonst muss ich so viel lesen.) Wenn Sie Analysen durchführen, geben Sie den R-Code hierzu an und erklären Sie, was die einzelnen Zeilen bewirken sollen, damit ich erkennen kann, dass Sie Ihren Code auch verstehen. Ich empfehle, die Arbeit als R-Notebook mit R-Studio anzufertigen. Senden Sie mir die fertige Arbeit als PDF- oder HTML-Datei und fügen Sie ggf. die Rmd-Datei hinzu. Abgabetermin ist der 19. April 2022. Senden Sie Ihre Arbeit an simon.anders@bioquant.uni-heidelberg.de . Wenn Sie den Abgabetermin aus triftigen Gründen (Krankheit, wichtige persönliche Gründe, größere studienbezogene Verpflichtungen, o.ä.) nicht einhalten können, wenden Sie sich bitte an mich. Nachtrag zum Abgabetermin (eingefügt am 15.4.): Bitte beachten Sie ggf. diesen Post im Forum: https://moodle.uni-heidelberg.de/mod/forum/discuss.php?d=111145#p228661
     Like  Bookmark
  • Analyse von scRNA-Seq-Daten mit Seurat Seurat Das R-Paket Seurat dient der Analyse von single-cell-RNA-Seq-Daten. Es wird ausführlich auf dieser Webseite beschrieben: https://satijalab.org/seurat Sie sog. "Vignetten" demonstieren verschiedene Anwendungen mit konkreten beispiel-Daten. Wir folgen der ersten Vignette, dem "Guided Clustering Tutorial", hier. Schnell-Durchlauf Hier ist ein "Schnell-Durchlauf" durch die Haupt-Schritte des Tutorials: library( tidyverse )
     Like  Bookmark
  • Berichtsbogen für das Jahr 2022 Betr. Projekt: W1-Professur innerhalb des Projekts "Gründung eines baden-württembergischen Landesinstituts für Bioinformatik -- Standort Heidelberg" Projektnummer: <u>00.022.2019</u> Ihre Anschrift: AG Anders, BioQuant-Zentrum, Universität Heidelberg, 69120 Heidelberg Bericht von Dr. Simon Anders
     Like  Bookmark
  • Datentypen Das Binärsystem Durch Nullen und Einsen kann man beliebige Zahlen darstellen. Zum Beispiel gibt es $2^3=8$ Möglichkeiten, vierstellige Kombinationen aus 0 und 1 zu erzeugen: 0: 000 1: 001 2: 010 3: 011 4: 100 5: 101
     Like  Bookmark
  • Simon Anders 1. Vorlesung Worum geht es in dieser Vorlesung? Woher kommen Daten in der Biologie? eigene Experiment: kleine Experimente: Aufzeichnungen im Laborbuch oder in Spreadsheets Hochdurchsatz-Experimente: größere Dateien
     Like  Bookmark
  • Slide "Aims" (40 sec) We will study the system from three vantage points in parallel: We will map out the dynamics of individual cells, we will study how these dynamics are controlled by feedback from other cells, and how these feedbacks emerge from the niche's organization in space and time. In each Aim, all four of us will work together to develop new technology, and new approaches for data analysis and for mechanistic modelling.
     Like  Bookmark
  • Budget slide with position
     Like  Bookmark
  • Hi Gleb I thought a bit more about how to speed up calculating the radial profiles. At the moment, you have a triple loop, the outer loops goes through the grid of radius values, the inner two loops through the pixels of the image. We should turn this around, as I show below. Specification Input: an image img as matrix of size nx by ny a maximum radius rmax coordinates cx, cy of the center of the circles
     Like  Bookmark
  • MetDense format specification Overview A MetDense contains five blocks, as follows: The Header Block contains the file type magic, the file version number, and the offset of the Chromosomes Block. The Cells block contains the number of cells and their names. The Data Block contains teh actual methylation calls in a densely packed, but randomly accessible format. The Positions block lists for each chromosome all CpG positions and their The Chromosome Block lists the names of chromosomes or contigs and the file offsets of their position information
     Like  Bookmark
  • Data logistics To enable efficient handling of thousands of tests per day, we implemented a logistics scheme, which is centered at a self-developped web server wioth associated data bank, which acts both as a custom laboratory information management system and as portal to communicate test results to test subjects. To safeguard subjects' privacy, all samples are identified only by the sample tube barcode. Identifying information (subject's name, address, and phone number) is collected but encrypted in a manner that makes this data wholly inaccessible to the project team. (See below for details.) The logistics concept is best described by following the "life" of a test tube: First, test kits (Figure XX) are packed, comprising standard items (saline bottle and straw), as well as Micronics sample tube with a preprinted barcode. While packing these into a platic bag, this barcode is scanned and transmitted to the server, which assigns a random 12-digit access code and stores the pairing of barcode and access code. The access code is printed, along with instructions, onto a paper slip, which is folded (to keep the access code hidden) and packed into a small plastic bag together with the rest of the kit. We found that a single worker can easily pack XX such test kits in an hour. We produced bags of 50 test kits, which were handed out to entities (e.g., institutes participating in the test), and distributed there. A participant would take a kit, go to the web page mentioned in the instructions on the paper slip, and find there a short video demonstrating the sampling procedure, as well as a form to register the kit, i.e., associate the access code with their name, address and phone number. These personal information were immediately encrypted by the web server (see below). Furthermore, information on the test is displayed and the user is asked to confirm informed consent. After registration on the web page, the subject would then take a sample by gargling and deposit the sample tube in a collection receptacle. When a new batch of samples was received in the lab, these were heat inactivated and then immediately scanned, in order to mark the samples in the data base as received. Similarly, the results of the LAMP analysis were transferred to the server by our custom-built LAMP plata analysis tool (see below). In the same manner, the results of follow-up tests, such as PCR or repeats of LAMP, were recorded as "events" for the sample. The possibility to thus inspect the "history" of a sample was an important feature to troubleshoot any logistics issues.
     Like  Bookmark
  • Align the reads with minimap2 -> SAM file minimap2 /mnt/.../reference.fasta /mnt/.../nanopore_fastq/* Sort the samfile by position samtools sort -O BAM Sdl.sam >Sdl_sorted.bam Make an index samtools index Sdl_sorted.bam Copy the BAM file, its index, and the reference FASTA file to your computer scp studentNN@papagei.bioquant.uni-heidelberg.de:filename . (on your Mac) (or use CyberDuck or WinSCP)
     Like  Bookmark