Hur man bestämmer gc-halten i en dna-sekvens

Guanin-cytosinhalten eller GC-halten av en DNA-sekvens indikerar procentandelen av nukleotidbaspar där guanin är bunden till cytosin. DNA med högre GC-halt blir svårare att bryta ihop.

Steg

Metod 1 av 2:
För hand
  1. Bild med titeln 7114843 1
1. Spåra genom sekvensen och tally antalet cytosin (C) eller Guanin (G) nukleotider.
  • Bild med titeln 7114843 2
    2. Dela antalet cytosin- och guaninnukleotider medelst det totala antalet baspar i sekvensen.
  • Metod 2 av 2:
    Programmatiskt (Python 2)
    1. Bild med titeln 7114843 3
    1. Skapa eller acceptera en inmatningsfil. Denna artikel förutsätter att ingången är i Fasta format, med en enda sekvens per fil.
  • Bild med titeln 7114843 4
    2. Läs i filen. För Fastaformat:
  • Kassera den första raden i filen.
  • Ta bort alla återstående newlines och andra efterföljande blankutrymme.
  • Def init (sekvens): med öppen (argv [1]) som ingång: sekvens = "".gå med ([linje.Strip () för linje i ingång.Readlines () [1:]]) retursekvens
  • Bild med titeln 7114843 5
    3. Skapa en räknare. Iterera genom data och öka din räknare när du stöter på några guanin eller cytosin nukleotider.
  • 4
    def GCCONTENT (SEQUENCE): GCCOUNT = 0FOR LOTTER I SVECKENT: Om bokstaven == "G" eller bokstav == "C": Gccount + = 1return gccount
  • Bild med titeln 7114843 6
    5. Dela GC-räkningen med den totala längden på sekvensen och mata ut resultatet i procentformat.
  • 6
    def Main (): Skript, Input = Argvequence = ""SEQUENCE = INIT (SEQUENCE) PRINT "%.2f" % (float (gccontent (sekvens)) / len (sekvens))

    Tips

    Om du beräknar GC-content för hand, var noga med att dubbelkontrollera! Det kan vara lätt att miscount, speciellt om du analyserar en lång sekvens på papper.
    Dela på det sociala nätverket:
    Liknande