Hur man bestämmer gc-halten i en dna-sekvens
Guanin-cytosinhalten eller GC-halten av en DNA-sekvens indikerar procentandelen av nukleotidbaspar där guanin är bunden till cytosin. DNA med högre GC-halt blir svårare att bryta ihop.
Steg
Metod 1 av 2:
För hand1. Spåra genom sekvensen och tally antalet cytosin (C) eller Guanin (G) nukleotider.
2. Dela antalet cytosin- och guaninnukleotider medelst det totala antalet baspar i sekvensen.
Metod 2 av 2:
Programmatiskt (Python 2)1. Skapa eller acceptera en inmatningsfil. Denna artikel förutsätter att ingången är i Fasta format, med en enda sekvens per fil.
2. Läs i filen. För Fastaformat:
Def init (sekvens): med öppen (argv [1]) som ingång: sekvens = "".gå med ([linje.Strip () för linje i ingång.Readlines () [1:]]) retursekvens
3. Skapa en räknare. Iterera genom data och öka din räknare när du stöter på några guanin eller cytosin nukleotider.
4
def GCCONTENT (SEQUENCE): GCCOUNT = 0FOR LOTTER I SVECKENT: Om bokstaven == "G" eller bokstav == "C": Gccount + = 1return gccount
5. Dela GC-räkningen med den totala längden på sekvensen och mata ut resultatet i procentformat.
6
def Main (): Skript, Input = Argvequence = ""SEQUENCE = INIT (SEQUENCE) PRINT "%.2f" % (float (gccontent (sekvens)) / len (sekvens))
Tips
Om du beräknar GC-content för hand, var noga med att dubbelkontrollera! Det kan vara lätt att miscount, speciellt om du analyserar en lång sekvens på papper.
Dela på det sociala nätverket: