Gene GM21_3804 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GM21_3804
Symbol	prfA
ID	8139178
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sp. M21
Kingdom	Bacteria
Replicon accession	NC_012918
Strand	-
Start bp	4375650
End bp	4376729
Gene Length	1080 bp
Protein Length	359 aa
Translation table	11
GC content	63%
IMG OID	644871423
Product	peptide chain release factor 1
Protein accession	YP_003023581
Protein GI	253702392
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0216] Protein chain release factor A
TIGRFAM ID	[TIGR00019] peptide chain release factor 1

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	114
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCCATGT TTGAAAAAAT AGCCGAGCTG GAAAGACGTT TCGAGGAGCT GGAATCGCTG 
CTGTCGGATC CCGAGGTGCT GGCGAACCAG ACCGAGTTCA GGAAGCTCTC CAAGGAGCAT 
TCCGGCCTGG CCGAGCTGGT TGCCGCCTAT CGCGAATACA AGAAGATACT CTCCGACATC 
GACGACAACA AGGAACTCCT GAAGGAGCCG GACCAGGAGA TGCGCGAGAT GGCCCAGGCC 
GAGCTTTTGT CCCTGGAGGC GCGGCGCGAG GAGCTGGAAG GCGAGATCAA GTTGCTGCTC 
CTGCCCAAGG ACCCCAACGA CGACAAGAAC GTGGTGCTCG AGATCCGCGC CGGAACCGGC 
GGAGACGAGT CCGCGCTTTT CGCGGGGGAC CTGTTCCGCA TGTACTCCCG CTTCGCCGAG 
ACCAACCGCT GGCGCGTCGA GATCATCTCA GCCTCCGAGT CGGAGAAGGG GGGCTTCAAG 
GAGGTCATCG CGCTAGTCGA GGGGACCGGG GTCTTCGCGA AGCTCAAGTA CGAGTCGGGG 
ACCCACCGCG TGCAGCGCGT TCCCGAGACC GAGGCGCAGG GTCGGATCCA CACCAGCGCC 
TGCACCGTCG CGGTCATGCC CGAGGCCGAA GACGTCGACA TCGACATCAA CCCCGCCGAC 
CTGAAGATCG ACGTGTACCG TTCCTCCGGT GCCGGGGGGC AGCACGTCAA CACCACCGAC 
TCCGCGGTCA GGATCACCCA TCTCCCCACC GGGACCGTGG TTGCCTGCCA GGAAGAGCGG 
AGCCAGATCA AGAACCGCGC GAAGGCCATG AAGGTGTTGA AGTCCAGGAT CCTGGACAAC 
ATCCTCATGG AGCAGAACGC GAAGCTCGCC GCCGACCGCA AGAGCCAGGT CGGAAGCGGG 
GATCGCAGCG AGCGCATCAG GACCTACAAC TTCCCGCAGG GGAGGATGAC CGATCACCGG 
ATCGGCCTGA CCCTGTACCG TTTGGACGCC ATCATGGCGG GCGACATAGC CGAGATCGCC 
GACTCCCTGC GTGCCCATTA CCAGATGGAA GCGCTGCAGG CCCAGAGCGA GGGGATGTAG

Protein sequence

MSMFEKIAEL ERRFEELESL LSDPEVLANQ TEFRKLSKEH SGLAELVAAY REYKKILSDI 
DDNKELLKEP DQEMREMAQA ELLSLEARRE ELEGEIKLLL LPKDPNDDKN VVLEIRAGTG 
GDESALFAGD LFRMYSRFAE TNRWRVEIIS ASESEKGGFK EVIALVEGTG VFAKLKYESG 
THRVQRVPET EAQGRIHTSA CTVAVMPEAE DVDIDINPAD LKIDVYRSSG AGGQHVNTTD 
SAVRITHLPT GTVVACQEER SQIKNRAKAM KVLKSRILDN ILMEQNAKLA ADRKSQVGSG 
DRSERIRTYN FPQGRMTDHR IGLTLYRLDA IMAGDIAEIA DSLRAHYQME ALQAQSEGM