Gene GSU1246 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GSU1246
Symbol
ID	2686634
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sulfurreducens PCA
Kingdom	Bacteria
Replicon accession	NC_002939
Strand	+
Start bp	1347775
End bp	1348914
Gene Length	1140 bp
Protein Length	379 aa
Translation table	11
GC content	62%
IMG OID	637125920
Product	deoxyguanosinetriphosphate triphosphohydrolase-like protein
Protein accession	NP_952299
Protein GI	39996348
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0232] dGTP triphosphohydrolase
TIGRFAM ID	[TIGR00277] uncharacterized domain HDIG [TIGR01353] deoxyguanosinetriphosphate triphosphohydrolase, putative

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.641773
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCGATCCC TGGAGCGGGC TGATCTGGCC GGCTATGCGG CTCGCAGTTG CCGTTCGCGG 
GGGCGGATGC ACCCGGAAGA GTTCCGGGAC GACCGCCCCG CCTTCGAGCG GGACCGGGAC 
AGGATCATCC ACTGTGCGGC GTTCAGGAGG CTGGAGTACA AAACTCAGGT CTTCGTGAAC 
CATGAGGGGG ACTACTACCG CACCCGGTTG ACCCACTCCC TGGAGGTGGC CCAGATCGGC 
AAGGCCATTG CCCGTCGACT CGCCCTGAAC GAGGAACTGA CCGAGGCTCT GGCCCTGGCC 
CACGACCTGG GACACACCCC CTTCGGGCAC ACGGGCGAGG AGGTGCTGAA CCGTCTGATG 
GAAGGCTTCG GCGGCTTCGA GCACAATCTT CAGTCGTTCA GGGTGGTGGA CCAGTTGGAG 
GAGCGGTACC CCGGCTTCAA CGGGCTCAAC CTTTCCTGGG AAGTGCTGGA AGGGATCATC 
AAGCATTCAT CGCCCTACGA CCGGCCGACC GGTCTGATCG AGGGATTCCT GCCCGGCGTG 
GTGCCGACCA TCGAAGCTCA GATCATCAAC TTCGCCGATG AGATAGCCTA CAACAATCAC 
GATATCGACG ACGGTCTCAA GTCGGGTTAC ATTACGATTG AGCAACTCAA CGGGGTTGAC 
CTCTGGCGTG AGGTTTGGGA GAGGATCGAT ACCGCCCATC CCGGCCTGGA TCGGGAGCGG 
AAGAAGTTCC AGACCATAAG CGCGCTGATC GGTCTCCTCA TCAGGGACCT GATTACTGCC 
ACCGAGGCGA ATCTGCGTGC TTACGGCGTC TCCACCCTTG ACGACGTGCG GCGGGTCAAC 
CGCCCCCTGG TGACCTTCTC GTCCGCCATG GAGGAGCGGA ACCGTTCCCT TAAGCGGTTC 
CTGTTCACAA ACCTGTACCG GCACCACAAG GTGGAGCGGA TGCGGGTCAA GGCGGAGCGC 
TATCTGACGC AGCTGTTCGA GAGTTACGTG AAGCACCCGA CGCTGCTCCC CCGCAAGTAC 
CAGCAGAAGA TGGATACGCT GGGACGCGAG CGCGTGGTCT GCGACTACAT CGCCGGCATG 
ACCGACCGCT TCGCCCTTGA TGAGTTCAAG CGTTTGTTCG AGCCTTACGA GCGCGTCTGA

Protein sequence

MRSLERADLA GYAARSCRSR GRMHPEEFRD DRPAFERDRD RIIHCAAFRR LEYKTQVFVN 
HEGDYYRTRL THSLEVAQIG KAIARRLALN EELTEALALA HDLGHTPFGH TGEEVLNRLM 
EGFGGFEHNL QSFRVVDQLE ERYPGFNGLN LSWEVLEGII KHSSPYDRPT GLIEGFLPGV 
VPTIEAQIIN FADEIAYNNH DIDDGLKSGY ITIEQLNGVD LWREVWERID TAHPGLDRER 
KKFQTISALI GLLIRDLITA TEANLRAYGV STLDDVRRVN RPLVTFSSAM EERNRSLKRF 
LFTNLYRHHK VERMRVKAER YLTQLFESYV KHPTLLPRKY QQKMDTLGRE RVVCDYIAGM 
TDRFALDEFK RLFEPYERV