Gene RPB_2751 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPB_2751
Symbol
ID	3910544
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris HaA2
Kingdom	Bacteria
Replicon accession	NC_007778
Strand	-
Start bp	3136057
End bp	3137271
Gene Length	1215 bp
Protein Length	404 aa
Translation table	11
GC content	67%
IMG OID	637884651
Product	deoxyguanosinetriphosphate triphosphohydrolase
Protein accession	YP_486364
Protein GI	86749868
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0232] dGTP triphosphohydrolase
TIGRFAM ID	[TIGR01353] deoxyguanosinetriphosphate triphosphohydrolase, putative

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.276692
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.329676
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGTCGGTCG GAATGGCAGC TCCTCGCGCA GCTTTTAGCT GCGACCCGGA CCGCAGCCGC 
GGCCGGCAAT TCGCCGAGCC GCCGAGCAGC AACCGCAGCG CGTTCCGCCG CGATTGCGAC 
CGGGTGATCC ATTCCAATGC CTTCCGTCGG CTGAAGCACA AGACCCAAGT CTTCGTGTTT 
CACGAGGGCG ATCATTACCG CACCCGGCTG ACCCACAGCC TGGAAGTGGC CCAGATCGCC 
CGCGCCATCG CGCGCCAGCT CGGGCTCGAC GAAGATCTGA CCGAGACGCT GGCGCTGGCG 
CACGACCTCG GCCATCCACC GTTCGGCCAT GCCGGCGAGC GAGCGCTCGA CGCCTGTCTG 
CGAGACCACG GCGGGTTCGA CCACAACGCG CAGACGCTGC GGGTGCTGAC GGCACTTGAG 
CACCGCTATC CAGGCTTCGA CGGGCTGAAC CTGACCTGGG AAACGCTCGA AGGCGTGGTC 
AAGCACAACG GCCCGCTGAC CGATCGCACC GGAGCGCCGC TGCCGCGCCA TGCCGAGCGT 
GGCGTGCCGA TCGGCATTGC CGAATTCAGC CAACGCTTCG ATCTCGAAAT ATGGAGCTTC 
GCCTCGCTCG AAGCCCAGGT CGCGGCGCTT GCCGACGACA TCGCCTACGA CGCCCACGAC 
ATCGACGATG GTCTTCGCGC CGGGTTGTTC CGGGTCGACG ATCTGCGCGC CGTGCCGCTG 
ACCGCCGCCC TCATAGATGG CATTTCGCGA CGCTATCCGG CGCTGGGCGA GAGCCGTCGC 
GGCGCCGAAC TCGTCCGCGA GCTGATTTCG CATCTGATCG GCGCCGTCAC GGCAGAGACC 
ATGCGCCGGC TCGGCGAGGC GGCGCCACGA TCGGTCGAGG ACGTGCGCCA CGCCAGCACG 
GCGATGGTCG CGTTTCCGTC CGAAACGGCC GTCGCGGAGG CCGAGATCAA AGCCTTTCTC 
TGGACCCATA TGTACCGCGC CGAGCGGGTC ATGGCGGTGA TGCGGGACGC CGAGGCGATC 
GTCGCCGACC TGTTCCGGCG GTATTGCGAG CATCCCGCCG ACCTGCCGCC GGACTGGCTG 
CCGGCCGATG GCCCAGTGGC CGAATGCGAG GCCGACCGCT TTCGCCGGAT CCGTAATTTC 
ATCGCCGGCA TGACCGACCG CTACGCTTTG ACCGAACATC AGCGGCTTTT TGACTCGACC 
CCGGATTTGC GTTAG

Protein sequence

MSVGMAAPRA AFSCDPDRSR GRQFAEPPSS NRSAFRRDCD RVIHSNAFRR LKHKTQVFVF 
HEGDHYRTRL THSLEVAQIA RAIARQLGLD EDLTETLALA HDLGHPPFGH AGERALDACL 
RDHGGFDHNA QTLRVLTALE HRYPGFDGLN LTWETLEGVV KHNGPLTDRT GAPLPRHAER 
GVPIGIAEFS QRFDLEIWSF ASLEAQVAAL ADDIAYDAHD IDDGLRAGLF RVDDLRAVPL 
TAALIDGISR RYPALGESRR GAELVRELIS HLIGAVTAET MRRLGEAAPR SVEDVRHAST 
AMVAFPSETA VAEAEIKAFL WTHMYRAERV MAVMRDAEAI VADLFRRYCE HPADLPPDWL 
PADGPVAECE ADRFRRIRNF IAGMTDRYAL TEHQRLFDST PDLR