Gene RPC_2507 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPC_2507
Symbol
ID	3971089
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB18
Kingdom	Bacteria
Replicon accession	NC_007925
Strand	+
Start bp	2718005
End bp	2719219
Gene Length	1215 bp
Protein Length	404 aa
Translation table	11
GC content	68%
IMG OID	637925615
Product	deoxyguanosinetriphosphate triphosphohydrolase
Protein accession	YP_532377
Protein GI	90424007
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0232] dGTP triphosphohydrolase
TIGRFAM ID	[TIGR01353] deoxyguanosinetriphosphate triphosphohydrolase, putative

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.0639278
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGTCGGTCG GAATGGCAGC TCCTCGCGCG GCGTTCGCCT GCGATCCCGA CGCCAGCCGC 
GGCCGGCTGT TCGACGAACT GCCGAGCAAG ACCCGCAGTC CGTTCCGGCG CGATTGCGAC 
CGGGTGATCC ATTCCACCGG GTTTCGCCGG CTGAAGCACA AGACCCAGGT GTTCGTCTAT 
CACGAGGGCG ACCACTATCG CACCCGGCTG ACGCATTCGC TGGAGGTGGC GCAGATCGCC 
CGCGCCATCG CCCGCCAACT CGGGCTCGAC GAAGACCTTA CCGAAGCGCT GGCGCTGGCG 
CACGACCTCG GCCATCCGCC GTTCGGCCAC GCCGGCGAAC GCGCGCTCGA CGCCTGCCTG 
CAGCGCTATG GCGGCTTCGA CCACAACGCC CAGAGCCTGC GCGTGGTGAC GGCGCTGGAG 
CATCGCTATC CGGAGTTCAA CGGCCTCAAT CTGACTTGGG AAACGTTGGA GGGCATCGTC 
AAGCACAACG GCCCGCTGAC CGACCGCAGC GGCGCGCCGC TCGGCCGCTA TCAGGCGCAT 
GGCGTGCCGA CCGGCATCGT CGAATTCAAC CGCTGTTTCG ACCTGGAATT GTGGAGCCAC 
GCCTCGCTCG AGGCGCAGGT CGCCGGCATC GCCGACGATA TCGCCTATGA CGCCCACGAC 
ATCGACGACG GGCTGCGCGC CGGGCTGTTC GGCGTCGACG ATCTCGGCGA GATGCCGCTG 
ACCGCGCAGA TGACCGCCGC GATCGACGTC CGCTATCCCG GGCTCGACCC GGCACGGCGC 
GGCGCCGAAC TGGTGCGCGA GCTGATTTCG TTCTTGATCG GCGCCGCGGT GGCCGAAGCC 
GAGCGGCGGT TGATCGCGGC GCAGCCCGCC TCGGTGCAGG CGGTGCGCGA GGCCGGCCAG 
GATCTGATCA TGTTCGCGCC GGACGCCGCC GAAGCCGAAG CGCTGATCAA GGCGTTCCTG 
AAGCGCCACA TGTATCGCCA TCCGCGGGTG ATGCGGGTGA TGGACGACGC CGAGACCGTG 
GTGTTCGAGC TGTTCGCCCG CTACCGCGAC CATCCGGCGG ATCTGCCGGC GGAATGGCTG 
CCGGCGAACG CCGGGCAGGG CGAAACCGAG GCGGATCGGC TGCGCCGAAT CTGCAATTTC 
ATCGCCGGCA TGACCGACCG CTACGCGCTG ACCGAGCACC AACGGCTCTT TGACTTAACG 
CCGGAATTGC GTTAG

Protein sequence

MSVGMAAPRA AFACDPDASR GRLFDELPSK TRSPFRRDCD RVIHSTGFRR LKHKTQVFVY 
HEGDHYRTRL THSLEVAQIA RAIARQLGLD EDLTEALALA HDLGHPPFGH AGERALDACL 
QRYGGFDHNA QSLRVVTALE HRYPEFNGLN LTWETLEGIV KHNGPLTDRS GAPLGRYQAH 
GVPTGIVEFN RCFDLELWSH ASLEAQVAGI ADDIAYDAHD IDDGLRAGLF GVDDLGEMPL 
TAQMTAAIDV RYPGLDPARR GAELVRELIS FLIGAAVAEA ERRLIAAQPA SVQAVREAGQ 
DLIMFAPDAA EAEALIKAFL KRHMYRHPRV MRVMDDAETV VFELFARYRD HPADLPAEWL 
PANAGQGETE ADRLRRICNF IAGMTDRYAL TEHQRLFDLT PELR