Gene RPD_2796 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPD_2796
Symbol
ID	4023294
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB5
Kingdom	Bacteria
Replicon accession	NC_007958
Strand	-
Start bp	3114471
End bp	3115685
Gene Length	1215 bp
Protein Length	404 aa
Translation table	11
GC content	68%
IMG OID	637962994
Product	deoxyguanosinetriphosphate triphosphohydrolase
Protein accession	YP_569925
Protein GI	91977266
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0232] dGTP triphosphohydrolase
TIGRFAM ID	[TIGR01353] deoxyguanosinetriphosphate triphosphohydrolase, putative

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.0211174
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	8
Fosmid unclonability p-value	0.07254
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGTCGGTCG GAATGGCAGC TCCTCGCGCA GCCTATGGTT GCGATCCGGA CCGCAGCCGC 
GGCCGGCAGT TCGCCGAGCC GCCGAGCAAC AACCGCAGTG CTTTTCGGCG TGATTGCGAC 
CGGGTGATCC ACTCCAACGC CTTCCGCCGG CTCAAGCACA AGACCCAGGT CTTCGTGTTC 
CACGAGGGCG ATCATTACCG CACCCGTCTG ACCCACAGCC TCGAAGTCGC CCAGATCGCC 
CGGGCGATCG CGCGCCAGCT CGGGCTCGAC GAGGACCTGA CCGAGACGCT GGCGCTGGCG 
CACGATCTCG GCCACCCGCC GTTCGGCCAT GCCGGCGAGC GCGCGCTCGA CGCCTGCCTG 
CGCGCCCATG GCGGCTTCGA TCACAACGCT CAGACCCTGC GGGTGCTGAC CGCACTCGAA 
CACCGCTATC CGGAATTCGA CGGGTTGAAC CTGACCTGGG AAACGCTCGA AGGCGTGGTC 
AAGCATAATG GCCCGCTCAC CGATCGCGCC GGCCGGCCGC TGCCGCGCTA CGCCGAGCGC 
GGCGTGCCGA TCGGGATTGT CGAGTTCAGC CAGCGCTTCG ACCTCGAGCT GTGGAGCTTT 
GCCTCGCTCG AGGCCCAGGT TGCGGCGATT GCCGACGACA TCGCCTACGA CGCCCACGAC 
ATCGACGACG GGCTGCGCGC CGGGCTGTTC CGGGTCGACG ATCTGCGCGC CGTGCCGCTG 
ACCGCATCGA TCATCGACGG CATCGCACGG CGCTATCCGG CTCTCGACGA AAGCCGGCGC 
GGCGCCGAGC TGGTGCGCGA GCTGATCTCG CATTTGATCG GCGCGGTGAC CGCCGAGACC 
ATGCGGCGAC TGGGCGAGGC TGCGCCGCGC TCGGCCGAGG AGGTGCGTCA CGCCAGTTCG 
GCGATGGTGG CGTTCCCGAT CGAGACGGCC GCCGCGGAAG CCGAGATCAA GGCATTCCTC 
TGGACCCACA TGTATCGGGC AAACCGCGTC ATGGCGGTGA TGCGCGACGC CGAGGCGATC 
GTCGCCGACC TGTTCCAGCG CTATTGCGAC CATCCGGCCG ATCTGCCGCC GGACTGGCTG 
CCGACCGATG GGCCGGTCGC CGAGTGCGAA GCGGACCGGC TGCGACGGAT CCGCAATTTC 
ATCGCCGGCA TGACCGACCG CTATGCGCTG ACCGAACACC AGCGGCTTTT TGACTCGACT 
CCGGATTTGC GTTAG

Protein sequence

MSVGMAAPRA AYGCDPDRSR GRQFAEPPSN NRSAFRRDCD RVIHSNAFRR LKHKTQVFVF 
HEGDHYRTRL THSLEVAQIA RAIARQLGLD EDLTETLALA HDLGHPPFGH AGERALDACL 
RAHGGFDHNA QTLRVLTALE HRYPEFDGLN LTWETLEGVV KHNGPLTDRA GRPLPRYAER 
GVPIGIVEFS QRFDLELWSF ASLEAQVAAI ADDIAYDAHD IDDGLRAGLF RVDDLRAVPL 
TASIIDGIAR RYPALDESRR GAELVRELIS HLIGAVTAET MRRLGEAAPR SAEEVRHASS 
AMVAFPIETA AAEAEIKAFL WTHMYRANRV MAVMRDAEAI VADLFQRYCD HPADLPPDWL 
PTDGPVAECE ADRLRRIRNF IAGMTDRYAL TEHQRLFDST PDLR