Gene Rsph17025_1197 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rsph17025_1197
Symbol
ID	5084481
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodobacter sphaeroides ATCC 17025
Kingdom	Bacteria
Replicon accession	NC_009428
Strand	+
Start bp	1238320
End bp	1239456
Gene Length	1137 bp
Protein Length	378 aa
Translation table	11
GC content	67%
IMG OID	640482755
Product	putative deoxyguanosinetriphosphate triphosphohydrolase
Protein accession	YP_001167403
Protein GI	146277244
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0232] dGTP triphosphohydrolase
TIGRFAM ID	[TIGR01353] deoxyguanosinetriphosphate triphosphohydrolase, putative

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.0299714
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTGGCGC CCTATGCCTG CCAGCCCGGC GAAAGCCGCG GCCGGCAACA GCCCGAGAGC 
ATGTCCACCT TCCGCTCGCC GTTCCAGCGG GATCGAGACC GGATCATCCA TTCCTCGGCC 
TTCCGGCGGC TGAAGCACAA GACTCAGGTC TTCGTGGAAC ATGAGGGCGA CTACTACCGC 
ACGCGGCTCA CCCATTCGAT CGAAGTGGCG CAGGTCGCGC GGACCATCTC GGGCGTGCTG 
GGGCTGAACA CCGATCTGGC CGAGTGCATC GCGCTGGCCC ACGATCTCGG CCACACGCCC 
TTCGGCCACA CCGGCGAGGA TGCGCTGGCG AAGCTGATGG AGCCCTACGG CGGATTCGAC 
CACAACGCGC AGGCCATGCG GATCGTGACC CGGCTGGAAC GCCATTACGC CGAGTTCGAC 
GGGCTGAACC TCACATGGGA GTCGCTGGAA GGCATCGCCA AGCACAACGG CCCGGTCGAG 
GGGCCCTTGC CCTATGCGCT GGCCGAGGCC AATGCGCAGT GGGATCTGGA ACTGCACACC 
TACGCCTCGG CCGAGGCGCA GGTGGCGGCG ATCGCCGACG ACGTGGCCTA TTCGCACCAC 
GACCTGCACG ACGGGCTGCG CTCTGGCCTG TTCACCGAGG ACGACCTGAT GGAGCTGCCC 
GTCACCGCGC CCGCCTTTGC CGAGGTCGAT GCGCTCTATC CGGGGCTGGA GCCGATGCGC 
CGGCGGCACG AGGCGCTGCG GCGCGTCTTC GGCCGCATGG TCGAGGATGT GATCGCCGTG 
GCGCAGGGGC GGCTCGAGGC CGCGCAGCCG AAGTCGGTCG AGGAGATCCG CCAGATGGGC 
GCGACCGTGA TCCGCTTTTC GAAACCGCTC TATCAGGAGC TGAAGGTGAT CCGCAGCTTC 
CTGTTCCACC GGATGTATCG CGCGCCCTCG GTGATGAAGG AACGCGCGAA GGTGACGGCG 
GTGGTGAACG ATCTCTTTCC GCTGTTCATG CGCCAGCCCG AGCTTCTGCC GCAGGAATGG 
CGGCGCGATG TCGAGGCGGC CGAGGACGAG ACGACGCTCG CCCGGATCGT CGCCGATTAC 
GTCGCCGGCA TGACCGACCG CTTCGCCCTG CAGGAACATG CCCGCCTCTG CGGCTGA

Protein sequence

MLAPYACQPG ESRGRQQPES MSTFRSPFQR DRDRIIHSSA FRRLKHKTQV FVEHEGDYYR 
TRLTHSIEVA QVARTISGVL GLNTDLAECI ALAHDLGHTP FGHTGEDALA KLMEPYGGFD 
HNAQAMRIVT RLERHYAEFD GLNLTWESLE GIAKHNGPVE GPLPYALAEA NAQWDLELHT 
YASAEAQVAA IADDVAYSHH DLHDGLRSGL FTEDDLMELP VTAPAFAEVD ALYPGLEPMR 
RRHEALRRVF GRMVEDVIAV AQGRLEAAQP KSVEEIRQMG ATVIRFSKPL YQELKVIRSF 
LFHRMYRAPS VMKERAKVTA VVNDLFPLFM RQPELLPQEW RRDVEAAEDE TTLARIVADY 
VAGMTDRFAL QEHARLCG