Gene TM1040_0902 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	TM1040_0902
Symbol
ID	4076272
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ruegeria sp. TM1040
Kingdom	Bacteria
Replicon accession	NC_008044
Strand	+
Start bp	962323
End bp	963465
Gene Length	1143 bp
Protein Length	380 aa
Translation table	11
GC content	62%
IMG OID	638006204
Product	deoxyguanosinetriphosphate triphosphohydrolase
Protein accession	YP_612897
Protein GI	99080743
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0232] dGTP triphosphohydrolase
TIGRFAM ID	[TIGR01353] deoxyguanosinetriphosphate triphosphohydrolase, putative

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTACGCGC CCTATGCCAC CATGCCCGAC CGTTCGCGCG GGCGGGCTGT TCCCGAAGAA 
GAGAGCAGTT TTCGGTCTCC CTTTCAGCGC GATAGGGACC GGATCATCCA TGCCAGCGCC 
TTTCGGCGCC TGAAGCACAA GACGCAAGTG TTTGTGGAGC ATGAGGGCGA CAATTATCGC 
ACCCGGCTTA CCCACTCCAT CGAAGTAGGA CAGGTGGCGC GCACCATTGC AGGCGCGCTG 
GGGCTCAATC AGGAGCTCAC CGAGGCCGTC GCGCTGGCGC ATGATCTTGG TCATACGCCC 
TTTGGCCACA CCGGCGAGGA CGCGCTGCAT GAGATGATGG CGCCCTATGG CGGATTTGAC 
CACAACGCGC AGGCCATTCG CATCGTGACG GCGCTGGAGC GTCACTATGC AGAGTTTGAT 
GGTCTGAACC TCACCTGGGA GACGCTGGAG GCGATTGCCA AGCACAATGG CCCGGTTGTG 
GGGGAGCTGC CCTGGGCCTT GGCGGCCTGC AACCGGGGCA TCGATCTGGA GCTGCACACC 
CACGCCAGCG CCGAGGCGCA GGTGGCGGCC CTGGCGGATG ACATCGCCTA CAATCACCAC 
GATCTGCACG ACGGTTTGCG GGCCGGGCTT TTCACGGATG ACGATGTGTG CAGCTTGTCG 
ATCATCGCGC CCGCTTACGC GGAGGTGGAT GAGATCTATC CGGGGCTGGA TCATAATCGC 
CGTCGCCACG AGGCGCTGCG GCGGTTCTTT GGGGTTATGG TCAGTGATGT GATCGAGACC 
TCGCGGCGTA AGATTGCGGC CTCTGGTGCG CAGTCGGTGG AGGAGATCCG GGCGCTGGAT 
CATGCGGTTG TGACCTTTTC GGATGAGATC TGGACCCAGC TCAGAGAGCT GCGGGCCTTC 
ATGTTCACCC GCATGTACCG CGCTCCTTCG GTGATGGTGG TGCGCGAGCG TGTCGCCGTC 
GTGGTGAAGG CGCTGTTTGC CTATTACCTC GAAAACACCA TGGCGATGCC CGAGCGCTGG 
CATGGCGACA TTCGCAAGGC CGAAACAGAG ACTGACCGGG CGCGGATCGT ATCGGACTAT 
ATCGCCGGGA TGACGGATCG TTTTGCGCTG CAGCTCTATG ATCGCTTGGC GCTTGGGGCT 
TGA

Protein sequence

MYAPYATMPD RSRGRAVPEE ESSFRSPFQR DRDRIIHASA FRRLKHKTQV FVEHEGDNYR 
TRLTHSIEVG QVARTIAGAL GLNQELTEAV ALAHDLGHTP FGHTGEDALH EMMAPYGGFD 
HNAQAIRIVT ALERHYAEFD GLNLTWETLE AIAKHNGPVV GELPWALAAC NRGIDLELHT 
HASAEAQVAA LADDIAYNHH DLHDGLRAGL FTDDDVCSLS IIAPAYAEVD EIYPGLDHNR 
RRHEALRRFF GVMVSDVIET SRRKIAASGA QSVEEIRALD HAVVTFSDEI WTQLRELRAF 
MFTRMYRAPS VMVVRERVAV VVKALFAYYL ENTMAMPERW HGDIRKAETE TDRARIVSDY 
IAGMTDRFAL QLYDRLALGA