Gene TM1040_1857 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	TM1040_1857
Symbol
ID	4077882
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ruegeria sp. TM1040
Kingdom	Bacteria
Replicon accession	NC_008044
Strand	+
Start bp	1958393
End bp	1960039
Gene Length	1647 bp
Protein Length	548 aa
Translation table	11
GC content	65%
IMG OID	638007173
Product	Ppx/GppA phosphatase
Protein accession	YP_613852
Protein GI	99081698
COG category	[F] Nucleotide transport and metabolism [P] Inorganic ion transport and metabolism
COG ID	[COG0248] Exopolyphosphatase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCATTC AGCCCGATGC CCCGCACCGC GACCTCGACA CGACGCCCCC TGTGGCGGAT 
GCCCCGGAGG CCGCAGCGCC TGATGCGGCG GCAGAGGATT GGGGGCCGTT TGGTCGCCCG 
CTTTTTGACG ATCCCGATGC CCGCGCCCTG AGCCGGGTGG GTGTGGTCGA TGTGGGGTCG 
AACTCTGTGC GCCTGGTGGT TTTTGACGGC GCCGCCCGCA GCCCCGCCTA TTTCTACAAC 
GAGAAAATCA TGTGCGGCCT GGGCGCGGGC CTCTCTGAGA CCGGCAAGCT CAACCCCAAG 
GGGCGCGCGC GCGCGCTCGA GGCGCTGAAA CGGTTCCAGA TGCTGGCCAA GGGGCTCTTG 
AGCGACCCGC TGACGGTGGT GGCCACCGCG GCGGTGCGCG ATGCCAGCGA CGGGCCGGAG 
TTCTGCGCCG AGGTCGAGGC CGCCACGGGC CTGCGCATCC GCGTCATCAC CGGCGAGGAA 
GAGGCGCGGC TCTCGGCGCA AGGCGTGCTC TTGGGCTGGC CCGGCGCCTA TGGGCTGATC 
TGCGATATCG GCGGATCCTC GATGGAGCTT GCGGAAATTC AGGACGGCGA GGTCGGCCGA 
TGCGTGACCT CCAATCTCGG GCCCCTGAAG CTCAAGGATA TCAAGGGCGG GCGCAAGGGA 
CGCAAGGCGC ATATCGACGA GGTGATGGCC TCTTTGCGCG ACCAGTTGGG CGATCAGCGG 
GATCGCCTGT TCCTCGTGGG GGGGAGCTGG CGTGCGATTG CGCGGCTCGA CATGCTGCGG 
CGCAACTATC CGCTGACGGT GCAGCACGAA TACCGCATGA CCGCCAAGGA CGTGCGCGAG 
ACGATCAAGT TCATCGAACA GAACGACCTT GAGAAACTGC GCTCTGACTG CGGGGTCTCC 
TCGGCGCGGA TGGCGCTTGT GCCCTATGCA ATCGACGTGT TGGCGCGTCT CATCAAGACG 
TTCCGCCCCA AGGACATTGC GATTTCCAGC TATGGCATCC GCGAGGGGCT TTTGTATGAG 
CAGATGCCGG ATCGGCTGCG CCAACGCGAT CCGCTCATTG AAGCGGCGCG TTTTGCCGAG 
GCCAAGGACG CGCGAGTTCC GGGCTTTGGG AAGACGCTCT ACACCTTTGT AAAACCGCTG 
TTTTCCGGCG CGCCCTACGC CAAGATGCGG CTCGTCAAAG CGGCCTGCGT GCTGCATGAC 
GTAAGCTGGC GCGCGCATCC CGATTATCGC GCGGAGGTCT GTTTTGACAA CGCCACCCGC 
GCCAACCTTG GTGGGCTCAA ACATTCCGAG CGGATCTTTC TGGGGCTGGC GCTGCTGCAT 
CGCTATCGCA ACAAGCGTCA GGGCACCCAT TTTGAGCATC TCTATGATCT GCTGCCGTCC 
GAAAAGCAGA AAGAGGCGGA AATTCTAGGC AAGGCGATGC GCTTTGGCGC GATGCTGATG 
GTGGGCGAGG ATCAGGACAT TGGCCGCCTG CGCTGGCAGC CGCGCAAACG CACGCTGCAT 
GTGGAACTCC CCGCAGAGAG CGCGGCGCTC TTTGGGGAGG TGGCGCAGTC GCGGCTGATG 
TCCCTCGTCA ACACACTCAA GGCCGAAGTC CGTGTGAGCG TTGCAGGCCG ACGCGGCGCG 
CTGCTGGAAA AAGACGCGCG CGACTGA

Protein sequence

MTIQPDAPHR DLDTTPPVAD APEAAAPDAA AEDWGPFGRP LFDDPDARAL SRVGVVDVGS 
NSVRLVVFDG AARSPAYFYN EKIMCGLGAG LSETGKLNPK GRARALEALK RFQMLAKGLL 
SDPLTVVATA AVRDASDGPE FCAEVEAATG LRIRVITGEE EARLSAQGVL LGWPGAYGLI 
CDIGGSSMEL AEIQDGEVGR CVTSNLGPLK LKDIKGGRKG RKAHIDEVMA SLRDQLGDQR 
DRLFLVGGSW RAIARLDMLR RNYPLTVQHE YRMTAKDVRE TIKFIEQNDL EKLRSDCGVS 
SARMALVPYA IDVLARLIKT FRPKDIAISS YGIREGLLYE QMPDRLRQRD PLIEAARFAE 
AKDARVPGFG KTLYTFVKPL FSGAPYAKMR LVKAACVLHD VSWRAHPDYR AEVCFDNATR 
ANLGGLKHSE RIFLGLALLH RYRNKRQGTH FEHLYDLLPS EKQKEAEILG KAMRFGAMLM 
VGEDQDIGRL RWQPRKRTLH VELPAESAAL FGEVAQSRLM SLVNTLKAEV RVSVAGRRGA 
LLEKDARD