Gene TM1040_1183 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	TM1040_1183
Symbol
ID	4077792
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ruegeria sp. TM1040
Kingdom	Bacteria
Replicon accession	NC_008044
Strand	-
Start bp	1272519
End bp	1273631
Gene Length	1113 bp
Protein Length	370 aa
Translation table	11
GC content	62%
IMG OID	638006489
Product	Ppx/GppA phosphatase
Protein accession	YP_613178
Protein GI	99081024
COG category	[F] Nucleotide transport and metabolism [P] Inorganic ion transport and metabolism
COG ID	[COG0248] Exopolyphosphatase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.111108
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCGCCCA GGCGTTCCAA AGGTACAGGA GCGTTTCCCA GAGCGGTTGA GACCCCTGTA 
CCGGCCCGGC CAGATCCGGA TGCGCTCTAT GCAGCGCTGG ATCTTGGCAC CAACAGTTGC 
AGGATGCTGA TTGCCCAACC CAAGGGCAGC GGCTTCCATG TGGTGGACAG TTTTTCAAAG 
TCGGTGCAGC TCGGCTCCGG CCTTGAAAAG ACTGGGCGTT TGTCGCGCTC TTCCATGGCG 
CGCACCATTC AGGCGCTGCG CATCTGTCAG CAGAAAATCA ATCGCAATCG CGTAAAACGC 
ATGCGGCTTG TTGCGACCGA AGCCTGTCGG CGCGCAAAGA ACGGGCGCGA CTTCATGCGC 
CAGATCAAGC GCGAGACCGG CCTCTCCATG GACATCATCC AGCCCGAGGA AGAAGCGCGT 
CTTGCCGTGA TTTCCTGCGC GCCGCTTGTA TCGACGAAAA CCGAACAGCT CTTGGTGGTC 
GACATCGGGG GCGGCTCGAC TGAACTGGTC TGGATCGATA TTTCCTCTGT ACCGCGCCGC 
GACCGCCCGT CGGCGATCAT GCGGCTGCAT GCCGGATTTC ACACCGTCGA GAGCCCCTTT 
CCCGCCGCCA AAGTGGTGGA TTGGATTTCG GTGCCGCTGG GCGTTGCAAC CCTGCGGGAC 
CAGTTCAACG ACGTGGAGGA CGATGCCGCC CGCTTTGCCC TGATGAGCTG GTTCTTCGAG 
GAACATCTGG CCGATTTTGC CCCCTACAAG GACGAACAGG CGCGCGAGGG GTTCCAGATC 
GTCGGCACCT CCGGCACCGT GACCACCGTG GCGGCCTCAC ACCTGGGGCT TAAGCGCTAT 
GACCGCACCA AGGTCGATGG GCTGCGGATG ACATCCGATC AGATCGACAA GGTGATCCGC 
GGCTACCTCG AACTCGGCCC GCAAGGCCGC CGTCGCGATC CTCGTATCGG CGAAGATCGA 
CAAGCGCTTA TTATGTCCGG TGCCGCGATC CTGCAGGCGC TGTTGCGCTG CTGGCCCACC 
GATCGCTTGT CGGTGGCAGA CCGGGGCCTG CGTGAGGGGC TTTTGTACGC GCAGATGAGC 
GCCGATGGCG TGTTGGAGGA CGGCCCTTTC TGA

Protein sequence

MAPRRSKGTG AFPRAVETPV PARPDPDALY AALDLGTNSC RMLIAQPKGS GFHVVDSFSK 
SVQLGSGLEK TGRLSRSSMA RTIQALRICQ QKINRNRVKR MRLVATEACR RAKNGRDFMR 
QIKRETGLSM DIIQPEEEAR LAVISCAPLV STKTEQLLVV DIGGGSTELV WIDISSVPRR 
DRPSAIMRLH AGFHTVESPF PAAKVVDWIS VPLGVATLRD QFNDVEDDAA RFALMSWFFE 
EHLADFAPYK DEQAREGFQI VGTSGTVTTV AASHLGLKRY DRTKVDGLRM TSDQIDKVIR 
GYLELGPQGR RRDPRIGEDR QALIMSGAAI LQALLRCWPT DRLSVADRGL REGLLYAQMS 
ADGVLEDGPF