Gene EcSMS35_3656 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_3656
Symbol
ID	6144623
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	-
Start bp	3715506
End bp	3716732
Gene Length	1227 bp
Protein Length	408 aa
Translation table	11
GC content	54%
IMG OID	641618483
Product	putative mutase
Protein accession	YP_001745623
Protein GI	170680107
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1015] Phosphopentomutase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	25
Fosmid unclonability p-value	0.000153786
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGGCGCGAT TTGTGGTGTT AGTGATTGAT AGCTTTGGCG TAGGCGCAAT GAAAGATGTC 
ACGCTGGTGC GTCCACAGGA TGCCGGGGCG AATACTTGTG GTCACATCCT GAGCCAGCTG 
CCGCATTTGC AGCTACCAAC GCTGGAGAAG TTGGGGCTAA TCAACGCATT GGGTTATGCG 
CCAGGTGATA TGCAGCCGTC AGACTCCGCA ACCTGGGGTG TGGCAGAGCT GCAACATGAA 
GGTGGCGATA CCTTTATGGG GCATCAGGAA ATTTTAGGCA CGCGCCCGTT ACCACCGCTG 
CGGATGCCTT TTCGCGATGT GATTGACCGT GTTGAGCAGG CATTAGTTTC CGCCGCTTGG 
CAGGTGGAGC GCCGTGGCGA AGAGTTGCAA TTTCTGTGGG TCAATCAGGC GGTTGCGATT 
GGCGATAATC TCGAGGCGGA TTTAGGCCAG GTCTATAACA TCACCGCCAA TCTCTCTGTG 
GTCTCTTTTG ACGACGCAAT CAAAATTGGT CGTATCGTGC GTGAGCAGGT ACCGGTCGGG 
CGGGTCATTA CATTTGGCGG CCTGTTAACC GACAGTCAAC GCATTCTCGA TGCCGCAGAA 
AGCAAAGAAG GGCGCTTTAT TGGCATCAAC GCGCCGCGTT CTGGCGCTTA TGACAACGGT 
TTCCAGGTCG TGCATATGGG CTATGGCGTC GATGAAAAAG TGCAGGTACC ACAAAAACTG 
TATGAAGCAG GCGTGCCAAC CGTGCTGGTG GGTAAGGTGG CAGATATCGT CAACAATCCT 
TATGGCGTGA GCTGGCAAAA CCTGGTGGAT AGCCAGCGGA TTATGGATAT CACCCTCGAC 
GAATTTATCA CCCATCAGAC AGCGTTTATT TGCACCAACA TTCAGGAAAC CGACCTCGCT 
GGTCACGCAG AAGACGTCGC ACGTTATGCT GAACGTTTGC AGGTCGTTGA CCGTAATCTT 
GCTCTCCTGG TTGAGACGAT GCAGCCAGAT GATTGCCTGG TCGTGATGGC GGATCACGGT 
AACGATCCGA CAATCGGTCA CAGCCACCAT ACCCGCGAAG TCGTGCCGGT GCTGGTTTAT 
CAGCAAGGCC TGGCTGCCAC GCAGCTTGGT GTTCGCACCA CGCTCTCCGA TGTGGGCGCT 
ACCGTGTGTG AATTCTTCCG TGCGCCACCG CCACAAAATG GTCGCTCTTT TCTTTCCTCC 
CTCCGGTTTG CAGGAGACAC CCTATGA

Protein sequence

MARFVVLVID SFGVGAMKDV TLVRPQDAGA NTCGHILSQL PHLQLPTLEK LGLINALGYA 
PGDMQPSDSA TWGVAELQHE GGDTFMGHQE ILGTRPLPPL RMPFRDVIDR VEQALVSAAW 
QVERRGEELQ FLWVNQAVAI GDNLEADLGQ VYNITANLSV VSFDDAIKIG RIVREQVPVG 
RVITFGGLLT DSQRILDAAE SKEGRFIGIN APRSGAYDNG FQVVHMGYGV DEKVQVPQKL 
YEAGVPTVLV GKVADIVNNP YGVSWQNLVD SQRIMDITLD EFITHQTAFI CTNIQETDLA 
GHAEDVARYA ERLQVVDRNL ALLVETMQPD DCLVVMADHG NDPTIGHSHH TREVVPVLVY 
QQGLAATQLG VRTTLSDVGA TVCEFFRAPP PQNGRSFLSS LRFAGDTL