Gene EcSMS35_4849 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_4849
Symbol	uxuA
ID	6147201
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	+
Start bp	4956259
End bp	4957443
Gene Length	1185 bp
Protein Length	394 aa
Translation table	11
GC content	54%
IMG OID	641619653
Product	mannonate dehydratase
Protein accession	YP_001746760
Protein GI	170683309
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1312] D-mannonate dehydratase
TIGRFAM ID	[TIGR00695] mannonate dehydratase

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	46
Fosmid unclonability p-value	0.908596
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGAACAGA CCTGGCGCTG GTACGGCCCA AACGATCCGG TTTCTTTAGC TGATGTCCGT 
CAGGCGGGCG CAACTGGCGT GGTTACCGCG CTGCACCATA TCCCGAACGG CGAAGTATGG 
TCCGTAGAAG AGATCCTCAA ACGCAAGGCG ATCGTTGAAG ACGCAGGCCT GGTGTGGTCT 
GTCGTTGAAA GCGTACCAAT TCACGAAGAT ATCAAAACCC ACACTGGCAA CTATGAGCAG 
TGGATTGCTA ACTATCAGCA GACCCTGCGC AACCTGGCGC AGTGCGGCAT TCGCACCGTG 
TGCTACAACT TCATGCCGGT GCTCGACTGG ACCCGTACTG ACCTCGAATA CGTGCTGCCA 
GACGGCTCCA AAGCTCTGCG CTTCGACCAG ATCGAATTCG CTGCATTCGA AATGCATATC 
CTGAAGCGTC CAGGCGCGGA AGCGGATTAC ACCGAAGAAG AAATTGCTCA GGCCGCTGAA 
CGCTTCGCCA CTATGAGCGA CGAAGACAAA GCGCGTCTGA CCCGTAACAT CATTGCCGGT 
CTGCCAGGTG CGGAAGAAGG GTATACCCTC GACCAGTTCC GTAAGCACCT GGAGCTGTAC 
AAAGATATCG ACAAAGCCAA ACTGCGCGAA AACTTTGCTG TCTTCCTGAA AGCGATTATT 
CCAGTTGCTG AAGAAGTTGG CGTGCGTATG GCGGTTCACC CGGACGATCC GCCGCGCCCA 
ATCCTCGGCC TGCCGCGCAT TGTTTCTACC ATTGAAGATA TGCAGTGGAT GGTTGATACC 
GTAAACAGCA TGGCGAACGG TTTCACCATG TGCACCGGTT CCTACGGCGT GCGTGCTGAC 
AACGATCTGG TTGATATGAT CAAGCAGTTT GGTCCGCGTA TTTACTTCAC CCATCTGCGC 
TCCACCATGC GTGAAGATAA CCCGAAAACC TTCCACGAAG CGGCGCACCT GAACGGTGAC 
GTTGATATGT ACGAAGTGGT GAAAGCGATT GTTGAAGAAG AACACCGTCG TAAAGCGGAA 
GGCAAAGAAG ACCTGATCCC GATGCGTCCG GACCACGGTC ATCAGATGCT GGACGACCTG 
AAGAAGAAAA CCAACCCAGG TTACTCCGCA ATTGGTCGTC TGAAAGGCCT GGCCGAAGTT 
CGCGGTGTCG AACTGGCGAT CCAGCGCGCT TTCTTTAGCC GTTAA

Protein sequence

MEQTWRWYGP NDPVSLADVR QAGATGVVTA LHHIPNGEVW SVEEILKRKA IVEDAGLVWS 
VVESVPIHED IKTHTGNYEQ WIANYQQTLR NLAQCGIRTV CYNFMPVLDW TRTDLEYVLP 
DGSKALRFDQ IEFAAFEMHI LKRPGAEADY TEEEIAQAAE RFATMSDEDK ARLTRNIIAG 
LPGAEEGYTL DQFRKHLELY KDIDKAKLRE NFAVFLKAII PVAEEVGVRM AVHPDDPPRP 
ILGLPRIVST IEDMQWMVDT VNSMANGFTM CTGSYGVRAD NDLVDMIKQF GPRIYFTHLR 
STMREDNPKT FHEAAHLNGD VDMYEVVKAI VEEEHRRKAE GKEDLIPMRP DHGHQMLDDL 
KKKTNPGYSA IGRLKGLAEV RGVELAIQRA FFSR