Gene EcSMS35_3384 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_3384
Symbol	uxaC
ID	6146085
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	-
Start bp	3468043
End bp	3469455
Gene Length	1413 bp
Protein Length	470 aa
Translation table	11
GC content	54%
IMG OID	641618213
Product	glucuronate isomerase
Protein accession	YP_001745362
Protein GI	170683343
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1904] Glucuronate isomerase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.666142
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	62
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACTCCGT TTATGACTGA AGATTTCCTG TTAGATACCG AATTTGCCCG CCGTCTGTAT 
CACGACTACG CAAAAGACCA GCCGATTTTC GATTACCATT GCCATTTGCC GCCGCAGCAG 
ATTGCGGAAG ACTATCGTTT TAAAAACCTG TATGACATCT GGTTGAAGGG CGATCACTAC 
AAATGGCGCG CTATGCGTAC CAACGGTGTG GCCGAGCGTC TGTGCACCGG TGATGCGTCT 
GACCGTGAAA AATTTGACGC CTGGGCGGCG ACTGTTCCGC ATACTATCGG CAACCCGTTA 
TACCACTGGA CGCACCTCGA ACTGCGTCGT CCGTTTGGTA TCACTGGCAA ATTGCTTTCT 
CCGTCAACTG CCGATGAAAT CTGGAACGAA TGTAACGAAT TGCTGGCGCA GGATAATTTC 
TCTGCACGCG GCATCATGCA GCAGATGAAC GTGAAAATGG TCGGCACCAC CGATGACCCG 
ATCGATTCTC TGGAGCATCA CGCAGAGATC GCCAAAGATG GCTCTTTCAC CATTAAAGTG 
CTGCCGAGCT GGCGTCCGGA CAAAGCCTTT AACATTGAAC AGGCGACCTT TAACGACTAC 
ATGGCGAAGC TGGGCGAAGT TTCCGATACC GACATTCGCC GCTTTGCTGA CCTGCAAACA 
GCCCTGACTA AACGTCTGGA TCACTTCGCC GCTCACGGCT GTAAAGTGTC TGACCACGCG 
CTGGATGTAG TGATGTTTGC TGAAGCGAAC GAAGCGGAAC TGGACAGCAT CCTCGCGCGC 
CGTCTGGCAG GCGAAACCCT GAGCGAGCAC GAAGTGGCAC AGTTCAAAAC TGCGGTGCTG 
GTGTTCCTCG GCGCTGAATA CGCACGTCGC GGCTGGGTAC AGCAGTACCA TATTGGCGCA 
CTGCGTAATA ACAACCTGCG TCAGTTTAAA CTGCTGGGGC CGGATGTCGG CTTTGACTCC 
ATCAACGACC GTCCGATGGC GGAAGAGCTG TCTAAGCTGC TGAGCAAGCA GAACGAAGAA 
AACCTGCTGC CGAAAACCAT TCTCTACTGC CTGAACCCGC GCGATAACGA AGTGCTGGGC 
ACCATGATCG GTAACTTCCA GGGCGAAGGT ATGCCGGGCA AAATGCAGTT CGGTTCCGGC 
TGGTGGTTTA ACGACCAGAA AGACGGTATG GAACGTCAGA TGACCCAACT GGCGCAGCTC 
GGTCTGCTGA GCCGCTTTGT CGGTATGCTG ACTGACAGCC GTAGCTTCCT GTCATACACC 
CGTCACGAAT ACTTCCGCCG CATTCTGTGC CAGATGATCG GTCGCTGGGT GGAAGCAGGC 
GAAGCACCGG CGGACATCAA CCTGCTGGGC GAGATGGTGA AAAATATTTG CTTTAACAAT 
GCGCGTGACT ACTTCGCCAT TGAACTGAAC TAA

Protein sequence

MTPFMTEDFL LDTEFARRLY HDYAKDQPIF DYHCHLPPQQ IAEDYRFKNL YDIWLKGDHY 
KWRAMRTNGV AERLCTGDAS DREKFDAWAA TVPHTIGNPL YHWTHLELRR PFGITGKLLS 
PSTADEIWNE CNELLAQDNF SARGIMQQMN VKMVGTTDDP IDSLEHHAEI AKDGSFTIKV 
LPSWRPDKAF NIEQATFNDY MAKLGEVSDT DIRRFADLQT ALTKRLDHFA AHGCKVSDHA 
LDVVMFAEAN EAELDSILAR RLAGETLSEH EVAQFKTAVL VFLGAEYARR GWVQQYHIGA 
LRNNNLRQFK LLGPDVGFDS INDRPMAEEL SKLLSKQNEE NLLPKTILYC LNPRDNEVLG 
TMIGNFQGEG MPGKMQFGSG WWFNDQKDGM ERQMTQLAQL GLLSRFVGML TDSRSFLSYT 
RHEYFRRILC QMIGRWVEAG EAPADINLLG EMVKNICFNN ARDYFAIELN