Gene EcSMS35_1032 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_1032
Symbol	ugd
ID	6142746
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	+
Start bp	1053487
End bp	1054653
Gene Length	1167 bp
Protein Length	388 aa
Translation table	11
GC content	44%
IMG OID	641615919
Product	UDP-glucose 6-dehydrogenase
Protein accession	YP_001743111
Protein GI	170680433
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1004] Predicted UDP-glucose 6-dehydrogenase
TIGRFAM ID	[TIGR03026] nucleotide sugar dehydrogenase

Plasmid Coverage information

Num covering plasmid clones	38
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	43
Fosmid unclonability p-value	0.366892
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAATCA CCATTTCCGG TACTGGCTAT GTCGGCTTGT CAAACGGGCT TCTAATCGCA 
CAAAATCATG AGGTTGTGGC ATTAGATATT TTACCGTCAC GCGTTGCTAT GCTGAATGAT 
CGGATATCTC CTATTGTTGA TAAGGAAATT CAGCAGTTTT TGCAATCAGA TAAAATACAC 
TTTAATGCCA CATTAGATAA AAATGAAGCC TACCGGGATG CTGATTATGT CATCATCGCC 
ACTCCAACCG ACTATGATCC TAAAACTAAT TATTTCAATA CATCCAGTGT AGAATCAGTA 
ATTAAAGACG TAGTTGAGAT AAATCCTTAT GCGGTTATGG TGATCAAATC AACGGTTCCC 
GTTGGTTTTA CCGCAGCGAT GCATAAGAAA TATCGCACTG AAAATATTAT ATTCTCCCCG 
GAATTTCTCC GTGAGGGTAA AGCCCTTTAC GATAATCTCC ATCCTTCACG TATTGTCATC 
GGTGAGCGTT CAGAACGCGC AGAACGTTTT GCTGCTCTGT TACAGGAAGG AGCGATTAAG 
CAAAATATCC CGACCCTGTT TACCGACTCC ACTGAAGCAG AAGCGATTAA ACTTTTTGCA 
AACACCTACC TGGCGATGCG CGTGGCGTAC TTTAACGAAC TGGATAGCTA TGCAGAAAGT 
TTAGGTCTGA ATACTCGCCA GATTATCGAA GGCGTTTGTC TCGATCCGCG TATTGGCAAC 
CATTACAACA ACCCGTCGTT TGGCTATGGT GGTTATTGTC TGCCGAAAGA TACCAAGCAG 
TTACTGGCGA ACTACCAGTC TGTGCCGAAT AACCTGATCT CGGCAATTGT CGATGCTAAC 
CGCACACGTA AAGACTTTAT TGCCGATGCC ATTTTGTCAC GCAAACCGCA AGTGGTGGGT 
ATTTATCGTC TGATTATGAA GAGCGGGTCA GATAACTTCC GTGCGTCTTC CATTCAGGGG 
ATTATGAAAC GTATCAAGGC GAAAGGCGTT GAAGTGATCA TCTACGAACC GGTGATGAAA 
GAAGATTCAT TCTTCAACTC TCGCCTGGAA CGTGATCTCG CCACTTTCAA ACAACAAGCC 
GATGTCATTA TTTCCAACCG TATGGCAGAA GAGCTTAAAG ATGTGGCAGA TAAGGTCTAC 
ACCCGCGATC TCTTTGGCAG CGACTAA

Protein sequence

MKITISGTGY VGLSNGLLIA QNHEVVALDI LPSRVAMLND RISPIVDKEI QQFLQSDKIH 
FNATLDKNEA YRDADYVIIA TPTDYDPKTN YFNTSSVESV IKDVVEINPY AVMVIKSTVP 
VGFTAAMHKK YRTENIIFSP EFLREGKALY DNLHPSRIVI GERSERAERF AALLQEGAIK 
QNIPTLFTDS TEAEAIKLFA NTYLAMRVAY FNELDSYAES LGLNTRQIIE GVCLDPRIGN 
HYNNPSFGYG GYCLPKDTKQ LLANYQSVPN NLISAIVDAN RTRKDFIADA ILSRKPQVVG 
IYRLIMKSGS DNFRASSIQG IMKRIKAKGV EVIIYEPVMK EDSFFNSRLE RDLATFKQQA 
DVIISNRMAE ELKDVADKVY TRDLFGSD