Gene EcHS_A2283 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcHS_A2283
Symbol	mglA
ID	5594160
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli HS
Kingdom	Bacteria
Replicon accession	NC_009800
Strand	-
Start bp	2279996
End bp	2281516
Gene Length	1521 bp
Protein Length	506 aa
Translation table	11
GC content	45%
IMG OID	640921411
Product	galactose/methyl galaxtoside transporter ATP-binding protein
Protein accession	YP_001458947
Protein GI	157161629
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1129] ABC-type sugar transport system, ATPase component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	50
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGTCAGCT CAACGACTCC GTCTTCCGGG GAATACTTGT TGGAAATGAG CGGTATCAAC 
AAGTCTTTTC CTGGTGTTAA GGCACTTGAT AACGTTAATT TAAAAGTCCG GCCACATTCT 
ATCCATGCAT TAATGGGGGA AAACGGCGCA GGAAAATCAA CATTATTAAA ATGCCTGTTT 
GGTATTTATC AAAAAGACTC CGGCACCATT TTATTCCAGG GTAAAGAGAT CGATTTCCAT 
TCTGCCAAAG AAGCACTGGA AAATGGTATT TCGATGGTAC ACCAGGAGTT AAACCTGGTA 
TTACAACGTT CGGTGATGGA TAACATGTGG CTGGGGCGAT ATCCCACCAA AGGCATGTTT 
GTCGATCAGG ACAAAATGTA CCGCGAAACC AAAGCGATTT TTGATGAACT GGATATTGAT 
ATCGATCCGC GTGCGCGCGT CGGCACATTA TCCGTTTCGC AAATGCAGAT GATCGAAATC 
GCCAAAGCGT TTTCCTATAA CGCGAAAATT GTGATTATGG ATGAACCGAC TTCTTCGTTA 
ACCGAAAAAG AGGTCAATCA TCTGTTCACT ATTATTCGTA AATTAAAAGA GCGCGGCTGC 
GGTATTGTTT ATATCTCGCA TAAAATGGAA GAAATCTTCC AGTTATGTGA TGAAGTTACC 
GTATTGCGCG ACGGTCAGTG GATCGCCACC GAACCGCTGG CAGGACTGAC GATGGACAAG 
ATCATCGCCA TGATGGTTGG GCGTTCTCTT AATCAGCGTT TTCCTGACAA AGAAAACAAG 
CCGGGCGAAG TCATCCTCGA GGTGCGTAAC CTGACGTCAC TGCGCCAGCC GTCGATTCGC 
GATGTCTCGT TTGATCTGCA TAAAGGGGAG ATCCTCGGTA TTGCCGGGCT GGTGGGGGCG 
AAACGTACCG ATATTGTTGA GACGTTATTT GGTATTCGCG AGAAATCGGC TGGCACCATA 
ACGTTGCACG GCAAACAGAT CAATAACCAT AATGCCAACG AAGCCATAAA CCACGGATTT 
GCACTGGTAA CTGAGGAGCG CCGCTCAACG GGAATTTATG CCTATCTGGA TATTGGTTTT 
AACTCGTTAA TTTCCAATAT TCGCAACTAC AAAAATAAAG TTGGTTTACT GGATAACTCG 
CGGATGAAAA GCGATACCCA GTGGGTGATT GATTCGATGC GGGTAAAAAC GCCGGGTCAT 
CGGACGCAAA TTGGTTCGCT CTCCGGTGGT AATCAGCAAA AGGTGATTAT TGGTCGCTGG 
CTACTAACGC AACCAGAAAT ATTAATGCTC GATGAACCGA CGCGCGGTAT TGATGTCGGG 
GCGAAGTTTG AAATTTATCA GTTAATTGCC GAACTGGCGA AGAAAGGCAA GGGGATTATT 
ATTATCTCCT CTGAAATGCC TGAGTTGTTA GGGATAACAG ACCGTATTCT GGTCATGAGC 
AATGGTCTCG TTTCCGGAAT TGTCGACACA AAAACAACAA CGCAAAACGA AATTCTGCGT 
CTTGCGTCTT TGCACCTTTA A

Protein sequence

MVSSTTPSSG EYLLEMSGIN KSFPGVKALD NVNLKVRPHS IHALMGENGA GKSTLLKCLF 
GIYQKDSGTI LFQGKEIDFH SAKEALENGI SMVHQELNLV LQRSVMDNMW LGRYPTKGMF 
VDQDKMYRET KAIFDELDID IDPRARVGTL SVSQMQMIEI AKAFSYNAKI VIMDEPTSSL 
TEKEVNHLFT IIRKLKERGC GIVYISHKME EIFQLCDEVT VLRDGQWIAT EPLAGLTMDK 
IIAMMVGRSL NQRFPDKENK PGEVILEVRN LTSLRQPSIR DVSFDLHKGE ILGIAGLVGA 
KRTDIVETLF GIREKSAGTI TLHGKQINNH NANEAINHGF ALVTEERRST GIYAYLDIGF 
NSLISNIRNY KNKVGLLDNS RMKSDTQWVI DSMRVKTPGH RTQIGSLSGG NQQKVIIGRW 
LLTQPEILML DEPTRGIDVG AKFEIYQLIA ELAKKGKGII IISSEMPELL GITDRILVMS 
NGLVSGIVDT KTTTQNEILR LASLHL