Gene SbBS512_E2135 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SbBS512_E2135
Symbol	malE
ID	6271526
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shigella boydii CDC 3083-94
Kingdom	Bacteria
Replicon accession	NC_010658
Strand	-
Start bp	1943662
End bp	1944894
Gene Length	1233 bp
Protein Length	410 aa
Translation table	11
GC content	40%
IMG OID	641726169
Product	maltose/maltodextrin-binding periplasmic protein MalE
Protein accession	YP_001880661
Protein GI	187731820
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2182] Maltose-binding periplasmic proteins/domains
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	32
Plasmid unclonability p-value	0.905565
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAGCTTT CAAATATCGT CACAGTTATA ATTCTTGCAA TTTCCAGTAC GCTAACACCC 
CAGGCGATGG CAGAAAAATT AATTCCTGAA ACTGATGCTG AGTTGTTAGT TTGGTCTGAT 
GCCACAAGCG TGGAATATAT GAAATATGCA GCAAAGGAAT TCAATAAAGA TTTTGGCTAC 
AAGGTAAAGT TTACATTTCG CAATATAGCG CCAATGGATG CAGCATCAAG AATTATGCAG 
GATGGGGGTA CGACTCGTGT AGCTGATGTA GCTGAAATTG AACATGATAC CCTGGGGCGG 
TTAGTCGTTG CTGGCGGGGT TATGGAAAAC ATGGTCTCAG CTGAGCGGAT TAAAAAAACA 
TTTATTCCAG GCGCAGTATC GGCAGCTACA TATAATAACA TCAGCTATGG TTTTCCTGTA 
AGTTTCGCAA CGCTGGCGCT TTTCTATAAT AAGGATTTGT TAAACACCGC ACCAAAAACA 
TTCGAAGAAA TCAATACTTT CAGTGAAAAG TTTAATAATT CATCCGAGCA TAAATATGCT 
CTGCTATGGG ATGTACAAAA TTATTATGTT TCACGTATGT TTATTACCTT GTATGGTGCC 
AACGAATTCG GTAAAATCGG TAACGATCCT AAAGCTCTAG GCATCGCTTC ATCTGAAGCG 
AAGAAAGGGC TAGAGACGAT GAAACGCTTA AAGAAAGCGA ATCCCTCTAA TCCTCTTGAT 
ATGGGTAATC CACAAGTTCT AAGAGGTCTG TTTAATGAAG GTAAAGTTGC TGCTGTAATC 
GACGGACCTT GGTCCATACA AGGTTACATT GACAGCGGAA TCAATTTTGG CGTGACACGC 
ATCCCAACAT TAGATGGTCA TCAGCCTCGC ACATTTTCAA CAGTACGGCT GGCCGTTGTA 
AGCTCATTTA CCGCATATCC TCATGCCGCT GAATTATTCG CTGACTACCT GACAACGGAT 
AAGATGTTGA TGAAGCGTTA TGAAATGACG AATCTCATCC CACCAATCGA TTCACTTATG 
AACAAAATTA GCCAGACAGG TAGTGAAGCT ATAAAAGCAA TTATTGCTCA AGCTAATTAT 
TCTGACGCAA TGCCATCAAT ACCGGAAATG TCTTATTTAT GGTCTCCAAT GACTAATGCT 
ATTTTGGCTA CCTGGGTTGA GAATAAAACA CCGGATGAAG TTTTAAATCA TGCACAAACA 
ATTATTGAAG AACAACTTTC GCTTCAGGAG TAA

Protein sequence

MKLSNIVTVI ILAISSTLTP QAMAEKLIPE TDAELLVWSD ATSVEYMKYA AKEFNKDFGY 
KVKFTFRNIA PMDAASRIMQ DGGTTRVADV AEIEHDTLGR LVVAGGVMEN MVSAERIKKT 
FIPGAVSAAT YNNISYGFPV SFATLALFYN KDLLNTAPKT FEEINTFSEK FNNSSEHKYA 
LLWDVQNYYV SRMFITLYGA NEFGKIGNDP KALGIASSEA KKGLETMKRL KKANPSNPLD 
MGNPQVLRGL FNEGKVAAVI DGPWSIQGYI DSGINFGVTR IPTLDGHQPR TFSTVRLAVV 
SSFTAYPHAA ELFADYLTTD KMLMKRYEMT NLIPPIDSLM NKISQTGSEA IKAIIAQANY 
SDAMPSIPEM SYLWSPMTNA ILATWVENKT PDEVLNHAQT IIEEQLSLQE