Gene EcSMS35_4498 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_4498
Symbol	lamB
ID	6142859
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	+
Start bp	4595521
End bp	4596861
Gene Length	1341 bp
Protein Length	446 aa
Translation table	11
GC content	52%
IMG OID	641619314
Product	maltoporin
Protein accession	YP_001746426
Protein GI	170684303
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG4580] Maltoporin (phage lambda and maltose receptor)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	59
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATGATTA CTCTGCGCAA ACTTCCTCTG GCGGTTGCCG TCGCAGCGGG CGTAATGTCT 
GCTCAGGCAA TGGCTGTTGA TTTCCACGGC TATGCACGTT CCGGTATTGG CTGGACAGGT 
AGCGGCGGTG AACAACAGTG TTTCCAGACT ACCGGTGCTC AAAGTAAATA CCGTCTTGGC 
AACGAATGTG AAACTTATGC TGAATTAAAA TTGGGTCAGG AAGTGTGGAA AGAGGGCGAT 
AAGAGCTTCT ATTTCGACAC TAACGTGGCC TATTCCGTCG CACAACAGAA TGACTGGGAA 
GCTACCGATC CGGCCTTCCG TGAAGCAAAC GTGCAGGGTA AAAACCTGAT CGAATGGCTG 
CCAGGCTCCA CCATCTGGGC AGGTAAGCGC TTCTACCAAC GTCATGACGT TCATATGATC 
GACTTCTACT ACTGGGATAT TTCTGGTCCT GGTGCCGGTC TGGAAAACAT CGATGTTGGC 
TTCGGTAAAC TCTCTCTGGC AGCAACCCGC TCCTCTGAAG CTGGTGGTTC TTCCTCTTTC 
GCCAGCAACA ATATTTATGA CTATACCAAC GAAACCGCGA ACGACGTTTT CGACGTGCGT 
TTAGCGCAGA TGGAAATCAA CCCGGGCGGC ACATTAGAAC TGGGTGTCGA CTACGGTCGT 
GCCAACCTGC GTGATAACTA TCGTCTGGTT GATGGCGCAT CGAAAGACGG TTGGTTATTC 
ACTGCTGAAC ATACTCAGAG TGTCCTGAAG GGCTTTAACA AGTTTGTTGT TCAGTACGCT 
ACTGACTCGA TGACCTCACA GGGTAAAGGT CTGTCGCAGG GTTCTGGCGT CGCGTTTGAT 
AACGAAAAAT TTGCCTACAA TATCAACAAC AACGGTCACA TGCTGCGTAT CCTCGACCAC 
GGTGCGATCT CCATGGGCGA TAACTGGGAC ATGATGTACG TGGGTATGTA CCAGGATATC 
AACTGGGATA ACGACAACGG CACCAAGTGG TGGACCGTCG GTATTCGCCC GATGTACAAG 
TGGACGCCAA TCATGAGCAC CGTGATGGAA ATCGGCTACG ACAACGTCGA ATCCCAGCGC 
ACCGGCGACA AGAACAATCA GTACAAAATT ACCCTTGCAC AACAATGGCA GGCTGGCGAC 
AGCATCTGGT CACGCCCGGC TATTCGTGTC TTCGCAACCT ACGCCAAGTG GGATGAGAAA 
TGGGGTTACG ACTACACCGG TAACGCCAAT ACCAACACTA ACTTCGGCAA AGCCGTTCCT 
GCTGATTTCA ACGGCGGCAG CTTCGGTCGT GGCGACAGCG ACGAGTGGAC CTTCGGTGCC 
CAGATGGAAA TCTGGTGGTA A

Protein sequence

MMITLRKLPL AVAVAAGVMS AQAMAVDFHG YARSGIGWTG SGGEQQCFQT TGAQSKYRLG 
NECETYAELK LGQEVWKEGD KSFYFDTNVA YSVAQQNDWE ATDPAFREAN VQGKNLIEWL 
PGSTIWAGKR FYQRHDVHMI DFYYWDISGP GAGLENIDVG FGKLSLAATR SSEAGGSSSF 
ASNNIYDYTN ETANDVFDVR LAQMEINPGG TLELGVDYGR ANLRDNYRLV DGASKDGWLF 
TAEHTQSVLK GFNKFVVQYA TDSMTSQGKG LSQGSGVAFD NEKFAYNINN NGHMLRILDH 
GAISMGDNWD MMYVGMYQDI NWDNDNGTKW WTVGIRPMYK WTPIMSTVME IGYDNVESQR 
TGDKNNQYKI TLAQQWQAGD SIWSRPAIRV FATYAKWDEK WGYDYTGNAN TNTNFGKAVP 
ADFNGGSFGR GDSDEWTFGA QMEIWW