Gene EcSMS35_4586 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_4586
Symbol	melB
ID	6143390
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	+
Start bp	4688308
End bp	4689753
Gene Length	1446 bp
Protein Length	481 aa
Translation table	11
GC content	46%
IMG OID	641619402
Product	melibiose:sodium symporter
Protein accession	YP_001746514
Protein GI	170680691
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2211] Na+/melibiose symporter and related transporters
TIGRFAM ID	[TIGR00792] sugar (Glycoside-Pentoside-Hexuronide) transporter

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	54
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGGTAACAG CGACCCGATA CCCTATGAGC ATTTCAATGA CTACAAAACT CAGTTATGGA 
TTTGGAGCGT TCGGGAAGGA TTTTGCGATC GGCATTGTGT ATATGTATCT CATGTATTAC 
TACACCGATG TCGTCGGACT GTCTGTGGGT TTGGTCGGTA CTTTGTTTCT GGTGGCGAGG 
ATCTGGGATG CTATTAACGA TCCGATTATG GGATGGATTG TAAATGCTAC GCGATCGCGA 
TGGGGTAAGT TCAAACCCTG GATCCTGATC GGTACGTTGG CAAACTCTGT AATCTTATTT 
CTCCTCTTTA GTGCGCATCT GTTTGAAGGT ACTACTCAGA TTGTCTTTGT TTGCGTGACC 
TACATCCTCT GGGGCATGAC TTACACCATT ATGGATATTC CCTTCTGGTC GCTGGTTCCA 
ACCATAACGC TCGATAAACG TGAGCGCGAA CAACTGGTTC CTTATCCGCG TTTTTTTGCC 
AGTCTGGCGG GCTTTGTTAC GGCAGGTGTG ACGCTACCAT TTGTTAATTA TGTCGGCGGT 
GGCGATCGGG GATTTGGCTT TCAGATGTTC ACTCTGGTAC TGATCGCCTT TTTTATTGTT 
TCAACCATCA TCACTCTGCG CAATGTGCAT GAAGTCTTTT CGTCAGACAA TCAGCCGTCT 
GCTGAAGGAA GCCATCTGAC ACTTAAAGCC ATCGTTGCGC TTATTTATAA AAACGATCAG 
CTTTCATGCC TCTTGGGTAT GGCTCTTGCT TATAATGTAG CCAGCAATAT TATTACCGGC 
TTTGCTATCT ATTATTTCTC ATATGTTATC GGTGATGCGG ATTTGTTCCC CTATTATCTG 
TCGTATGCGG GAGCTGCTAA CCTGGTGACG TTAGTATTCT TCCCACGCTT AGTTAAATCA 
TTATCCCGAC GCATTTTATG GGCCGGAGCA TCTATTCTTC CGGTGTTAAG CTGTGGTGTT 
CTCCTGTTAA TGGCATTAAT GAGCTATCAC AACGTCGTCC TCATTGTGAT TGCGGGTATT 
TTGCTGAATG TGGGAACGGC GCTTTTCTGG GTATTACAGG TCATCATGGT GGCAGATACC 
GTTGATTACG GTGAATATAA ACTGCACGTA CGCTGTGAAA GCATCGCTTA CTCCGTGCAG 
ACTATGGTGG TGAAGGGCGG TTCAGCCTTT GCGGCTTTTT TCATTGCGGT TGTGTTAGGG 
ATGATTGGCT ATGTACCGAA TGTTGAACAG TCTACGCAAG CCCTATTAGG TATGCAGTTT 
ATTATGATTG CTCTACCCAC TCTGTTTTTC ATGGTAACGC TGATTCTCTA CTTCCGTTTC 
TATCGCCTCA ATGGTGACAC GCTGCGCAGG ATCCAGATCC ATCTGCTGGA TAAATATCGC 
AAAGTACCGC CCGAGCCTGT TCATGCTGAT ATTCCGGTCG GTGCAGTGAG TGATGTGAAA 
GCCTGA

Protein sequence

MVTATRYPMS ISMTTKLSYG FGAFGKDFAI GIVYMYLMYY YTDVVGLSVG LVGTLFLVAR 
IWDAINDPIM GWIVNATRSR WGKFKPWILI GTLANSVILF LLFSAHLFEG TTQIVFVCVT 
YILWGMTYTI MDIPFWSLVP TITLDKRERE QLVPYPRFFA SLAGFVTAGV TLPFVNYVGG 
GDRGFGFQMF TLVLIAFFIV STIITLRNVH EVFSSDNQPS AEGSHLTLKA IVALIYKNDQ 
LSCLLGMALA YNVASNIITG FAIYYFSYVI GDADLFPYYL SYAGAANLVT LVFFPRLVKS 
LSRRILWAGA SILPVLSCGV LLLMALMSYH NVVLIVIAGI LLNVGTALFW VLQVIMVADT 
VDYGEYKLHV RCESIAYSVQ TMVVKGGSAF AAFFIAVVLG MIGYVPNVEQ STQALLGMQF 
IMIALPTLFF MVTLILYFRF YRLNGDTLRR IQIHLLDKYR KVPPEPVHAD IPVGAVSDVK 
A