Gene EcHS_A4361 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcHS_A4361
Symbol	melB
ID	5594348
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli HS
Kingdom	Bacteria
Replicon accession	NC_009800
Strand	+
Start bp	4367390
End bp	4368811
Gene Length	1422 bp
Protein Length	473 aa
Translation table	11
GC content	46%
IMG OID	640923459
Product	melibiose:sodium symporter
Protein accession	YP_001460904
Protein GI	157163586
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2211] Na+/melibiose symporter and related transporters
TIGRFAM ID	[TIGR00792] sugar (Glycoside-Pentoside-Hexuronide) transporter

Plasmid Coverage information

Num covering plasmid clones	53
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCATTT CAATGACTAC AAAACTCAGT TATGGATTTG GAGCGTTCGG GAAGGATTTT 
GCGATCGGCA TTGTGTATAT GTACCTCATG TATTACTACA CCGATGTCGT CGGGCTGTCT 
GTGGGTTTGG TCGGTACTTT GTTTCTGGTG GCGAGGATCT GGGATGCTAT TAACGATCCG 
ATTATGGGAT GGATTGTAAA TGCTACGCGA TCGCGATGGG GTAAGTTCAA ACCCTGGATC 
CTGATCGGTA CGTTGGCAAA CTCTGTAATC TTATTTCTCC TCTTTAGTGC GCATCTGTTT 
GAAGGTACTA CTCAGATTGT CTTTGTTTGC GTGACCTACA TCCTCTGGGG CATGACTTAC 
ACCATTATGG ATATTCCCTT CTGGTCGCTG GTTCCAACCA TCACGCTCGA TAAACGTGAG 
CGCGAACAAC TGGTTCCTTA TCCGCGTTTT TTTGCCAGTC TGGCAGGCTT TGTTACGGCA 
GGTGTGACGC TACCATTTGT TAATTATGTC GGCGGTGGCG ATCGGGGATT TGGCTTTCAG 
ATGTTCACTC TGGTACTGAT CGCCTTTTTT ATTGTTTCAA CCATCATCAC TCTGCGCAAT 
GTGCATGAAG TCTTTTCGTC AGACAATCAA CCGTCTGCTG AAGGAAGCCA TCTGACACTT 
AAAGCCATCG TTGCGCTAAT TTATAAAAAC GATCAGCTTT CATGCCTCTT GGGTATGGCT 
CTTGCTTATA ATGTAGCCAG CAACATTATT ACCGGATTTG CTATCTATTA TTTCTCATAT 
GTTATCGGTG ATGCGGATTT GTTCCCCTAT TATCTGTCGT ATGCGGGAGC TGCTAACCTG 
GTGACGTTAG TATTCTTCCC ACGCTTAGTT AAATCATTAT CCCGACGCAT TTTATGGGCC 
GGAGCATCTA TTCTTCCGGT GTTAAGCTGT GGTGTTCTCC TGTTAATGGC ATTAATGAGC 
TATCACAACG TCGTCCTCAT TGTGATTGCG GGTATTTTGC TGAATGTGGG AACGGCGCTT 
TTCTGGGTAT TACAGGTCAT CATGGTGGCA GATACCGTTG ATTACGGTGA ATATAAACTG 
CACGTACGCT GTGAAAGTAT CGCTTACTCC GTGCAGACTA TGGTGGTGAA GGGCGGTTCA 
GCCTTTGCGG CTTTTTTCAT TGCGGTTGTG TTAGGGATGA TTGGCTATGT ACCGAATGTT 
GAACAGTCTA CGCAAGCCCT ATTAGGTATG CAGTTTATTA TGATTGCTCT ACCAACTCTG 
TTTTTCATGG TAACGCTGAT TCTCTACTTC CGTTTCTATC GCCTCAATGG CGACACGCTG 
CGCAGGATCC AGATTCATCT GCTGGATAAA TATCGCAAAG TACCGCCCGA GCCTGTTCAT 
GCTGATATTC CGGTCGGTGC AGTGAGTGAT GTGAAAGCCT GA

Protein sequence

MSISMTTKLS YGFGAFGKDF AIGIVYMYLM YYYTDVVGLS VGLVGTLFLV ARIWDAINDP 
IMGWIVNATR SRWGKFKPWI LIGTLANSVI LFLLFSAHLF EGTTQIVFVC VTYILWGMTY 
TIMDIPFWSL VPTITLDKRE REQLVPYPRF FASLAGFVTA GVTLPFVNYV GGGDRGFGFQ 
MFTLVLIAFF IVSTIITLRN VHEVFSSDNQ PSAEGSHLTL KAIVALIYKN DQLSCLLGMA 
LAYNVASNII TGFAIYYFSY VIGDADLFPY YLSYAGAANL VTLVFFPRLV KSLSRRILWA 
GASILPVLSC GVLLLMALMS YHNVVLIVIA GILLNVGTAL FWVLQVIMVA DTVDYGEYKL 
HVRCESIAYS VQTMVVKGGS AFAAFFIAVV LGMIGYVPNV EQSTQALLGM QFIMIALPTL 
FFMVTLILYF RFYRLNGDTL RRIQIHLLDK YRKVPPEPVH ADIPVGAVSD VKA