Gene EcSMS35_3827 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_3827
Symbol
ID	6145775
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	+
Start bp	3895404
End bp	3896726
Gene Length	1323 bp
Protein Length	440 aa
Translation table	11
GC content	56%
IMG OID	641618653
Product	MFS transporter, metabolite:H+ symporter (MHS) family protein
Protein accession	YP_001745793
Protein GI	170680913
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2271] Sugar phosphate permease
TIGRFAM ID	[TIGR00883] metabolite-proton symporter

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	39
Fosmid unclonability p-value	0.151355
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCAAGCAA CAGCCACAAC ACTCGACCAC GAGCAAGAAT ACACGCCGAT CAACTCGCGT 
AATAAAGTCC TTGTCGCCTC TCTCATTGGC ACGGCCATTG AGTTCTTCGA CTTTTACATT 
TACGCCACTG CGGCCGTTAT TGTGTTTCCG CATATCTTCT TCCCGCAGGG TGATCCTACG 
GCAGCAACGC TACAGTCGCT TGCCACCTTC GCCATCGCCT TCGTCGCGCG CCCCATTGGC 
TCTGCCGTTT TTGGTCATTT TGGCGATCGC GTTGGGCGTA AAGCGACGCT GGTCGCCTCG 
TTGCTAACGA TGGGGATTTC GACCGTGGTG ATTGGTCTGC TGCCGGGCTA TGCCACGATT 
GGTATTTTCG CCCCGCTGCT GCTGGCGCTG GCTCGATTTG GTCAGGGTCT GGGTTTAGGC 
GGCGAATGGG GCGGCGCGGC GCTGCTGGCG ACTGAAAACG CCCCACCGCG CAAACGTGCA 
CTGTATGGCT CCTTCCCGCA GCTGGGCGCA CCGATTGGCT TCTTCTTTGC CAACGGCACT 
TTCTTGCTGC TTTCCTGGCT ACTGACCGAC GAGCAGTTTA TGAGCTGGGG CTGGCGCGTG 
CCGTTTATCT TCTCGGCGGT GCTGGTCATT ATCGGCCTGT ATGTTCGCGT GTCGCTGCAT 
GAGTCGCCGG TGTTTGAGAA AGTCGCTAAA GCGAAAAAAC AGGTGAAGAT CCCGCTGGGT 
ACGCTGCTGA CCAAACATGT TCGCGTAACC GTACTGGGTA CGTTCATTAT GCTGGCAACC 
TATACGCTGT TTTACATCAT GACGGTCTAC TCTATGACCT TTAGTACCGC CGCCGCGCCA 
GTTGGGCTTG GCCTGCCGCG TAACGAAGTG TTGTGGATGC TGATGATGGC AGTTATTGGT 
TTTGGCGTGA TGGTGCCAGT CGCCGGATTA CTGGCTGATG CCTTTGGTCG CCGTAAAAGC 
ATGGTAATCA TCACCACGCT GATCATCCTG TTCGCGCTGT TCGCCTTTAA CCCGTTGCTC 
GGTTCTGGCA ACCCGATTCT GGTTTTTGCC TTCCTGCTGC TGGGGTTAAG TCTGATGGGG 
CTGACCTTCG GTCCGATGGG CGCGCTGTTA CCAGAGCTGT TCCCGACAGA AGTGCGTTAC 
ACCGGAGCAT CGTTCTCTTA CAACGTATCG TCGATTCTCG GGGCTTCCGT TGCGCCGTAT 
ATCGCAGCCT GGTTGCAGAC TAACTACGGG TTAGGTGCGG TGGGGCTATA TCTGGCGGCG 
ATGGCTGGCT TGACGTTAAT CGCCCTGCTG CTGACCCATG AGACGCGACA TCAGTCGTTG 
TAA

Protein sequence

MQATATTLDH EQEYTPINSR NKVLVASLIG TAIEFFDFYI YATAAVIVFP HIFFPQGDPT 
AATLQSLATF AIAFVARPIG SAVFGHFGDR VGRKATLVAS LLTMGISTVV IGLLPGYATI 
GIFAPLLLAL ARFGQGLGLG GEWGGAALLA TENAPPRKRA LYGSFPQLGA PIGFFFANGT 
FLLLSWLLTD EQFMSWGWRV PFIFSAVLVI IGLYVRVSLH ESPVFEKVAK AKKQVKIPLG 
TLLTKHVRVT VLGTFIMLAT YTLFYIMTVY SMTFSTAAAP VGLGLPRNEV LWMLMMAVIG 
FGVMVPVAGL LADAFGRRKS MVIITTLIIL FALFAFNPLL GSGNPILVFA FLLLGLSLMG 
LTFGPMGALL PELFPTEVRY TGASFSYNVS SILGASVAPY IAAWLQTNYG LGAVGLYLAA 
MAGLTLIALL LTHETRHQSL