Gene EcSMS35_1630 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_1630
Symbol	ydeE
ID	6146188
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	-
Start bp	1620366
End bp	1621553
Gene Length	1188 bp
Protein Length	395 aa
Translation table	11
GC content	50%
IMG OID	641616506
Product	putative MFS-type transporter YdeE
Protein accession	YP_001743684
Protein GI	170682596
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.0579751
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	67
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAACTTAT CCCTACGACG CTCTACCAGC GCCCTTCTTG CCTCGTCGTT GTTATTAACC 
ATCGGACGCG GCGCTACGCT GCCGTTTATG ACCATTTACT TGAGTCGCCA GTACAGCCTG 
AGTGTCGATC TAATCGGTTA TGCGATGACA ATTGCGCTCA CTATTGGCGT CGTTTTTAGC 
CTCGGTTTTG GTATCCTGGC GGATAAGTTC GACAAGAAAC GCTATATGTT ACTGGCAATT 
ACCGCCTTCG CCAGCGGTTT TATTGCCATT CCTTTAGTGA ATAACGTGAC GCTGGTGGTG 
CTCTTTTTTG CCCTTATTAA CTGCGCCTAT TCCGTTTTTG CTACCGTGTT GAAAGCCTGG 
TTTGCCGACA ATCTTTCGTC CACCAGCAAA ACGAAAATCT TCTCAATCAA CTACACCATG 
CTCAACATTG GCTGGACCAT CGGTCCGCCG CTCGGCACGT TGTTGGTGAT GCAGAGCATC 
AATCTGCCCT TTTGGCTGGC AGCTATCTGT TCCGCGTTTC CCATGCTTTT CATTCAAATT 
TGGGTAAAGC GCAGCGAGAA AATCATCGCC ACGGAAACAG GCAGAGCCTG GTCGCCGAAA 
GTTTTATTAC AAGATAAAGC ACTGTTGTGG TTTACCTGCT CTGGTTTTCT GGCTTCCTTT 
GTTAGCGGCG CATTTGCCTC GTGCATTTCA CAATATGTGA TGGTGATTGC TGATGGGGAT 
TTTGCCGAAA AGGTGGTCGC GGTTGTTCTT CCGGTGAATG CTGCCATGGT AGTTACGTTG 
CAATATTCCG TGGGCCGCCG CCTTAACCCG GCTAACATCC GCGCGCTGAT GACAGCAGGC 
ACCCTCTGTT TCGTCATCGG GCTGGTCGGT TTTATTTTTT CCGGCAACAG CCTGCTAATG 
TGGGGTATGT CAGCTGCGGT ATTTACTGTC GGTGAAATCA TTTATGCGCC GGGCGAGTAT 
ATGTTGATTG ACCATATTGC GCCGCCAGGA ATGAAAGCCA GCTATTTTTC CGCCCAGTCT 
TTAGGCTGGC TTGGTGCTGC GATTAACCCA TTAGTGAGTG GCATAGTACT TACCAGTCTG 
CCGCCTTTCT CGCTGTTTAT CATCTTAGCG TTGGTGATCG TTGCTGCGTG GGTGCTGATG 
TTAAAAGGAA TTCGTGCAAG ACCGTGGGGG CAGCCCGCGC TTTGTTGA

Protein sequence

MNLSLRRSTS ALLASSLLLT IGRGATLPFM TIYLSRQYSL SVDLIGYAMT IALTIGVVFS 
LGFGILADKF DKKRYMLLAI TAFASGFIAI PLVNNVTLVV LFFALINCAY SVFATVLKAW 
FADNLSSTSK TKIFSINYTM LNIGWTIGPP LGTLLVMQSI NLPFWLAAIC SAFPMLFIQI 
WVKRSEKIIA TETGRAWSPK VLLQDKALLW FTCSGFLASF VSGAFASCIS QYVMVIADGD 
FAEKVVAVVL PVNAAMVVTL QYSVGRRLNP ANIRALMTAG TLCFVIGLVG FIFSGNSLLM 
WGMSAAVFTV GEIIYAPGEY MLIDHIAPPG MKASYFSAQS LGWLGAAINP LVSGIVLTSL 
PPFSLFIILA LVIVAAWVLM LKGIRARPWG QPALC