Gene EcHS_A1623 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcHS_A1623
Symbol	ydeE
ID	5592610
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli HS
Kingdom	Bacteria
Replicon accession	NC_009800
Strand	+
Start bp	1644399
End bp	1645586
Gene Length	1188 bp
Protein Length	395 aa
Translation table	11
GC content	50%
IMG OID	640920771
Product	putative MFS-type transporter YdeE
Protein accession	YP_001458327
Protein GI	157161009
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	0.000326131
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAACTTAT CCCTACGACG CTCTACCAGC GCCCTTCTTG CCTCGTCGTT GTTATTAACC 
ATCGGACGCG GCGCTACGCT GCCATTTATG ACCATTTACT TGAGTCGCCA GTACAGCCTG 
AGTGTCGATC TAATCGGTTA TGCGATGACA ATTGCGCTCA CTATTGGCGT CGTTTTTAGC 
CTCGGTTTTG GTATCCTGGC GGATAAGTTC GACAAGAAAC GCTATATGTT ACTGGCAATT 
ACCGCCTTCG CCAGCGGTTT TATTGCCATT CCTTTAGTGA ATAACGTGAC GCTGGTTGTG 
CTCTTTTTTG CCCTCATTAA CTGCGCCTAT TCTGTTTTTG CTACCGTGCT GAAAGCCTGG 
TTTGCCGACA ATCTTTCGTC CACCAGCAAA ACGAAAATCT TCTCAATCAA CTACACCATG 
CTAAACATTG GCTGGACCAT CGGTCCGCCG CTCGGCACGC TGTTGGTGAT GCAGAGCATC 
AATCTGCCCT TCTGGCTGGC AGCTATCTGT TCCGCGTTTC CCATGCTTTT CATTCAAATT 
TGGGTAAAGC GCAGCGAGAA AATCATCGCC ACGGAAACAG GCAGTGTCTG GTCGCCGAAA 
GTTTTATTAC AAGATAAAGC ACTGTTGTGG TTTACCTGCT CTGGTTTTCT GGCTTCTTTT 
GTAAGCGGCG CATTTGCTTC ATGCATTTCA CAATATGTGA TGGTGATTGC TGATGGGGAT 
TTTGCCGAAA AGGTGGTCGC GGTTGTTCTT CCGGTGAATG CTGCCATGGT GGTTACGTTG 
CAATATTCCG TGGGCCGCCG ACTTAACCCG GCTAACATCC GCGCGCTGAT GACAGCAGGC 
ACCCTCTGTT TCGTCATCGG TCTGGTCGGT TTTATTTTTT CCGGCAACAG CCTGCTATTG 
TGGGGTATGT CAGCTGCGGT ATTTACTGTC GGTGAAATCA TTTATGCGCC GGGCGAGTAT 
ATGTTGATTG ACCATATTGC GCCGCCAGGA ATGAAAGCCA GCTATTTTTC CGCCCAGTCT 
TTAGGCTGGC TTGGTGCCGC GATTAACCCA TTAGTGAGTG GCGTAGTGCT AACCAGCCTG 
CCGCCTTCCT CGCTGTTTGT CATCTTAGCG TTGGTGATCA TTGCTGCGTG GGTGCTGATG 
TTAAAAGGGA TTCGAGCAAG ACCGTGGGGG CAGCCCGCGC TTTGTTGA

Protein sequence

MNLSLRRSTS ALLASSLLLT IGRGATLPFM TIYLSRQYSL SVDLIGYAMT IALTIGVVFS 
LGFGILADKF DKKRYMLLAI TAFASGFIAI PLVNNVTLVV LFFALINCAY SVFATVLKAW 
FADNLSSTSK TKIFSINYTM LNIGWTIGPP LGTLLVMQSI NLPFWLAAIC SAFPMLFIQI 
WVKRSEKIIA TETGSVWSPK VLLQDKALLW FTCSGFLASF VSGAFASCIS QYVMVIADGD 
FAEKVVAVVL PVNAAMVVTL QYSVGRRLNP ANIRALMTAG TLCFVIGLVG FIFSGNSLLL 
WGMSAAVFTV GEIIYAPGEY MLIDHIAPPG MKASYFSAQS LGWLGAAINP LVSGVVLTSL 
PPSSLFVILA LVIIAAWVLM LKGIRARPWG QPALC