Gene EcolC_2124 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_2124
Symbol
ID	6066848
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	-
Start bp	2321350
End bp	2322537
Gene Length	1188 bp
Protein Length	395 aa
Translation table	11
GC content	50%
IMG OID	641601532
Product	putative MFS-type transporter YdeE
Protein accession	YP_001725091
Protein GI	170020137
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.0942294
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	0.976791
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAACTTAT CCCTACGACG CTCTACCAGC GCCCTTCTTG CCTCGTCGTT GTTATTAACC 
ATCGGACGCG GCGCTACGCT GCCATTTATG ACCATTTACT TGAGTCGCCA GTACAGCCTG 
AGTGTCGATC TAATCGGTTA TGCGATGACA ATTGCGCTCA CTATTGGCGT CGTTTTTAGC 
CTCGGTTTTG GTATCCTGGC GGATAAGTTC GACAAGAAAC GCTATATGTT ACTGGCAATT 
ACCGTCTTCG CCAGCGGTTT TATTGCCATT CCTTTAGTGA ATAACGTGAC GCTGGTTGTG 
CTCTTTTTTG CCCTCATTAA CTGCGCCTAT TCTGTTTTTG CTACCGTGCT GAAAGCCTGG 
TTTGCCGACA ATCTTTCGTC CACCAGCAAA ACGAAAATCT TCTCAATCAA CTACACCATG 
CTAAACATTG GCTGGACCAT CGGTCCGCCG CTCGGCACGC TGTTGGTGAT GCAGAGCATC 
AATCTGCCCT TCTGGCTGGC AGCTATCTGT TCCGCGTTTC CCATGCTTTT CATTCAAATT 
TGGGTAAAGC GCAGCGAGAA AATCATCGCC ACGGAAACAG GCAGTGTCTG GTCGCCGAAA 
GTTTTATTAC AAGATAAAGC ACTGTTGTGG TTTACCTGCT CTGGTTTTCT GGCTTCTTTT 
GTAAGCGGCG CATTTGCTTC ATGCATTTCA CAATATGTGA TGGTGATTGC TGATGGGGAT 
TTTGCCGAAA AGGTGGTCGC GGTTGTTCTT CCGGTGAATG CTGCCATGGT GGTTACGTTG 
CAATATTCCG TGGGCCGCCG ACTTAACCCG GCTAACATCC GCGCGCTGAT GACAGCAGGC 
ACCCTCTGTT TCGTCATCGG TCTGGTCGGT TTTATTTTTT CCGGCAACAG CCTGCTATTG 
TGGGGTATGT CAGCTGCGGT ATTTACTGTC GGTGAAATCA TTTATGCGCC GGGCGAGTAT 
ATGTTGATTG ACCATATTGC GCCGCCAGGA ATGAAAGCCA GCTATTTTTC CGCCCAGTCT 
TTAGGCTGGC TTGGTGCCGC GATTAACCCA TTAGTGAGTG GCGTAGTGCT AACCAGCCTG 
CCGCCTTCCT CGCTGTTTGT CATCTTAGCG TTGGTGATCA TTGCTGCGTG GGTGCTGATG 
TTAAAAGGGA TTCGAGCAAG ACCGTGGGGG CAGCCCGCGC TTTGTTGA

Protein sequence

MNLSLRRSTS ALLASSLLLT IGRGATLPFM TIYLSRQYSL SVDLIGYAMT IALTIGVVFS 
LGFGILADKF DKKRYMLLAI TVFASGFIAI PLVNNVTLVV LFFALINCAY SVFATVLKAW 
FADNLSSTSK TKIFSINYTM LNIGWTIGPP LGTLLVMQSI NLPFWLAAIC SAFPMLFIQI 
WVKRSEKIIA TETGSVWSPK VLLQDKALLW FTCSGFLASF VSGAFASCIS QYVMVIADGD 
FAEKVVAVVL PVNAAMVVTL QYSVGRRLNP ANIRALMTAG TLCFVIGLVG FIFSGNSLLL 
WGMSAAVFTV GEIIYAPGEY MLIDHIAPPG MKASYFSAQS LGWLGAAINP LVSGVVLTSL 
PPSSLFVILA LVIIAAWVLM LKGIRARPWG QPALC