Gene EcE24377A_1870 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcE24377A_1870
Symbol
ID	5590613
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli E24377A
Kingdom	Bacteria
Replicon accession	NC_009801
Strand	-
Start bp	1861939
End bp	1863108
Gene Length	1170 bp
Protein Length	389 aa
Translation table	11
GC content	53%
IMG OID	640925546
Product	major facilitator transporter
Protein accession	YP_001462951
Protein GI	157158785
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	4
Plasmid unclonability p-value	0.0000000971933
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAATTA ACTATCCGTT GCTGGCGCTG GCGATTGGCG CGTTTGGTAT CGGGACAACG 
GAGTTCTCGC CAATGGGTTT GTTGCCCGTC ATTGCGCGCG GTGTGGATGT CTCGATTCCC 
GCTGCCGGAA TGTTAATCAG TGCCTATGCA GTTGGCGTAA TGGTGGGCGC GCCGCTGATG 
ACGCTTCTAC TTTCTCATCG TGCCCGCCGC AGTGCGTTGA TTTTCCTGAT GGCAATTTTC 
ACGCTCGGCA ACGTACTTTC CGCCATCGCG CCGGATTATA TGACCCTGAT GCTTTCACGC 
ATTTTGACCA GCCTGAATCA CGGAGCATTT TTTGGTTTGG GTTCAGTCGT GGCCGCAAGC 
GTGGTGCCAA AACATAAACA GGCCAGCGCA GTTGCCACTA TGTTTATGGG GTTAACCCTG 
GCAAATATCG GTGGCGTGCC GGCGGCGACC TGGTTGGGTG AAACCATCGG CTGGCGGATG 
TCATTTCTGG CAACGGCGGG GCTGGGAGTG ATTTCAATGG TAAGTCTGTT CTTCTCATTA 
CCTAAAGGTG GTGCAGGGGC ACGACCTGAA GTGAAAAAAG AGCTGGCGGT ATTAATGCGT 
CCGCAGGTGC TGTCTGCATT GCTGACGACG GTACTGGGAG CTGGTGCAAT GTTTACTCTC 
TACACCTATA TCTCTCCGGT ACTGCAAAGT ATTACCCACG CAACACCGGT GTTCGTCACG 
GCAATGCTGG TGCTGATTGG TGTCGGATTC TCTATCGGTA ACTATCTCGG CGGCAAACTG 
GCAGATCGTT CAGTTAACGG CACGTTGAAA GGCTTTTTGT TGTTGTTGAT GGTGATTATG 
CTGGCAATCC CGTTCCTGGC CCGCAATGAG TTCGGCGCAG CTATTAGCAT GGTGGTGTGG 
GGCGCAGCAA CCTTTGCGGT CGTACCGCCG TTACAGATGC GCGTGATGCG TGTCGCCAGT 
GAAGCGCCAG GTCTGTCTTC ATCAGTCAAT ATTGGTGCCT TTAATCTTGG AAATGCGCTG 
GGAGCAGCTG CTGGTGGTGC GGTAATTTCC GCTGGGCTGG GATACAGCTT TGTGCCGGTG 
ATGGGAGCGA TTGTCGCGGG ACTGGCATTA TTGCTGGTGT TTATGTCAGC CAGAAAACAA 
CCTGAAACAG TTTGCGTTGC TAACAGCTAA

Protein sequence

MKINYPLLAL AIGAFGIGTT EFSPMGLLPV IARGVDVSIP AAGMLISAYA VGVMVGAPLM 
TLLLSHRARR SALIFLMAIF TLGNVLSAIA PDYMTLMLSR ILTSLNHGAF FGLGSVVAAS 
VVPKHKQASA VATMFMGLTL ANIGGVPAAT WLGETIGWRM SFLATAGLGV ISMVSLFFSL 
PKGGAGARPE VKKELAVLMR PQVLSALLTT VLGAGAMFTL YTYISPVLQS ITHATPVFVT 
AMLVLIGVGF SIGNYLGGKL ADRSVNGTLK GFLLLLMVIM LAIPFLARNE FGAAISMVVW 
GAATFAVVPP LQMRVMRVAS EAPGLSSSVN IGAFNLGNAL GAAAGGAVIS AGLGYSFVPV 
MGAIVAGLAL LLVFMSARKQ PETVCVANS