Gene EcHS_A2817 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcHS_A2817
Symbol
ID	5595479
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli HS
Kingdom	Bacteria
Replicon accession	NC_009800
Strand	+
Start bp	2825859
End bp	2827043
Gene Length	1185 bp
Protein Length	394 aa
Translation table	11
GC content	54%
IMG OID	640921933
Product	major facilitator family transporter
Protein accession	YP_001459450
Protein GI	157162132
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	61
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACTAAAC CTAATCATGA GCTTAGCCCG GCGCTGATCG TGCTGATGTC TATCGCCACC 
GGTCTGGCGG TCGCCAGTAA CTATTACGCT CAGCCATTGC TCGACACCAT CGCGCGTAAC 
TTTTCCCTTT CCGCCAGTTC GGCAGGCTTT ATTGTTACCG CCGCGCAATT GGGCTATGCA 
GCAGGTCTGC TGTTTCTTGT TCCCCTCGGT GATATGTTTG AACGCCGCCG CCTGATTGTC 
TCGATGACCT TACTGGCGGC AGGCGGCATG TTAATCACTG CCAGCAGTCA GTCGCTGGCG 
ATGATGATCC TCGGTACGGC ATTAACCGGT TTATTCTCTG TCGTGGCACA AATTCTGGTT 
CCGCTGGCAG CGACGCTGGC TTCACCGGAC AAACGCGGCA AAGTGGTTGG CACTATTATG 
AGCGGTCTGC TGTTGGGGAT CTTGCTGGCA CGGACAGTTG CCGGATTGCT GGCGAATCTC 
GGCGGCTGGC GCACCGTCTT TTGGGTTGCT TCGGTGTTAA TGGCACTGAT GGCGCTGGCA 
TTATGGCGTG GTCTGCCACA AATGAAATCA GAAACCCACC TCAACTACCC ACAGTTGTTG 
GGTTCCGTTT TCAGTATGTT TATCAGCGAT AAAATTCTGC GTACCCGCGC GTTGCTGGGC 
TGCCTGACCT TTGCCAATTT CAGCATTCTC TGGACCTCAA TGGCCTTTTT GCTTGCCGCT 
CCACCTTTTA ACTACAGCGA TGGTGTAATT GGTCTGTTTG GACTTGCGGG AGCTGCCGGA 
GCGTTGGGCG CTCGTCCGGC GGGCGGTTTT GCCGATAAGG GCAAATCGCA CCACACCACA 
ACTTTCGGTC TGCTGCTGCT ATTACTTTCA TGGCTGGCGA TCTGGTTTGG TCACACTTCC 
GTACTGGCGT TGATTATCGG AATCCTGGTG CTGGATCTCA CCGTGCAGGG CGTGCATATC 
ACTAACCAGA CGGTAATTTA TCGGATACAT CCTGATGCGC GCAATCGCCT GACCGCAGGT 
TACATGACTA GCTACTTTAT TGGCGGTGCC GCCGGTTCGC TAATTTCAGC CTCAGCCTGG 
CAACATGGCG GTTGGGCTGG CGTTTGTCTG GCTGGCGCGA CGATTGCCCT GGTTAACTTA 
CTGGTCTGGT GGCGAGGTTT TCATCGTCAG GAAGCCGCAA ATTAA

Protein sequence

MTKPNHELSP ALIVLMSIAT GLAVASNYYA QPLLDTIARN FSLSASSAGF IVTAAQLGYA 
AGLLFLVPLG DMFERRRLIV SMTLLAAGGM LITASSQSLA MMILGTALTG LFSVVAQILV 
PLAATLASPD KRGKVVGTIM SGLLLGILLA RTVAGLLANL GGWRTVFWVA SVLMALMALA 
LWRGLPQMKS ETHLNYPQLL GSVFSMFISD KILRTRALLG CLTFANFSIL WTSMAFLLAA 
PPFNYSDGVI GLFGLAGAAG ALGARPAGGF ADKGKSHHTT TFGLLLLLLS WLAIWFGHTS 
VLALIIGILV LDLTVQGVHI TNQTVIYRIH PDARNRLTAG YMTSYFIGGA AGSLISASAW 
QHGGWAGVCL AGATIALVNL LVWWRGFHRQ EAAN