Gene EcHS_A0463 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcHS_A0463
Symbol	araJ
ID	5593213
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli HS
Kingdom	Bacteria
Replicon accession	NC_009800
Strand	-
Start bp	475092
End bp	476360
Gene Length	1269 bp
Protein Length	422 aa
Translation table	11
GC content	50%
IMG OID	640919646
Product	MFS transport protein AraJ
Protein accession	YP_001457231
Protein GI	157159913
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID	[TIGR00880] Multidrug resistance protein

Plasmid Coverage information

Num covering plasmid clones	47
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

TTGGCCTTGC TGGTCGTTAT CCTGCAAGCT ATCACTTTAT TGGCTACGGT GATTGGTAGC 
CGTTCTGGTA GTTGTGATGG TGGTATGAAA AAAGTCATTT TATCTTTGGC TCTGGGCACG 
TTTGGTTTGG GGATGGCCGA ATTTGGCATT ATGGGCGTGC TCACGGAGCT GGCGCATAAC 
GTAGGAATTT CGATTCCTGC TGCCGGGCAT ATGATCTCGT ATTATGCGCT GGGAGTGGTG 
GTCGGTGCGC CAATCATCGC ACTCTTTTCC AGCCGCTACT CACTCAAACA TATCTTGTTG 
TTTCTGGTGG CGTTGTGCGT CATTGGCAAC GCCATGTTCA CGCTCTCTTC GTCTTACCTG 
ATGCTTGCCA TTGGTCGCCT GGTTTCCGGC TTTCCGCATG GCGCATTTTT TGGCGTCGGC 
GCGATCGTGT TATCAAAAAT TATCAAACCC GGAAAAGTCA CCGCCGCCGT GGCGGGGATG 
GTTTCCGGGA TGACAGTCGC CAATTTGCTG GGCATTCCGC TGGGAACGTA TTTAAGTCAG 
GAATTTAGCT GGCGTTACAC CTTTTTATTG ATCGCTGTTT TTAATATTGC GGTGATGGCA 
TCGGTCTATT TTTGGGTGCC GGATATTCGC GACGAGGCGA AAGGAAAGCT GCGCGAACAA 
TTTCACTTTT TACGCAGCCC GGCCCCGTGG TTAATTTTCG CCGCCACGAT GTTTGGCAAC 
GCAGGTGTGT TTGCCTGGTT CAGCTACGTA AAGCCATACA TGATGTTTAT TTCCGGTTTT 
TCGGAAACGG CGATGACCTT TATTATGATG TTAGTTGGGC TAGGGATGGT GTTGGGAAAT 
ATGCTAAGTG GCAGGATTTC AGGACGTTAT TCACCACTGC GCATTGCAGC AGTGACTGAC 
TTTATAATTG TACTGGCACT GCTGATGCTC TTTTTCTGCG GCGGCATGAA AACAACGTCG 
CTTATTTTTG CTTTTATTTG TTGCGCGGGA TTATTTGCCC TTTCAGCACC TCTGCAAATA 
TTATTACTAC AAAATGCCAA AGGCGGAGAG TTATTAGGTG CCGCAGGTGG GCAAATAGCG 
TTTAACCTTG GTAGCGCCGT CGGCGCATAT TGCGGTGGTA TGATGCTGAC GCTGGGGCTG 
GCATATAATT ACGTGGCGCT GCCTGCCGCC CTGCTTTCGT TTGCTGCGAT GTCGTCATTG 
CTGCTGTATG GTCGCTATAA GCGCCAGCAA GCGGCGGATA GTCCGGTGCT GGCGAAACCA 
CTGGGGTAG

Protein sequence

MALLVVILQA ITLLATVIGS RSGSCDGGMK KVILSLALGT FGLGMAEFGI MGVLTELAHN 
VGISIPAAGH MISYYALGVV VGAPIIALFS SRYSLKHILL FLVALCVIGN AMFTLSSSYL 
MLAIGRLVSG FPHGAFFGVG AIVLSKIIKP GKVTAAVAGM VSGMTVANLL GIPLGTYLSQ 
EFSWRYTFLL IAVFNIAVMA SVYFWVPDIR DEAKGKLREQ FHFLRSPAPW LIFAATMFGN 
AGVFAWFSYV KPYMMFISGF SETAMTFIMM LVGLGMVLGN MLSGRISGRY SPLRIAAVTD 
FIIVLALLML FFCGGMKTTS LIFAFICCAG LFALSAPLQI LLLQNAKGGE LLGAAGGQIA 
FNLGSAVGAY CGGMMLTLGL AYNYVALPAA LLSFAAMSSL LLYGRYKRQQ AADSPVLAKP 
LG