Gene EcHS_A0066 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcHS_A0066
Symbol	araA
ID	5593125
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli HS
Kingdom	Bacteria
Replicon accession	NC_009800
Strand	-
Start bp	68590
End bp	70092
Gene Length	1503 bp
Protein Length	500 aa
Translation table	11
GC content	55%
IMG OID	640919254
Product	L-arabinose isomerase
Protein accession	YP_001456849
Protein GI	157159531
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2160] L-arabinose isomerase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	69
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACGATTT TTGATAATTA TGAAGTGTGG TTTGTCATTG GCAGCCAGCA TCTGTATGGC 
CCGGAAACCC TGCGTCAGGT CACCCAACAT GCCGAGCACG TTGTTAATGC GCTGAATACG 
GAAGCGAAAC TGCCCTGCAA ACTAGTGTTG AAACCGCTGG GCACCACGCC GGATGAAATC 
ACCGCTATTT GCCGCGACGC GAATTACGAC GATCGTTGCG CTGGTCTGGT GGTGTGGCTG 
CACACTTTCT CCCCGGCCAA AATGTGGATC AACGGCCTGA CCATGCTCAA CAAACCGTTG 
CTGCAATTCC ACACCCAGTT TAACGCGGCG CTGCCGTGGG ACAGTATCGA TATGGACTTT 
ATGAACCTGA ACCAGACTGC ACATGGCGGT CGCGAGTTCG GCTTCATTGG CGCGCGTATG 
CGTCAGCAAC ATGCCGTGGT TACCGGTCAC TGGCAGGATA AACAAGCCCA TGAGCGTATC 
GGCTCCTGGA TGCGCCAGGC GGTCTCTAAA CAGGATACCC GTCATCTGAA AGTCTGCCGT 
TTTGGCGATA ACATGCGTGA AGTAGCGGTC ACCGATGGTG ATAAAGTTGC CGCACAGATC 
AAGTTCGGTT TCTCCGTCAA TACCTGGGCG GTTGGCGATC TGGTGCAGGT GGTGAACTCC 
ATCAGCGACG GCGATGTTAA CGCGCTGGTC GATGAGTACG AAAGCTGCTA CACCATGACG 
CCTGCCACAC AAATCCACGG CGAAAAACGA CAGAACGTGC TGGAAGCGGC GCGTATTGAG 
CTGGGGATGA AGCGTTTCCT GGAACAAGGT GGCTTCCACG CGTTCACCAC CACCTTTGAA 
GATTTGCACG GTCTGAAACA GCTTCCAGGT CTGGCCGTAC AGCGTCTGAT GCAGCAGGGT 
TACGGCTTTG CGGGCGAAGG CGACTGGAAA ACCGCCGCCC TGCTTCGCAT CATGAAGGTG 
ATGTCAACCG GTCTGCAGGG CGGCACCTCC TTTATGGAGG ACTACACCTA TCACTTCGAG 
AAAGGTAATG ACCTGGTGCT CGGCTCCCAT ATGCTGGAAG TCTGCCCGTC GATTGCCGTA 
GAAGAGAAAC CGATCCTCGA CGTTCAGCAT CTCGGTATTG GTGGTAAGGA CGATCCTGCC 
CGACTGATCT TCAATACCCA AACCGGTCCA GCGATTGTCG CCAGCCTGAT TGATCTCGGC 
GATCGTTACC GTCTGCTGGT TAACTGTATC GACACGGTGA AAACACCGCA CTCCCTGCCG 
AAACTGCCGG TGGCGAATGC GCTGTGGAAA GCGCAACCGG ATCTGCCAAC TGCTTCCGAA 
GCGTGGATCC TTGCTGGTGG CGCGCACCAT ACCGTCTTCA GCCATGCGCT GAACCTCAAC 
GATATGCGCC AGTTCGCCGA GATGCACGAC ATTGAAATCA CGGTGATTGA TAACGACACC 
CGCCTGCCAG CGTTTAAAGA CGCACTGCGC TGGAACGAAG TGTATTACGG ATTTCGTCGC 
TAA

Protein sequence

MTIFDNYEVW FVIGSQHLYG PETLRQVTQH AEHVVNALNT EAKLPCKLVL KPLGTTPDEI 
TAICRDANYD DRCAGLVVWL HTFSPAKMWI NGLTMLNKPL LQFHTQFNAA LPWDSIDMDF 
MNLNQTAHGG REFGFIGARM RQQHAVVTGH WQDKQAHERI GSWMRQAVSK QDTRHLKVCR 
FGDNMREVAV TDGDKVAAQI KFGFSVNTWA VGDLVQVVNS ISDGDVNALV DEYESCYTMT 
PATQIHGEKR QNVLEAARIE LGMKRFLEQG GFHAFTTTFE DLHGLKQLPG LAVQRLMQQG 
YGFAGEGDWK TAALLRIMKV MSTGLQGGTS FMEDYTYHFE KGNDLVLGSH MLEVCPSIAV 
EEKPILDVQH LGIGGKDDPA RLIFNTQTGP AIVASLIDLG DRYRLLVNCI DTVKTPHSLP 
KLPVANALWK AQPDLPTASE AWILAGGAHH TVFSHALNLN DMRQFAEMHD IEITVIDNDT 
RLPAFKDALR WNEVYYGFRR