Gene EcE24377A_2130 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcE24377A_2130
Symbol	araH
ID	5587198
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli E24377A
Kingdom	Bacteria
Replicon accession	NC_009801
Strand	-
Start bp	2109375
End bp	2110361
Gene Length	987 bp
Protein Length	328 aa
Translation table	11
GC content	51%
IMG OID	640925800
Product	L-arabinose transporter permease protein
Protein accession	YP_001463203
Protein GI	157156388
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1172] Ribose/xylose/arabinose/galactoside ABC-type transport systems, permease components
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.000455443
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCTTCTG TTTCTACATC GGGGTCTGGC GCACCTAAGT CGTCATTCAG CTTCGGGCGT 
ATCTGGGATC AGTACGGCAT GCTGGTGGTG TTTGCGGTGC TCTTTATCGC CTGTGCCATT 
TTTGTCCCAA ATTTTGCCAC CTTCATTAAT ATGAAAGGGT TGGGCCTGGC AATTTCCATG 
TCGGGGATGG TGGCGTGTGG CATGTTGTTC TGCCTTGCTT CCGGTGACTT TGACCTTTCT 
GTCGCCTCCG TAATTGCCTG TGCGGGTGTC ACCACGGCGG TGGTTATCAA CCTGACTGAA 
AGCCTGTGGA TTGGCGTGGC AGCGGGGTTG CTGCTTGGCA TTCTCTGTGG CCTGGTCAAT 
GGCTTTGTTA TCGCCAAACT GAAAATAAAT GCTCTGATCA CAACACTGGC AACGATGCAG 
ATTGTTCGAG GTCTGGCGTA CATCATTTCA GACGGTAAAG CGGTCGGTAT CGAAGATGAA 
AGCTTCTTTG CCCTTGGTTA CGCTAACTGG TTCGGTCTGC CTGCGCCAAT CTGGCTCACC 
GTCGCGTGTC TGATTATCTT TGGTTTGTTG CTGAATAAAA CCACCTTTGG TCGTAACACC 
CTGGCGATTG GCGGGAACGA AGAGGCTGCG CGTCTGGCGG GTGTACCGGT TGTTCGCACC 
AAAATTATTA TCTTTGTTCT CTCTGGCCTG GTATCTGCGA TAGCCGGAAT TATTCTGGCT 
TCACGTATGA CTAGTGGGCA GCCAATGACG TCGATTGGTT ATGAGCTTAT TGTTATCTCC 
GCCTGCGTTT TAGGTGGCGT TTCTCTGAAA GGTGGCATCG GAAAAATCTC ATATGTGGTG 
GCGGGTATCT TAATTTTAGG CACCGTGGAA AACGCCATGA ACCTGCTTAA TATTTCTCCT 
TTCGCGCAGT ACGTGGTTCG CGGCTTAATC CTGCTGGCAG CGGTGATCTT CGACCGTTAC 
AAGCAAAAAG CGAAACGCAC TGTCTGA

Protein sequence

MSSVSTSGSG APKSSFSFGR IWDQYGMLVV FAVLFIACAI FVPNFATFIN MKGLGLAISM 
SGMVACGMLF CLASGDFDLS VASVIACAGV TTAVVINLTE SLWIGVAAGL LLGILCGLVN 
GFVIAKLKIN ALITTLATMQ IVRGLAYIIS DGKAVGIEDE SFFALGYANW FGLPAPIWLT 
VACLIIFGLL LNKTTFGRNT LAIGGNEEAA RLAGVPVVRT KIIIFVLSGL VSAIAGIILA 
SRMTSGQPMT SIGYELIVIS ACVLGGVSLK GGIGKISYVV AGILILGTVE NAMNLLNISP 
FAQYVVRGLI LLAAVIFDRY KQKAKRTV