Gene EcolC_1736 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_1736
Symbol	araH
ID	6065478
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	+
Start bp	1933150
End bp	1934136
Gene Length	987 bp
Protein Length	328 aa
Translation table	11
GC content	51%
IMG OID	641601151
Product	L-arabinose transporter permease protein
Protein accession	YP_001724713
Protein GI	170019759
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1172] Ribose/xylose/arabinose/galactoside ABC-type transport systems, permease components
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.612736
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCTTCTG TTTCTACATC GGGGTCTGGC GCACCTAAGT CGTCATTCAG CTTCGGGCGT 
ATCTGGGATC AGTACGGCAT GCTGGTGGTG TTTGCGGTGC TCTTTATCGC CTGTGCCATT 
TTTGTCCCAA ATTTTGCCAC CTTCATTAAT ATGAAAGGGT TGGGCCTGGC AATTTCCATG 
TCGGGGATGG TGGCTTGTGG CATGTTGTTC TGCCTCGCTT CCGGTGACTT TGACCTTTCT 
GTCGCCTCCG TAATTGCCTG TGCGGGTGTC ACCACGGCGG TGGTTATTAA CCTGACTGAA 
AGCCTGTGGA TTGGCGTGGC AGCGGGGTTG TTGCTGGGCG TTCTCTGTGG CCTGGTCAAT 
GGCTTTGTTA TCGCCAAACT GAAAATAAAT GCTCTGATCA CGACATTGGC AACGATGCAG 
ATTGTTCGAG GTCTGGCGTA CATCATTTCA GACGGTAAAG CGGTCGGTAT CGAAGATGAA 
AGCTTCTTTG CCCTTGGTTA CGCCAACTGG TTCGGTCTGC CTGCGCCAAT CTGGCTCACC 
GTCGCGTGTC TGATTATCTT TGGTTTGCTG CTGAATAAAA CCACCTTTGG TCGTAACACC 
CTGGCGATTG GCGGGAACGA AGAGGCCGCG CGTCTGGCGG GTGTACCGGT TGTTCGCACC 
AAAATTATTA TCTTTGTTCT CTCAGGCCTG GTATCAGCGA TAGCCGGAAT TATTCTGGCT 
TCACGTATGA CCAGTGGGCA GCCAATGACG TCGATTGGTT ATGAGCTGAT TGTTATCTCC 
GCCTGCGTTT TAGGTGGCGT TTCTCTGAAA GGTGGCATCG GAAAAATCTC ATATGTGGTG 
GCGGGTATCT TAATTTTAGG CACCGTGGAA AACGCCATGA ACCTGCTTAA TATTTCTCCT 
TTCGCGCAGT ACGTGGTTCG CGGCTTAATC CTGCTGGCAG CGGTGATCTT CGACCGTTAC 
AAGCAAAAAG CGAAACGCAC TGTCTGA

Protein sequence

MSSVSTSGSG APKSSFSFGR IWDQYGMLVV FAVLFIACAI FVPNFATFIN MKGLGLAISM 
SGMVACGMLF CLASGDFDLS VASVIACAGV TTAVVINLTE SLWIGVAAGL LLGVLCGLVN 
GFVIAKLKIN ALITTLATMQ IVRGLAYIIS DGKAVGIEDE SFFALGYANW FGLPAPIWLT 
VACLIIFGLL LNKTTFGRNT LAIGGNEEAA RLAGVPVVRT KIIIFVLSGL VSAIAGIILA 
SRMTSGQPMT SIGYELIVIS ACVLGGVSLK GGIGKISYVV AGILILGTVE NAMNLLNISP 
FAQYVVRGLI LLAAVIFDRY KQKAKRTV