Gene EcSMS35_1287 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_1287
Symbol	araH
ID	6146473
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	+
Start bp	1275976
End bp	1276962
Gene Length	987 bp
Protein Length	328 aa
Translation table	11
GC content	51%
IMG OID	641616165
Product	L-arabinose transporter permease protein
Protein accession	YP_001743345
Protein GI	170680269
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1172] Ribose/xylose/arabinose/galactoside ABC-type transport systems, permease components
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.00785622
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	0.000000602764
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGTCTTCTG TTTCTACATC GGGGTCTGGC GCACCTAAGT CGTCATTCAG CTTCGGGCGT 
ATCTGGGATC AGTACGGCAT GCTGGTGGTG TTTGCGGTGC TCTTTATCGC CTGTGCCATT 
TTTGTCCCAA ATTTTGCCAC CTTCATTAAT ATGAAAGGGT TGGGCCTGGC AATTTCCATG 
TCGGGGATGG TGGCGTGTGG CATGTTGTTC TGCCTTGCTT CCGGTGACTT TGACCTTTCT 
GTCGCCTCCG TAATTGCCTG TGCGGGTGTC ACCACGGCGG TGGTTATCAA CCTGACTGAA 
AGCCTGTGGA TTGGCGTGGC AGCGGGGTTG CTGCTTGGCA TTCTCTGTGG CCTGGTCAAT 
GGCTTTGTTA TCGCCAAACT GAAAATAAAT GCTCTGATCA CAACACTGGC AACGATGCAG 
ATTGTTCGAG GTCTGGCGTA CATCATTTCA GACGGTAAAG CGGTCGGTAT CGAAGATGAA 
AGCTTCTTTG CCCTTGGTTA CGCTAACTGG TTCGGTCTGC CTGCGCCAAT CTGGCTCACC 
GTCGCGTGTC TGATTATCTT TGGTTTGTTG CTGAATAAAA CCACCTTTGG TCGTAACACC 
CTGGCGATTG GCGGGAACGA AGAGGCTGCG CGTCTGGCGG GTGTACCGGT TGTTCGCACC 
AAAATTATTA TCTTTGTTCT CTCTGGCCTG GTATCTGCGA TAGCCGGAAT TATTCTGGCT 
TCACGTATGA CCAGTGGGCA GCCAATGACG TCGATTGGTT ATGAGCTTAT TGTTATCTCC 
GCCTGCGTTT TAGGTGGCGT TTCTCTGAAA GGTGGCATCG GAAAAATCTC ATATGTGGTG 
GCGGGTATCT TAATTTTAGG CACCGTGGAA AACGCCATGA ACCTGCTTAA TATTTCTCCT 
TTCGCGCAGT ACGTGGTTCG CGGCTTAATC CTGCTGGCAG CGGTGATCTT CGACCGTTAC 
AAGCAAAAAG CGAAACGCAC TGTCTGA

Protein sequence

MSSVSTSGSG APKSSFSFGR IWDQYGMLVV FAVLFIACAI FVPNFATFIN MKGLGLAISM 
SGMVACGMLF CLASGDFDLS VASVIACAGV TTAVVINLTE SLWIGVAAGL LLGILCGLVN 
GFVIAKLKIN ALITTLATMQ IVRGLAYIIS DGKAVGIEDE SFFALGYANW FGLPAPIWLT 
VACLIIFGLL LNKTTFGRNT LAIGGNEEAA RLAGVPVVRT KIIIFVLSGL VSAIAGIILA 
SRMTSGQPMT SIGYELIVIS ACVLGGVSLK GGIGKISYVV AGILILGTVE NAMNLLNISP 
FAQYVVRGLI LLAAVIFDRY KQKAKRTV