Gene EcSMS35_1285 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_1285
Symbol	araF
ID	6142831
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	+
Start bp	1273388
End bp	1274377
Gene Length	990 bp
Protein Length	329 aa
Translation table	11
GC content	52%
IMG OID	641616163
Product	L-arabinose ABC transporter, periplasmic L-arabinose-binding protein
Protein accession	YP_001743343
Protein GI	170680933
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1879] ABC-type sugar transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.0482207
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	0.00000138898
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGCACAAAT TTACTAAAGC CCTGGCAGCC ATTGGTCTGG CAGCCGTTAT GTCACAATCC 
GCTATGGCGG AGAACCTGAA GCTCGGTTTT CTGGTGAAGC AACCGGAAGA GCCGTGGTTC 
CAGACCGAAT GGAAGTTTGC CGATAAAGCC GGGAAGGATT TAGGGTTTGA GGTTATTAAG 
ATTGCCGTGC CGGATGGCGA AAAAACATTG AACGCGATCG ACAGCCTGGC TGCCAGTGGC 
GCAAAAGGTT TCGTTATTTG TACTCCGGAC CCCAAACTCG GCTCTGCCAT CGTCGCGAAA 
GCGCGTGGCT ACGATATGAA AGTCATTGCC GTGGATGACC AGTTTGTTAA CGCCAAAGGT 
AAGCCAATGG ATACCGTTCC GCTGGTGATG ATGGCGGCGA CTAAAATTGG CGAACGTCAG 
GGCCAGGAAC TGTATAAAGA GATGCAGAAA CGTGGCTGGG ATGTCAAAGA AAGCGCGGTG 
ATGGCGATTA CCGCCAACGA ACTGGATACC GCCCGCCGCC GTACTACGGG ATCTATGGAT 
GCGCTGAAAG CGGCCGGATT CCCGGAAAAA CAAATTTATC AGGTACCTAC CAAATCTAAC 
GACATCCCGG GGGCATTTGA CGCTGCCAAC TCAATGCTGG TTCAACATCC GGAAGTTAAA 
CATTGGCTGA TCGTCGGTAT GAACGACAGC ACCGTGCTGG GCGGCGTACG CGCGACGGAA 
GGTCAGGGCT TTAAAGCGGC CGATATCATC GGCATTGGCA TTAACGGTGT GGATGCGGTG 
AGCGAACTGT CTAAAGCACA GGCAACCGGC TTCTACGGTT CCCTGCTGCC AAGCCCGGAC 
GTACATGGCT ATAAATCCAG CGAAATGCTT TACAACTGGG TAGCAAAAGA CGTTGAACCG 
CCAAAATTTA CCGAAGTTAC CGACGTGGTA CTGATCACGC GTGACAACTT TAAAGAAGAA 
CTGGAGAAAA AAGGTTTAGG CGGTAAGTAA

Protein sequence

MHKFTKALAA IGLAAVMSQS AMAENLKLGF LVKQPEEPWF QTEWKFADKA GKDLGFEVIK 
IAVPDGEKTL NAIDSLAASG AKGFVICTPD PKLGSAIVAK ARGYDMKVIA VDDQFVNAKG 
KPMDTVPLVM MAATKIGERQ GQELYKEMQK RGWDVKESAV MAITANELDT ARRRTTGSMD 
ALKAAGFPEK QIYQVPTKSN DIPGAFDAAN SMLVQHPEVK HWLIVGMNDS TVLGGVRATE 
GQGFKAADII GIGINGVDAV SELSKAQATG FYGSLLPSPD VHGYKSSEML YNWVAKDVEP 
PKFTEVTDVV LITRDNFKEE LEKKGLGGK