Gene EcE24377A_2132 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcE24377A_2132
Symbol	araF
ID	5585995
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli E24377A
Kingdom	Bacteria
Replicon accession	NC_009801
Strand	-
Start bp	2111960
End bp	2112949
Gene Length	990 bp
Protein Length	329 aa
Translation table	11
GC content	52%
IMG OID	640925802
Product	L-arabinose ABC transporter, periplasmic L-arabinose-binding protein
Protein accession	YP_001463205
Protein GI	157159136
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1879] ABC-type sugar transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.00117464
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCACAAAT TTACTAAAGC CCTGGCAGCC ATTGGTCTGG CAGCCGTTAT GTCACAATCC 
GCTATGGCGG AGAACCTGAA GCTCGGTTTC CTGGTGAAGC AACCGGAAGA GCCGTGGTTC 
CAGACCGAAT GGAAGTTTGC CGATAAAGCC GGGAAGGATT TAGGGTTTGA GGTTATTAAG 
ATTGCCGTGC CGGATGGCGA AAAAACATTG AACGCGATCG ACAGCCTGGC TGCCAGTGGC 
GCAAAAGGTT TCGTTATTTG TACTCCGGAC CCCAAACTCG GCTCTGCCAT CGTCGCGAAA 
GCGCGTGGCT ACGATATGAA AGTCATTGCC GTGGATGACC AGTTTGTTAA CGCCAAAGGT 
AAGCCAATGG ATACCGTTCC GCTGGTGATG ATGGCGGCGA CTAAAATTGG CGAACGTCAG 
GGTCAGGAAC TGTATAAAGA GATGCAGAAA CGTGGCTGGG ATGTCAAAGA AAGCGCGGTG 
ATGGCGATTA CCGCCAACGA ACTGGATACG GCACGTCGCC GTACAACGGG TTCTATGGAT 
GCGCTGAAAG CGGCCGGATT CCCGGAAAAA CAAATTTATC AGGTACCTAC CAAATCTAAC 
GACATCCCGG GGGCATTTGA CGCTGCCAAC TCAATGCTGG TTCAACATCC GGAAGTTAAA 
CATTGGCTGA TCGTCGGTAT GAACGACAGC ACCGTGCTGG GCGGCGTACG CGCGACGGAA 
GGTCAGGGCT TTAAAGCTGC CGATATCATC GGCATTGGCA TTAACGGTGT GGATGCGGTG 
AGCGAACTGT CTAAAGCACA GGCAACCGGC TTCTACGGTT CCCTGCTGCC AAGCCCGGAC 
GTACATGGCT ATAAATCCAG CGAAATGCTT TACAACTGGG TAGCAAAAGA CGTTGAACCG 
CCAAAATTTA CCGAAGTTAC CGACGTGGTG CTGATCACGC GTGACAACTT TAAAGAAGAA 
CTGGAGAAAA AAGGTTTAGG CGGTAAGTAA

Protein sequence

MHKFTKALAA IGLAAVMSQS AMAENLKLGF LVKQPEEPWF QTEWKFADKA GKDLGFEVIK 
IAVPDGEKTL NAIDSLAASG AKGFVICTPD PKLGSAIVAK ARGYDMKVIA VDDQFVNAKG 
KPMDTVPLVM MAATKIGERQ GQELYKEMQK RGWDVKESAV MAITANELDT ARRRTTGSMD 
ALKAAGFPEK QIYQVPTKSN DIPGAFDAAN SMLVQHPEVK HWLIVGMNDS TVLGGVRATE 
GQGFKAADII GIGINGVDAV SELSKAQATG FYGSLLPSPD VHGYKSSEML YNWVAKDVEP 
PKFTEVTDVV LITRDNFKEE LEKKGLGGK