Gene SbBS512_E1025 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SbBS512_E1025
Symbol	araF
ID	6268904
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shigella boydii CDC 3083-94
Kingdom	Bacteria
Replicon accession	NC_010658
Strand	-
Start bp	947492
End bp	948481
Gene Length	990 bp
Protein Length	329 aa
Translation table	11
GC content	51%
IMG OID	641725168
Product	L-arabinose ABC transporter, periplasmic L-arabinose-binding protein
Protein accession	YP_001879690
Protein GI	187733409
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1879] ABC-type sugar transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	31
Plasmid unclonability p-value	0.636508
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCACAAAT TTACTAAAGC CCTGGCAGCC ATTGGTCTGG CAGCCGTTAT GTCACAATCC 
GCTATGGCGG AGAACCTGAA GCTCGGTTTT CTGGTGAAGC AACCGGAAGA GCCGTGGTTC 
CAGACCGAAT GGAAGTTTGC CGATAAAGCC GGGAAGGATT TAGGGTTTGA GGTTATTAAG 
ATTGCCGTGC CGGATGGCGA AAAAACATTG AACGCGATCG ACAGCCTGGC TGCCAGTGGC 
GCAAAAGGTT TCGTTATTTG TACTCCGGAC CCCAAACTCG GCTCTGCCAT CGTCGCGAAA 
GCGCGTGGCT ACGATATGAA AGTCATTGCC GTGGATGATC AGTTTGTTAA CGCCAAAGGT 
AAGCCAATGG ATACCGTTCC GCTGGTGATG ATGGCGGCGA CTAAAATTGG CGAACGTCAG 
GGTCAGGAAC TGTATAAAGA GATGCAGAAA CGTGGCTGGG ATGTCAAAGA AAGCGCGGTG 
ATGGTGATTA CCGCCAACGA ACTGGATACC GCCCGCCGCC GTACTACGGG ATCTATGGAT 
GCGCTGAAAG CGGCCGGATT CCCGGAAAAA CAAATTTATC AGGTACCTAC CAAATCTAAC 
GACATCCCGG GGGCATTTGA CGCTGCCAAC TCAATGCTGG TTCAACATCC TGAAGTTAAA 
CATTGGCTGA TCGTCGGTAT GAACGACAGC ACCGTGCTGG GCGGCGTACG CGCGACGGAA 
GGTCAGGGCT TTAAAGCTGC TGATATTATC GGCATTGGCA TTAACGGTGT GGATGCGGTG 
AGCGAACTGT CTAAAGTACA GGCAACCGGC TTCTACGGTT CCCTGCTGCC AAGCCCGGAC 
GTACATGGCT ATAAATCCAG CGAAATGCTT TACAACTGGG TAGCAAAAGA CGTTGAACCG 
CCAAAATTTA CCGAAGTTAC CGACGTGGTG CTGATCACGC GTGACAACTT TAAAGAAGAA 
CTGGAGAAAA AAGGTTTAGG CGGTAAGTAA

Protein sequence

MHKFTKALAA IGLAAVMSQS AMAENLKLGF LVKQPEEPWF QTEWKFADKA GKDLGFEVIK 
IAVPDGEKTL NAIDSLAASG AKGFVICTPD PKLGSAIVAK ARGYDMKVIA VDDQFVNAKG 
KPMDTVPLVM MAATKIGERQ GQELYKEMQK RGWDVKESAV MVITANELDT ARRRTTGSMD 
ALKAAGFPEK QIYQVPTKSN DIPGAFDAAN SMLVQHPEVK HWLIVGMNDS TVLGGVRATE 
GQGFKAADII GIGINGVDAV SELSKVQATG FYGSLLPSPD VHGYKSSEML YNWVAKDVEP 
PKFTEVTDVV LITRDNFKEE LEKKGLGGK