Gene B21_01858 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	B21_01858
Symbol	araF
ID	8113517
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli BL21
Kingdom	Bacteria
Replicon accession	NC_012892
Strand	-
Start bp	1929595
End bp	1930584
Gene Length	990 bp
Protein Length	329 aa
Translation table	11
GC content	52%
IMG OID	644848077
Product	hypothetical protein
Protein accession	YP_002999650
Protein GI	251785346
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1879] ABC-type sugar transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.128061
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCACAAAT TTACTAAAGC CCTGGCAGCC ATTGGTCTGG CAGCCGTTAT GTCACAATCC 
GCTATGGCGG AGAACCTGAA GCTCGGTTTT CTGGTGAAGC AACCGGAAGA GCCGTGGTTC 
CAGACCGAAT GGAAGTTTGC CGATAAAGCC GGGAAGGATT TAGGGTTTGA GGTTATTAAG 
ATTGCCGTGC CGGATGGCGA AAAAACATTG AACGCGATCG ACAGCCTGGC TGCCAGTGGC 
GCAAAAGGTT TCGTTATTTG TACTCCGGAC CCCAAACTCG GCTCTGCCAT CGTCGCGAAA 
GCGCGTGGCT ACGATATGAA AGTCATTGCC GTGGATGACC AGTTTGTTAA CGCCAAAGGT 
AAGCCAATGG ATACCGTTCC GCTGGTGATG ATGGCGGCGA CTAAAATTGG CGAACGTCAG 
GGCCAGGAAC TGTATAAAGA GATGCAGAAA CGTGGCTGGG ATGTCAAAGA AAGCGCGGTG 
ATGGCGATTA CCGCCAACGA ACTGGATACC GCCCGCCGCC GTACTACGGG ATCTATGGAT 
GCGCTGAAAG CGGCCGGATT CCCGGAAAAA CAAATTTATC AGGTACCTAC CAAATCTAAC 
GACATCCCGG GGGCATTTGA CGCTGCCAAC TCAATGCTGG TTCAACATCC GGAAGTTAAA 
CATTGGCTGA TCGTCGGTAT GAACGACAGC ACCGTGCTGG GCGGCGTACG CGCGACGGAA 
GGTCAGGGCT TTAAAGCGGC CGATATCATC GGCATTGGCA TTAACGGTGT GGATGCGGTG 
AGCGAACTGT CTAAAGCACA GGCAACCGGC TTCTACGGTT CCCTGCTGCC AAGCCCGGAC 
GTACATGGCT ATAAATCCAG CGAAATGCTT TACAACTGGG TAGCAAAAGA CGTTGAACCG 
CCAAAATTTA CCGAAGTTAC CGACGTGGTA CTGATCACGC GTGACAACTT TAAAGAAGAA 
CTGGAGAAAA AAGGTTTAGG CGGTAAGTAA

Protein sequence

MHKFTKALAA IGLAAVMSQS AMAENLKLGF LVKQPEEPWF QTEWKFADKA GKDLGFEVIK 
IAVPDGEKTL NAIDSLAASG AKGFVICTPD PKLGSAIVAK ARGYDMKVIA VDDQFVNAKG 
KPMDTVPLVM MAATKIGERQ GQELYKEMQK RGWDVKESAV MAITANELDT ARRRTTGSMD 
ALKAAGFPEK QIYQVPTKSN DIPGAFDAAN SMLVQHPEVK HWLIVGMNDS TVLGGVRATE 
GQGFKAADII GIGINGVDAV SELSKAQATG FYGSLLPSPD VHGYKSSEML YNWVAKDVEP 
PKFTEVTDVV LITRDNFKEE LEKKGLGGK