Gene BMASAVP1_A0406 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BMASAVP1_A0406
Symbol	araF
ID	4681735
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia mallei SAVP1
Kingdom	Bacteria
Replicon accession	NC_008785
Strand	-
Start bp	399268
End bp	400263
Gene Length	996 bp
Protein Length	331 aa
Translation table	11
GC content	67%
IMG OID	639844683
Product	L-arabinose ABC transporter, periplasmic L-arabinose-binding protein
Protein accession	YP_991756
Protein GI	121598246
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1879] ABC-type sugar transport system, periplasmic component
TIGRFAM ID	[TIGR01409] Tat (twin-arginine translocation) pathway signal sequence

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAACGCA GAACGTTCAT CACGTTGGCG GCAGCGGCGG CGGTCGCGGC GGCGGGCCTG 
CCCGCGCAGG CGGCCGAGCC CGTGAAGATC GGCTTCCTCG TCAAGCAGCC CGAGGAGCCG 
TGGTTCCAGG ACGAATGGAA ATTCGCCGAG CTCGCCGCGA AGGACAAGGG CTTCACGCTC 
GTGAAGATCG GCGCGCCGTC CGGCGAGAAG GTGATGAGCG CGATCGACAA TCTCGCCGCG 
CAGAAGGCGC AGGGCTTCAT CATCTGCACG CCGGACGTGA AGCTCGGGCC GGGCATCGTC 
GCGAAGGCGA AGTCGCACGG CCTGAAGATG ATGACGGTCG ATGACCGGCT CGTCGACGGC 
GCGGGCAAGC CGATCGAATC GGTTCCGCAC ATGGGCATTT CCGCGTACGA CATCGGCAAG 
CAGGTCGGCG GCGGGATCGC GGCGGAGATC AAGAGGCGCG GCTGGAACAT GAACGAAGTC 
GGCGCGATCG ACATCACGTA CGAGCAGTTG CCGACCGCGC ACGACCGCAC GACGGGCGCG 
ACCGACGCGC TCGTCGCCGC GGGCTTTCCG AAGGCGAACG TGATTGCCGC GCCGCAGGCG 
AAGACCGACA CCGAGAACGC GTTCAACGCG GCGAACATCG CGCTCACGAA GAATCCGAAG 
TTCAAGCACT GGGTCGCCTA CGGCCTGAAC GACGAAGCGG TGCTCGGCGC GGTGCGCGCG 
GCCGAAGGGC GCGGCTTCAA GGCGGCCGAC ATGATCGGCA TCGGCATCGG CGGCTCGGAC 
TCGGCGCTCA GCGAGTTCAA GAAGCCGCAG CCGACCGGCT TCTTCGGCAC CGTGATCATT 
AGCCCGAAGC GGCACGGCGA AGAGACTTCC GAGCTGATGT ACGCGTGGAT CACGCAAGGC 
AAGGCGCCGC CGCCGCTCAC GCTGACGACG GGCATGCTCG CGACGCGCGA GAACGTCGCG 
CAGGTGCGCG AGACGATGGG GCTCGCGGCG AAGTGA

Protein sequence

MKRRTFITLA AAAAVAAAGL PAQAAEPVKI GFLVKQPEEP WFQDEWKFAE LAAKDKGFTL 
VKIGAPSGEK VMSAIDNLAA QKAQGFIICT PDVKLGPGIV AKAKSHGLKM MTVDDRLVDG 
AGKPIESVPH MGISAYDIGK QVGGGIAAEI KRRGWNMNEV GAIDITYEQL PTAHDRTTGA 
TDALVAAGFP KANVIAAPQA KTDTENAFNA ANIALTKNPK FKHWVAYGLN DEAVLGAVRA 
AEGRGFKAAD MIGIGIGGSD SALSEFKKPQ PTGFFGTVII SPKRHGEETS ELMYAWITQG 
KAPPPLTLTT GMLATRENVA QVRETMGLAA K