Gene BURPS1106A_A1627 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1106A_A1627
Symbol	araF
ID	4905545
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1106a
Kingdom	Bacteria
Replicon accession	NC_009078
Strand	+
Start bp	1596916
End bp	1597917
Gene Length	1002 bp
Protein Length	333 aa
Translation table	11
GC content	70%
IMG OID	640144733
Product	L-arabinose ABC transporter, periplasmic L-arabinose-binding protein
Protein accession	YP_001075661
Protein GI	126457278
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1879] ABC-type sugar transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.569362
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGGATTGC GCTGGCCCCA AGCCGCCCTC GTCTGCGCGA GCCTCGCCGC CGGTTTGTCG 
GCGGCGGCGC CCGCGCATGC GCAAGGCGCG GCCCCGGTGA AGATCGGCTT CGTCGTCAAG 
CAGCCCGACG ACCCGTGGTT TCAGGACGAA TGGCGCTTCG CCGAGCAGGC GGCGAAGGAC 
AAGCACTTCA CGCTCGTGAA GATCGCCGCG CCGAGCGGCG AGAAGGTGTC GACCGCGCTC 
GACAGCCTCG CCGCGCAAAA GGCGCAGGGT GTGATCATCT GCGCGCCCGA CGTGAAGCTC 
GGCCCCGGCA TCGCCGCGAA GGCGAGGCGC TACGGGATGA AGCTGATGTC GGTCGACGAT 
CAGCTCGTCG ACGGGCGCGG CGCGCCGCTC GCCGACGTGC CGCACATGGG CATTTCCGCA 
TACCGGATCG GCCGGCAGGT CGGCGACGCG ATCGCCGCCG AGGCGAAGCG GCGCGGCTGG 
AATCCGGCCG AGGTCGGCGT GCTGCGCCTC GCGTACGACC AGTTGCCGAC CGCGCGCGAG 
CGCACGACGG GCGCGGTCGA TGCGCTGAAG GCCGCGGGCT TCGCGGCGGC GAACGTCGTC 
GACGCGCCGG AGATGACGGC CGATACCGAA GGCGCGTTCA ACGCCGCGAA CATCGCGTTC 
ACCAAGCATC GGAACTTCAA GCACTGGGTG GCGTTCGGAT CGAATGACGA CACGACGGTC 
GGCGCGGTGC GCGCGGGCGA GGGGCGCGGC ATCGGGGCGG ACGACATGAT CGCGGTCGGC 
ATCAACGGCA GCCAGGTCGC GCTGAACGAA TTCGCGAAAC CGAAGCCGAC GGGCTTTTTC 
GGCTCGATCC TGCTGAATCC GCGGCTGCAC GGCTACGACA CGTCGGTCAA CATGTACGAC 
TGGATCACGC AGAACCGCGC GCCGCCGCCG GTCGTGCTGA CGTCCGGCAC GCTGATCACG 
CGCGCGAACG AAAAGACGGC GCGCGCGCAG CTCGGGCTGT GA

Protein sequence

MGLRWPQAAL VCASLAAGLS AAAPAHAQGA APVKIGFVVK QPDDPWFQDE WRFAEQAAKD 
KHFTLVKIAA PSGEKVSTAL DSLAAQKAQG VIICAPDVKL GPGIAAKARR YGMKLMSVDD 
QLVDGRGAPL ADVPHMGISA YRIGRQVGDA IAAEAKRRGW NPAEVGVLRL AYDQLPTARE 
RTTGAVDALK AAGFAAANVV DAPEMTADTE GAFNAANIAF TKHRNFKHWV AFGSNDDTTV 
GAVRAGEGRG IGADDMIAVG INGSQVALNE FAKPKPTGFF GSILLNPRLH GYDTSVNMYD 
WITQNRAPPP VVLTSGTLIT RANEKTARAQ LGL