Gene BTH_II1196 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BTH_II1196
Symbol
ID	3845465
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia thailandensis E264
Kingdom	Bacteria
Replicon accession	NC_007650
Strand	-
Start bp	1400643
End bp	1401644
Gene Length	1002 bp
Protein Length	333 aa
Translation table	11
GC content	69%
IMG OID	637838498
Product	L-arabinose ABC transporter, periplasmic L-arabinose-binding protein
Protein accession	YP_439392
Protein GI	83716589
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1879] ABC-type sugar transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	0.155666
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGGATTGC GTTGGCTTCA AGCCGCCCTC GTCTGCACGA GTCTCGCCGC CGGTTTGTCG 
GCGGCGGCAC CCGCGCGTGC GCAAGGCGCG GCCCCGGTGA AGATCGGCTT TGTCGTCAAG 
CAGCCCGACG ACCCGTGGTT TCAGGACGAA TGGCGCTTCG CCGAGCAGGC GGCGAAGGAC 
AAGCACTTCA CGCTCGTGAA GATCGCCGCG CCGAGCGGCG AGAAAGTGTC GACCGCGCTC 
GACAGCCTTG CCGCGCAAAA GGCGCAAGGC GTGATCATCT GCGCGCCCGA CGTGAAGCTC 
GGTCCCGGCA TCGCCGCGAA GGCGAAGCGC TACGGAATGA AGCTGATGTC GGTCGACGAT 
CAACTCGTCG ACGGGCGCGG CGCGCCGCTT GCCGACGTGC CGCACATGGG CATCTCCGCC 
TACCGGATCG GCCGGCAGGT CGGCGACGCG ATCGCCGCCG AGGCGAAGCG GCGCGGCTGG 
AATCCGGCCG AGGTCGGCGT GCTGCGGCTC GCGTACGACC AGTTGCCGAC CGCGCGCGAG 
CGCACGACGG GCGCGGTCGA CGCGCTGAAG GCGGCCGGCT TTGCGGCCGC GAACGTCGTC 
GACGCGCCGG AGATGACGGC CGACACCGAA GGCGCGTTCA ACGCCGCGAA CATCGCGTTC 
ACCAAGCACC GGAACTTCAG GCACTGGGTG GCGTTCGGAT CGAATGACGA CACGACGGTC 
GGCGCGGTGC GCGCGGGCGA AGGCCGCGGC ATCGGCACGG ACGACATGAT CGCGGTCGGC 
ATCAACGGCA GCCAGGTCGC GCTGAACGAA TTCGCGAAAC CGAAGCCGAC GGGCTTTTTC 
GGCTCGATCC TGCTGAATCC GCGGCTGCAC GGCTACGACA CGTCGGTCAA CATGTACGAC 
TGGATCACGC AGAACCGGAC GCCGCCGCCG CTCGTGCTGA CCTCCGGCAC GCTGATCACG 
CGCGCGAACG AGAAGACGGC GCGCGCGCAG CTCGGGCTGT GA

Protein sequence

MGLRWLQAAL VCTSLAAGLS AAAPARAQGA APVKIGFVVK QPDDPWFQDE WRFAEQAAKD 
KHFTLVKIAA PSGEKVSTAL DSLAAQKAQG VIICAPDVKL GPGIAAKAKR YGMKLMSVDD 
QLVDGRGAPL ADVPHMGISA YRIGRQVGDA IAAEAKRRGW NPAEVGVLRL AYDQLPTARE 
RTTGAVDALK AAGFAAANVV DAPEMTADTE GAFNAANIAF TKHRNFRHWV AFGSNDDTTV 
GAVRAGEGRG IGTDDMIAVG INGSQVALNE FAKPKPTGFF GSILLNPRLH GYDTSVNMYD 
WITQNRTPPP LVLTSGTLIT RANEKTARAQ LGL