Gene Bcep18194_B1789 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Bcep18194_B1789
Symbol
ID	3753554
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia sp. 383
Kingdom	Bacteria
Replicon accession	NC_007511
Strand	+
Start bp	2031729
End bp	2032724
Gene Length	996 bp
Protein Length	331 aa
Translation table	11
GC content	67%
IMG OID	637766638
Product	periplasmic binding protein/LacI transcriptional regulator
Protein accession	YP_372547
Protein GI	78062639
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1879] ABC-type sugar transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	0.47034
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.532052
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGATTCC ACTGGAAGAC GCTCGCACTG GCCATGGCGA GCGCGGCGCT GGTCGGCGGG 
GTACCCGCCC ATGCCGCCGA CCCCGCCGAC GTGAAAATCG GCTTCCTCGT CAAACAGCCG 
GACGATCCGT GGTTCCAGGA CGAATGGCGC TTCGCCGACC AGGCGGCGAA GGAAAAGCAC 
TTCACGCTGA TCAAGATCGC GACGCCGAGC GGTGAAAAGG TGTCGACCGC ACTCGACAGC 
CTCGCCGCGC AAAAGGCCCA AGGCGTGATC ATCTGCGCAC CCGACGTGAA GCTCGGCCCC 
GGCATCGCGG CGAAGGCGAA GCGCGCGGGG ATCAAGCTGA TGTCGGTCGA CGACCAGCTC 
GTCGACGGCC GCGGCGCGCC GCTCCAGGGC GTGCCGCACA TGGGCATCTC CGCGTACAAG 
ATCGGCCAGC AGGTCGGCCA GGCGATCGCG GACGAAACGA AGCGGCGCGG CTGGAATCCG 
GCCGAGGTCG GCATCATCCG GATCGCGTAC GACCAGTTGC CGACCGCGAA AGAGCGCACC 
ACCGGCGCGG TCGACGCGCT CAAGGCTGCC GGCTTTCCGG CCGCGAACGT GATCGATGCC 
CCCGAAATGA CGGCCGATAC CGAAGGCGCG TTCAACGCAG CGAACATCGC GCTCACCAAG 
CACGCGAATT TCAAGCGCTG GGTGGCATTC GGCTCGAACG ACGACACGAC GGTCGGTGCG 
GTACGTGCCG CCGAGGGGCG CGGCATCGGC GCCGACGCGA TGGTCGCGGT CGGCATCAAC 
GGCAGCCAGG TCGCGCTCAA CGAATTCGCG AAGCCGAAGC CAACGGGCTT CTACGGCTCG 
ATCCTGCTGA ATCCGCGCCA GCACGGCTAC CAGACGAGCA TCAACATGTA TGACTGGATC 
ACGAAGAACC AGGCGCCGCC GCCGCTCGTG CTGACGTCCG GCACGCTGAT CACGCGCGAC 
AACGAAAAGC AGGCGCGCGC CGCGCTCGGC CTGTGA

Protein sequence

MRFHWKTLAL AMASAALVGG VPAHAADPAD VKIGFLVKQP DDPWFQDEWR FADQAAKEKH 
FTLIKIATPS GEKVSTALDS LAAQKAQGVI ICAPDVKLGP GIAAKAKRAG IKLMSVDDQL 
VDGRGAPLQG VPHMGISAYK IGQQVGQAIA DETKRRGWNP AEVGIIRIAY DQLPTAKERT 
TGAVDALKAA GFPAANVIDA PEMTADTEGA FNAANIALTK HANFKRWVAF GSNDDTTVGA 
VRAAEGRGIG ADAMVAVGIN GSQVALNEFA KPKPTGFYGS ILLNPRQHGY QTSINMYDWI 
TKNQAPPPLV LTSGTLITRD NEKQARAALG L