Gene Bcep18194_B0086 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Bcep18194_B0086
Symbol
ID	3751981
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia sp. 383
Kingdom	Bacteria
Replicon accession	NC_007511
Strand	+
Start bp	93560
End bp	94690
Gene Length	1131 bp
Protein Length	376 aa
Translation table	11
GC content	68%
IMG OID	637764932
Product	phospho-2-dehydro-3-deoxyheptonate aldolase
Protein accession	YP_370847
Protein GI	78060939
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0722] 3-deoxy-D-arabino-heptulosonate 7-phosphate (DAHP) synthase
TIGRFAM ID	[TIGR00034] phospho-2-dehydro-3-deoxyheptonate aldolase

Plasmid Coverage information

Num covering plasmid clones	38
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCAGAACC TCGACAATCC TTCCCACGAT CGCGAGGTAG GCAGCGCCGA CGCGACGCAG 
GACACCACCC GCATCGACGA CGTCCGCATC GGCGCCGTGC GCCCGCTGAT TTCCCCGGCG 
CTGCTGCTGG ACGAACTGCC GGTGCCGGCC GCCACGCAGA CGCTCGTCGA GGATACGCGC 
CGCGCGATCG GCGACATCCT GCACGGCCGC GACGACCGGC TGCTGCTCGT CGTCGGCCCC 
TGCTCGATCC ACGATCACGA CCAGGCACTC GACTACGCGC GCCGCCTGAA GGTCGCCGCC 
GATGCGCTGA AGGACGACCT GCTGATCACG ATGCGCGTCT ACTTCGAGAA GCCGCGTACG 
ACGGTCGGCT GGAAGGGCTA CATCAACGAT CCGCGCCTCG ACGGCAGCTT CCGCATCAAC 
GAAGGGCTGC GCGCCGCGCG GCAATTGCTG CTCGACATCA ACGCGCTGGG CCTGCCGGCG 
TCGACCGAAT TCCTCGACCT GCTGAGCCCG CAGTACATCG CCGACCTGAT CGCGTGGGGC 
GCGATCGGCG CGCGCACGAC CGAGAGCCAG AGCCATCGCC AGCTCGCGTC GGGCCTGAGC 
TGCCCGATCG GCTTCAAGAA CGGCACCGAC GGCGGCGTGC AGGTGGCGTC CGACGCGATC 
GTCGCCGCGG CGGCGAGCCA TGCGTTCATG GGGATGACGA AGATGGGGAT GGCCGCGATC 
TTCGAGACGC GCGGCAACGA CGACGCGCAC GTGATCCTGC GCGGCGGCAA GAACGGCCCG 
AACTACGACG CCGAGCATGT CGAGGCGAGT TGCGCGGTGC TGCGCAAGGC CGGCTTGCGC 
GAGCAGGTGA TGGTCGATTG CTCGCACGCG AACTCGAACA AGTCGCACGA CCGGCAGATC 
GACGTCGCGC AGGATCTCGC GCGGCAACTG TCGCAGGGCG AACAGCGGAT CGTCGGCGTG 
ATGGTCGAGA GCCATCTCGA AGCCGGGCGC CAGGACCTGA AGCCGGGTGT GCCGCTGAAG 
TACGGCGTAT CGATCACGGA CGCATGCCTG AGCTGGACGC AGACGGAACC CGTTCTCGAC 
GTACTGGCCG ATGCTGTGCG GCAACGGCGC GCACAGTCGC GCAACGTGTG A

Protein sequence

MQNLDNPSHD REVGSADATQ DTTRIDDVRI GAVRPLISPA LLLDELPVPA ATQTLVEDTR 
RAIGDILHGR DDRLLLVVGP CSIHDHDQAL DYARRLKVAA DALKDDLLIT MRVYFEKPRT 
TVGWKGYIND PRLDGSFRIN EGLRAARQLL LDINALGLPA STEFLDLLSP QYIADLIAWG 
AIGARTTESQ SHRQLASGLS CPIGFKNGTD GGVQVASDAI VAAAASHAFM GMTKMGMAAI 
FETRGNDDAH VILRGGKNGP NYDAEHVEAS CAVLRKAGLR EQVMVDCSHA NSNKSHDRQI 
DVAQDLARQL SQGEQRIVGV MVESHLEAGR QDLKPGVPLK YGVSITDACL SWTQTEPVLD 
VLADAVRQRR AQSRNV