Gene BMA10247_A0804 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BMA10247_A0804
Symbol
ID	4891353
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia mallei NCTC 10247
Kingdom	Bacteria
Replicon accession	NC_009079
Strand	-
Start bp	741129
End bp	742157
Gene Length	1029 bp
Protein Length	342 aa
Translation table	11
GC content	67%
IMG OID	640147078
Product	oxygenase
Protein accession	YP_001078003
Protein GI	126447477
COG category	[P] Inorganic ion transport and metabolism [R] General function prediction only
COG ID	[COG4638] Phenylpropionate dioxygenase and related ring-hydroxylating dioxygenases, large terminal subunit
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.739183
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGGGCAATG AGGATCTCGA CCTGACAAAC CGCCACAACA CGGAAGACTG GCTGCCCGAC 
CGGATCCGGC TGCGCAACGT GTGGCTGCCG CTCGCCCATA CGTTCGAGAT CGGCGAACGC 
GCTTCGCGCT GGTACGTTCA TTCGGAGCCG TGCTATCTGT GGCGCGCGGC AGGCCGCATC 
CATGCGTGCC CCTGGCATCC CGGACTGCCG GCGGCGAAGC GCCCCACGCC GCGCCCGCGG 
GACGCGGACG CCGCGTGCTA CCCGGTCGTC GAACGATTCG GCTATGTATG GGTGTGGTAC 
GGCGAGCCCG AGGCCGCGAG CGACGCCTTC GTGCCCGACG TGCCGTTCCT GCCGCGCGAC 
GGCGGCCTGC CGAAATACAT GCAGGGCAAC ATCCGGGTCG ATTGCTGCGC GCCGCTGCTC 
ATCGAAAACC TGCTCGATCT GACGCACTCG GACTTTCTGC ACGCGAAGGT GTTCGGCGAT 
CAGCACGCCG ACGAGGACCG GGTCGACGTC AGCTACACGT CCGAGACAGT CACGATGATC 
CGCCGCTGCA AGAACAAGTC GATCCTGCCG ATCATGCGCT GGTTCGGCGG CGTGCGCGCG 
AAATATCAGG ACATTCACGC GGTGGTCCAC GTCCATGTGC GCAGCTCGAT CGCGCTTGCC 
TACGGCCGTC ATACGCCGGG CAGCGATCTG CCGCTGTTCC ATCCGTGCGT GCCCGAGTCG 
CGCAACTACT GCCGGCTCAA CTTCGCGCTG AACGCGACGC AGGCGCCCTG GCCGCTACGC 
CTGCTGCTGC CGTTCGTGCC CTACGTCGTC GGCCTTCAGG ACAACAGCAT GGTCAGGCGG 
CAGAGCGGCC GCTATCTGGA CGCCGGCGAG CGCCGCGATC TGTATTCGCG TTTCGACCGC 
GCCGGCTTGC GTTACCGGAT TCTGCTGCAG CAGCTCGCGA AACGGCAGAG CGAGGGCGAT 
TTCAGTTACG CGGACGATGC GCTGCCGAGC CGGGACGCGC GCGGCATCCT CGGGATGCCG 
AACGAATAG

Protein sequence

MGNEDLDLTN RHNTEDWLPD RIRLRNVWLP LAHTFEIGER ASRWYVHSEP CYLWRAAGRI 
HACPWHPGLP AAKRPTPRPR DADAACYPVV ERFGYVWVWY GEPEAASDAF VPDVPFLPRD 
GGLPKYMQGN IRVDCCAPLL IENLLDLTHS DFLHAKVFGD QHADEDRVDV SYTSETVTMI 
RRCKNKSILP IMRWFGGVRA KYQDIHAVVH VHVRSSIALA YGRHTPGSDL PLFHPCVPES 
RNYCRLNFAL NATQAPWPLR LLLPFVPYVV GLQDNSMVRR QSGRYLDAGE RRDLYSRFDR 
AGLRYRILLQ QLAKRQSEGD FSYADDALPS RDARGILGMP NE