Gene BMA2100 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BMA2100
Symbol
ID	3088579
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia mallei ATCC 23344
Kingdom	Bacteria
Replicon accession	NC_006348
Strand	+
Start bp	2191145
End bp	2192362
Gene Length	1218 bp
Protein Length	405 aa
Translation table	11
GC content	68%
IMG OID	637562737
Product	coproporphyrinogen III oxidase
Protein accession	YP_103674
Protein GI	53726004
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0635] Coproporphyrinogen III oxidase and related Fe-S oxidoreductases
TIGRFAM ID	[TIGR00539] putative oxygen-independent coproporphyrinogen III oxidase

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCGACG CGGCAACCAA CGGCGCGCGC GTCGTCGCGA CATTCGCCGC GCCCGGCCGG 
ATCCGGCTCG CGTCGCTGCC GCCGCTCGCG CTGTACGTGC ACTTCCCGTG GTGCGTGCGC 
AAGTGCCCGT ACTGCGACTT CAATTCGCAC GAATGGAAGG ACGGCGGCGC GCTGCCCGAG 
CGCGACTATC TGGACGCGCT GCGCGCCGAT CTCGAGCACG CGCTGCCGCT CGTCTGGGGA 
CGCCAGGTAC ACACGGTGTT CATCGGCGGC GGCACGCCGA GCCTGCTGTC GGCGGCGGGG 
CTCGACCGGC TGCTGTCCGA CGTGCGCGCG CTGCTGCCGC TCGACGCGGA CGCCGAGATC 
ACGCTCGAGG CGAACCCCGG CACGTTCGAG GCGGCGAAGT TCGCGCAATT CCGCGCGAGC 
GGCGTCAATC GCCTGTCGAT CGGCATCCAG AGCTTCAACG AGGCGCATCT GAAGGCGCTC 
GGGCGGATTC ACGACGCCGC GCAGGCGCGC GCCGCGGTCG AGATCGCCGC GCGCACGTTC 
GAGAACTTCA ATCTCGACCT GATGTTCGCG CTGCCGAACC AGACGCTCGA CGAATGCCGC 
GCGGATCTCG AAACCGCGCT CGCGTTCGCG CCGCCGCATC TGTCGCTTTA TCATCTGACG 
CTCGAGCCGA ATACGTATTT CGCGAAGTTT CCGCCCACCG TGCCGGACGA CGACGCGTCG 
GCCGACATGC AGGACTGGCT GCACGAACGC ACCGCGCAGG CAGGTTACGC GCGCTACGAG 
GTGTCCGCTT ATGCGAAGCC GCATCGGCGG AGCAAGCACA ACCTCAACTA CTGGCGCTTC 
GGCGACTATC TGGGAATCGG CGCGGGCGCG CACACGAAGC TGTCGTTTCC GAACCGGATC 
CTGCGCCAGG CACGCTACAA GCATCCGGCG ACGTTCATCG AACAGGCGAA AGCGGGTACT 
CCCGTGCAGG AAGAGCGGGA GGTGGGGCCG CGCGATCTGC CGTTCGAGTT CATGCTGAAC 
GCGCTGCGGC TTGTCGACGG CGTGCCCGCA TACAGCTTCG AGGCGCGCAC CGGCATGTCG 
CTCGCCGCGA TCGGTCCTGC GCTCGCGCAG GCCGAGCAGC GCGGCCTCCT CGTGCACGAT 
CACACGCGCA TCGCGCCGAC GCCGCTCGGC CAGCGCTTCC TCAACGATCT GCAGGCGCTG 
TTCCTGCGCG ACGCATGA

Protein sequence

MSDAATNGAR VVATFAAPGR IRLASLPPLA LYVHFPWCVR KCPYCDFNSH EWKDGGALPE 
RDYLDALRAD LEHALPLVWG RQVHTVFIGG GTPSLLSAAG LDRLLSDVRA LLPLDADAEI 
TLEANPGTFE AAKFAQFRAS GVNRLSIGIQ SFNEAHLKAL GRIHDAAQAR AAVEIAARTF 
ENFNLDLMFA LPNQTLDECR ADLETALAFA PPHLSLYHLT LEPNTYFAKF PPTVPDDDAS 
ADMQDWLHER TAQAGYARYE VSAYAKPHRR SKHNLNYWRF GDYLGIGAGA HTKLSFPNRI 
LRQARYKHPA TFIEQAKAGT PVQEEREVGP RDLPFEFMLN ALRLVDGVPA YSFEARTGMS 
LAAIGPALAQ AEQRGLLVHD HTRIAPTPLG QRFLNDLQAL FLRDA