Gene BMA10229_A2571 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BMA10229_A2571
Symbol	hemN-2
ID	4791656
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia mallei NCTC 10229
Kingdom	Bacteria
Replicon accession	NC_008836
Strand	-
Start bp	2615167
End bp	2616561
Gene Length	1395 bp
Protein Length	464 aa
Translation table	11
GC content	68%
IMG OID
Product	coproporphyrinogen III oxidase
Protein accession	YP_001028529
Protein GI	124385408
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACGCAGC CGATTCCGTC CGAGGCGCTG TTTCGCCCCG ACCTGCTCGC CAAGTACACG 
GCGAACGGCC CTCGCTATAC GTCCTACCCC ACCGCCCCTC AGTTCCGCGA CGACTTCGAT 
CCCGCCGATT ACATCCGCGC GGCGGCCGAT CCCGGCGCGT CGGCGAGCGA ACTGTCGCTC 
TATTTCCACA TTCCGTTCTG CGCGACCGCC TGCTTCTATT GCGGCTGCAA CAAAATCGCG 
ACGCGCAACC GCAAGCGCGC GCGCCCGTAT CTCGACCAGT TGAAGCACGA GATCGCGCTG 
CAGGCCGCGC TCTTCGATCC GGAGCGGACC GTCACGCAGC TCCACTGGGG CGGCGGCACG 
CCGACTTTCC TGTCGAACGT CGAGACGACC GAGCTGATGG CGGCCACGCG CGAGTACTTC 
ACGCTCGCGT CGGATCGCAC CGGAGAATTC TCGATCGAAA TCGATCCGCG CACGGCGTCG 
CCCGCGACGC TCGTCCATCT GCGCACGATC GGCTTCAATC GCGTAAGCCT CGGCGTGCAG 
GACTTCGACC CCAACGTGCA ACGCGCGATC AATCGCGTGC AGCCGCTCAA GATGACGTCC 
GACCTCGTGC GCGCCGCGCG CGCGACCGGC TATCACTCGA TCGGCATCGA TCTCATCTAC 
GGGCTGCCGC ACCAGACGGT ATCGAGCTTC GCGCGCACGC TCGACACGAT CGTCGAGCTC 
GAGCCCGACC GGCTCTCCGT GTTCGGCTAC GCGCACCTGC CGCACCTGTT CAAGATGCAG 
CGGCAGATCG ACACCGCCGC GCTGCCGCCG CCCGCGACGC GCATCGCGCT GCTCGGCCTT 
GCGATCGAGC GGCTCACGCG CGCGGGCTAT GTGTACATCG GCATGGACCA TTTCGCGCGG 
CCGGGCGACG AGCTCGTCCG CGCGCAGCGC AACGGCACGC TGCAGCGCAA CTTCCAGGGC 
TACAGCACGC GGGCGGACGC CGATCTGATC GGCATCGGCG CGTCCTCGAT CGGCAAGGTC 
GGCGACGTCT ACGCGCAGAA CGCGAAGGAT CTGCCGCGTT ACGGCGCGGC GCTCGCCGAC 
CAGCGTCTGC CGATCGCGCG CGGCGTGAAG CTCTCGGCCG ACGACCGGCT GCGGCGCGAC 
GTGATCACGC ACCTGATGTG CAACCTCGTG CTGCCGTTCT CGCACGTCGA GGCCGCGTAC 
GGCATCCGCT TCGCGAACAA GTTTGCGCGC GAGCTCGACA CGCTGCGCGG CTTCGAGCGC 
GACGGCCTGC TGTCGATCGG CGCCGATCGT CTGACGATTC ATCCGGCCGG GCGCCTCTAC 
GTGCGCAACA TCGCGATGGT GTTCGACGCG TACCTGTCGG GCGCGTCCGA ACACCGCTAT 
TCGAAGACGG TCTGA

Protein sequence

MTQPIPSEAL FRPDLLAKYT ANGPRYTSYP TAPQFRDDFD PADYIRAAAD PGASASELSL 
YFHIPFCATA CFYCGCNKIA TRNRKRARPY LDQLKHEIAL QAALFDPERT VTQLHWGGGT 
PTFLSNVETT ELMAATREYF TLASDRTGEF SIEIDPRTAS PATLVHLRTI GFNRVSLGVQ 
DFDPNVQRAI NRVQPLKMTS DLVRAARATG YHSIGIDLIY GLPHQTVSSF ARTLDTIVEL 
EPDRLSVFGY AHLPHLFKMQ RQIDTAALPP PATRIALLGL AIERLTRAGY VYIGMDHFAR 
PGDELVRAQR NGTLQRNFQG YSTRADADLI GIGASSIGKV GDVYAQNAKD LPRYGAALAD 
QRLPIARGVK LSADDRLRRD VITHLMCNLV LPFSHVEAAY GIRFANKFAR ELDTLRGFER 
DGLLSIGADR LTIHPAGRLY VRNIAMVFDA YLSGASEHRY SKTV