Gene BMA10247_A1739 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BMA10247_A1739
Symbol
ID	4890644
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia mallei NCTC 10247
Kingdom	Bacteria
Replicon accession	NC_009079
Strand	-
Start bp	1667496
End bp	1668653
Gene Length	1158 bp
Protein Length	385 aa
Translation table	11
GC content	67%
IMG OID	640148004
Product	putative isopenicillin N epimerase
Protein accession	YP_001078922
Protein GI	126445591
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0520] Selenocysteine lyase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACAGCCC CACTGAAATC GTTGTTTCTT CTCGACCCGA GCGTGACCTA TCTGAACCAC 
GGCGCGTACG GCGCGACGCC GCGCCCGGTG TTCGAGCGCC ACGTGCAGTG GCAGTACGAG 
CTCGAACGCG AGCCGGTCGA TTTCCTGTCG CGCCGCTTCG CCGAACGCAT GGCGCAGGCG 
AGGGCGATAC TGGCCGAATA CGTGGATACC GAACGCGACA ATCTAGTATA TGTGAGCAAC 
GGCACCACGG GCGTGAACAT CGTCGCGCGC AGCCTCCCGC TCGGCCCGGG CGACGAACTG 
CTCACCACCG ATCACGAGCA CGGCGGCATC GAGCGGCTGT GGCGCTTCAC CGCGCAAAAG 
CGCGGGTTCG AGATCGTCCG GCACAAGGTG TCGCTGCCGG TGACGACGCA TGCCCGGTTC 
GTCGAGGATT TCTGGCGCGA CGTGACGCCG CGCACGCGCG CGATCCTGAT CAGCCAGCTG 
ACGTCGCCCA CCGCGCTCGT GTTTCCGGTT GCGGCGATCT GCGCGCGCGC GCGGGCGCGC 
GGCATCCTGA CGATCGTCGA CGGCTCGCAC GTGCCCGGGC AACTGCCGCT GTCGCTGCGC 
GAGATGGATC CGGATTTTTA TGTCGGCATC CTGCATAAAT GGGTGTGCGC GCCGAAGGGC 
AGCGCGTTCC TGTATGCGAG GCCGGACGTG CAGCCGCTTG TCGAGCCGCT CGTCGTTAGT 
TGGGGCTGGG AGCCGAAGAA CCCGGGGCCG TCGAAGTTCG TCGAGTATCA CGAGTGGCAG 
GGCAGCCGCG ACATCTCCGC GTTCCTGAGC GTGCCGAGCG CGATCGCGTT TCAGCGCGAG 
CACGACTGGG ACGGCGTGCG CAAGCGCTGC ATCGCGCTCG CGAGCGACGC GCAGCGCGAA 
GTGGCCGCGT TGACGCGCGA GCCGCTCTAC CATCCGCCGG GCGCGCACGA GTGGCACGGC 
CAGATGGTCT GCGCGCAACT GCCGCCGCAG ACGGACGACA TCGCGCTGCT TGCCCGCTTG 
CGCAACGAAT GCGGGATCGA CGTCTCGGTC GACCGTTTCG GCGGCCGGCC TCGCATCCGA 
GTGTCGATTC AGGGCTATAA CGGCCCGGAC GACGTCGATC GATTGCTCGG CAGTCTGAAG 
CAACTGCTGC GGCTTTGA

Protein sequence

MTAPLKSLFL LDPSVTYLNH GAYGATPRPV FERHVQWQYE LEREPVDFLS RRFAERMAQA 
RAILAEYVDT ERDNLVYVSN GTTGVNIVAR SLPLGPGDEL LTTDHEHGGI ERLWRFTAQK 
RGFEIVRHKV SLPVTTHARF VEDFWRDVTP RTRAILISQL TSPTALVFPV AAICARARAR 
GILTIVDGSH VPGQLPLSLR EMDPDFYVGI LHKWVCAPKG SAFLYARPDV QPLVEPLVVS 
WGWEPKNPGP SKFVEYHEWQ GSRDISAFLS VPSAIAFQRE HDWDGVRKRC IALASDAQRE 
VAALTREPLY HPPGAHEWHG QMVCAQLPPQ TDDIALLARL RNECGIDVSV DRFGGRPRIR 
VSIQGYNGPD DVDRLLGSLK QLLRL