Gene BURPS1106A_A1140 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1106A_A1140
Symbol	cefD
ID	4904621
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1106a
Kingdom	Bacteria
Replicon accession	NC_009078
Strand	+
Start bp	1093342
End bp	1094499
Gene Length	1158 bp
Protein Length	385 aa
Translation table	11
GC content	67%
IMG OID	640144246
Product	isopenicillin N epimerase
Protein accession	YP_001075175
Protein GI	126458625
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0520] Selenocysteine lyase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACAGCCC CACTGAAATC GTTGTTTCTT CTCGACCCGA GCGTGACCTA TCTGAACCAC 
GGCGCGTACG GCGCGACGCC GCGCCCGGTG TTCGAGCGCC ACGTGCAGTG GCAGTACGAG 
CTCGAACGCG AGCCGGTCGA TTTCCTGTCG CGCCGCTTCG CCGAACGCAT GGCGCAGGCG 
AGGGCGATAC TGGCCGAATA CGTGGATACC GAACGCGACA ATCTAGTATA TGTGAGCAAC 
GGCACCACGG GCGTGAACAT CGTCGCGCGC AGCCTCCCGC TCGGCCCGGG CGACGAACTG 
CTCACCACCG ATCACGAGCA CGGCGGCATC GAGCGGCTGT GGCGCTTCAC CGCGCAAAAG 
CGCGGGTTCG AGATCGTCCG GCACAAGGTG TCGCTGCCGG TGACGACGCA TGCCCGGTTC 
GTCGAGGATT TCTGGCGCGA CGTGACGCCG CGCACGCGCG CGATCCTGAT CAGCCAGCTG 
ACGTCGCCCA CCGCGCTCGT GTTTCCGGTT GCGGCGATCT GCGCGCGCGC GCGGGCGCGC 
GGCATCCTGA CGATCGTCGA CGGCTCGCAC GTGCCCGGGC AACTGCCGCT GTCGCTGCGC 
GAGATGGATC CGGATTTCTA TGTCGGCATC CTGCATAAAT GGGTGTGCGC GCCGAAGGGC 
AGCGCGTTCC TGTATGCGAG GCCGGACGTG CAGCCGCTTG TCGAGCCGCT CGTCGTCAGT 
TGGGGCTGGG AGCCGAAGAA CCCGGGGCCG TCGAAGTTCG TCGAGTATCA CGAGTGGCAG 
GGCAGCCGCG ACATCTCCGC GTTCCTGAGC GTGCCGAGCG CGATCGCGTT TCAGCGCGAG 
CACGACTGGG ACGGTGTGCG CAAGCGCTGC ATCGCGCTCG CGAGCGACGC GCAGCGCGAA 
GTGGCCGCGT TGACGCGCGA GCCGCTCTAC CATCCGCCGG GCGCGCACGA GTGGCACGGC 
CAGATGGTCT GCGCGCAACT GCCGCCGCAG ACGGACGACA TCGCGCTGCT TGCCCGCTTG 
CGCAACGAAT GCGGGATCGA CGTCTCGGTC GACCGTTTCG GCGGCCGGCC TCGCATCCGA 
GTGTCGATTC AGGGCTATAA CGGCCCGGAC GACGTCGATC GATTGCTCGG CAGTCTGAAG 
CAACTGCTGC GGCTTTGA

Protein sequence

MTAPLKSLFL LDPSVTYLNH GAYGATPRPV FERHVQWQYE LEREPVDFLS RRFAERMAQA 
RAILAEYVDT ERDNLVYVSN GTTGVNIVAR SLPLGPGDEL LTTDHEHGGI ERLWRFTAQK 
RGFEIVRHKV SLPVTTHARF VEDFWRDVTP RTRAILISQL TSPTALVFPV AAICARARAR 
GILTIVDGSH VPGQLPLSLR EMDPDFYVGI LHKWVCAPKG SAFLYARPDV QPLVEPLVVS 
WGWEPKNPGP SKFVEYHEWQ GSRDISAFLS VPSAIAFQRE HDWDGVRKRC IALASDAQRE 
VAALTREPLY HPPGAHEWHG QMVCAQLPPQ TDDIALLARL RNECGIDVSV DRFGGRPRIR 
VSIQGYNGPD DVDRLLGSLK QLLRL