Gene Bcenmc03_4940 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Bcenmc03_4940
Symbol
ID	6127752
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia cenocepacia MC0-3
Kingdom	Bacteria
Replicon accession	NC_010515
Strand	+
Start bp	1973552
End bp	1974922
Gene Length	1371 bp
Protein Length	456 aa
Translation table	11
GC content	70%
IMG OID	641652027
Product	dihydroorotase
Protein accession	YP_001778560
Protein GI	170737300
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0044] Dihydroorotase and related cyclic amidohydrolases
TIGRFAM ID	[TIGR00857] dihydroorotase, multifunctional complex type

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	0.536764
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	0.361909
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGACGAGC GGCTGCGACA GGAAGCGGGC GACCGATCGA CACGGCGGCA CGCCGATCTG 
CTGGTGCATG GCGGCACGGT GATGACGCCC AACGGCGCCG AGCGGATCGA CGTCGCGTGC 
ATGGGCGGCC GCGTCGTCGC GCTGGGCGCG TTGCACGGCG TGTGGAGCGC CGACGTGCTG 
CTCGATGCGC GCGGCTTGCA CGTGTTGCCG GGCGTGGTCG ACAGCCAGGT GCATTTCCGT 
GAACCGGGGC TCACGCACAA GGAGACCATC GAGGCCGGCA CGCGCGGCGC GGTGCTCGGC 
GGCGTCACGA CGATCTTCGA GATGCCCAAT ACGCATCCGC TGACGCTGGA CGAGCAGGAT 
CTGAGCGCCA AGCTCGATCT CGCGCGCGGC CGTGCGTGGT GCGACTACGC GTTCTACATC 
GGCGGCTCGG CCGTGAATGC CGAACGGCTG CCGGTGCTCG AACGGTTGCC CGGCTGCGCG 
GGGGTGAAGG TTTTCATGGG CAGTTCGTTC GGCGATCTGC TGGCCGACGA CGAAACCGTG 
TTGCGCCGGA TACTGCGCCA CGGCCGGCGG CGCATGGCCG TGCATGCGGA GGACGAGGCG 
CGGCTGCGCG AACGCAAGTC GATCGCGGAA GCAAGCGGCG ACGTGCGCGA CCATCCGCGC 
TGGCGCGACG CGGAAAGCGC GCTGGCCGCG ACACGGTGCA TCGTCGGGCT GGCTGCCGAG 
ACGGGTCGCC GGCTGCATGT GCTGCACGTA TCCACGGCGG ATGAAATGGC GTTGCTTGCA 
CGGCACCGGC GACGCGTGAC GGTCGAGGTC ACGCCGCATC ACCTGAGCTT GCACGCGCCG 
GATTGCTACG AGCGGCTCGG CACGTTCGCG CAGATGAATC CGCCCGTGCG CGAACGGCAT 
CATCGGGACG CGCTGTGGCA GGCCGTCCGC GACGGCGTGG TCGACGTGAT CGGCAGCGAT 
CATGCGCCGC ATACGCGCGA CGAAAAGCGC CGCCCGTATC CGCAGTCGCC GAGCGGGATG 
ACCGGTGTGC AGACGCTGCT GCCGCTGATG CTCGATCACG TGCAGGCCGG CCGTTTGAGC 
GTCGAACGGC TGGTCGACCT GACCAGCGCC GGGCCGGCGC GCGTTTTCGG CATCGAAGGG 
AAGGGACGCA TTGCGGCGGG CTACGACGCC GATTTCAGCA TCGTCGACCT GCGCGCGCGG 
CGGATCATTC GCGACGAATG GATCGCGAGC GTGAGCGGGT GGACGCCGTA CGACGGCTGT 
GCGGTCACGG GGTGGCCCGT GCATACGGTC GTGCGCGGGC AGGTCGTCGT GCGCGACGAG 
GCGCTGAACG GACAACCGGC CGGGGAGGCC GTGACGTTTC TCGACCCCTA G

Protein sequence

MDERLRQEAG DRSTRRHADL LVHGGTVMTP NGAERIDVAC MGGRVVALGA LHGVWSADVL 
LDARGLHVLP GVVDSQVHFR EPGLTHKETI EAGTRGAVLG GVTTIFEMPN THPLTLDEQD 
LSAKLDLARG RAWCDYAFYI GGSAVNAERL PVLERLPGCA GVKVFMGSSF GDLLADDETV 
LRRILRHGRR RMAVHAEDEA RLRERKSIAE ASGDVRDHPR WRDAESALAA TRCIVGLAAE 
TGRRLHVLHV STADEMALLA RHRRRVTVEV TPHHLSLHAP DCYERLGTFA QMNPPVRERH 
HRDALWQAVR DGVVDVIGSD HAPHTRDEKR RPYPQSPSGM TGVQTLLPLM LDHVQAGRLS 
VERLVDLTSA GPARVFGIEG KGRIAAGYDA DFSIVDLRAR RIIRDEWIAS VSGWTPYDGC 
AVTGWPVHTV VRGQVVVRDE ALNGQPAGEA VTFLDP