Gene Bcep18194_C7045 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Bcep18194_C7045
Symbol
ID	3734497
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia sp. 383
Kingdom	Bacteria
Replicon accession	NC_007509
Strand	+
Start bp	612763
End bp	613707
Gene Length	945 bp
Protein Length	314 aa
Translation table	11
GC content	67%
IMG OID	637760747
Product	catechol 1,2-dioxygenase
Protein accession	YP_366734
Protein GI	78060159
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG3485] Protocatechuate 3,4-dioxygenase beta subunit
TIGRFAM ID	[TIGR02439] catechol 1,2-dioxygenase, proteobacterial

Plasmid Coverage information

Num covering plasmid clones	30
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.274631
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCGTCA AAGTTTTCGA GTCCCGGGAA GTGCAGGATC TGCTGAAGGC CGCGTCGAAC 
GCGGGCGCGG ACAGCGCGAA GGGCGGCAAC GCGCGCACGC AGCAGGTCGT GCTGCGGTTG 
CTGGGCGACC TGTTCAAGGC GATCGACGAT CTCGACATCA CGCCCGACGA AGTGTGGGCG 
GGCGTCAACT ACCTGAACAA GCTCGGCCAG GACGGCGAAG CGGCGCTGCT CGCGGCCGGC 
CTCGGCCTCG AGAAGTTTCT CGACATCCGG ATGGATGCCG CGGACAAGGC GGTCGGCCTC 
GACGGCGGCA CGCCGCGCAC GATCGAAGGG CCGCTGTATG TGGCCGGCGC ACCGGTGCGC 
GACGGCGTGT CGAAGATCGA CCTCGACGCG GATGACGGCG CGGGCCCGCT CGTGATCCAC 
GGCACAGTCA CCGGCCTCGA CGGCAAGCCG ATCGCGGGCG CGCTGGTCGA ATGCTGGCAC 
GCGAACTCGC ACGGCTTCTA TTCGCACTTC GACCCGACCG GCAAGCAGAG CGATTTCAAC 
CTGCGCGGCG CGGTTAAGAC GGGCGCGGAC GGCAAGTACG AATTCCGCAC GCTGATGCCG 
GTCGGCTACG GCTGCCCGCC GCACGGCGCG ACGCAGCAAC TGCTGAACGG TCTCGGCCGC 
CACGGCAACC GTCCGGCGCA CGTGCACTTC TTCGTCGACA GCAACGACCA CCGCAAGCTG 
ACGACGCAGT TCAACATCGA CGGCGATCCG CTGATCTGGG ATGACTTCGC GTATGCGACA 
CGCGAGGAGT TGATCCCGCC CGTGGTCGAC AAGACCGGCG GCACGGCGCT CGGCATGAAG 
GCCGATGCGT ACCAGGACAT CGAGTTCAAC TTTGTCCTGA CGCCGCTGGT GCAGGGCAAG 
GACAACCAGG TCGTCCACCG CCTGCGCGCA GCCGCGACGG CGTAA

Protein sequence

MSVKVFESRE VQDLLKAASN AGADSAKGGN ARTQQVVLRL LGDLFKAIDD LDITPDEVWA 
GVNYLNKLGQ DGEAALLAAG LGLEKFLDIR MDAADKAVGL DGGTPRTIEG PLYVAGAPVR 
DGVSKIDLDA DDGAGPLVIH GTVTGLDGKP IAGALVECWH ANSHGFYSHF DPTGKQSDFN 
LRGAVKTGAD GKYEFRTLMP VGYGCPPHGA TQQLLNGLGR HGNRPAHVHF FVDSNDHRKL 
TTQFNIDGDP LIWDDFAYAT REELIPPVVD KTGGTALGMK ADAYQDIEFN FVLTPLVQGK 
DNQVVHRLRA AATA