Gene Caul_1137 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_1137
Symbol
ID	5898592
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	+
Start bp	1206797
End bp	1207849
Gene Length	1053 bp
Protein Length	350 aa
Translation table	11
GC content	65%
IMG OID	641561619
Product	vanillate monooxygenase
Protein accession	YP_001682765
Protein GI	167645102
COG category	[P] Inorganic ion transport and metabolism [R] General function prediction only
COG ID	[COG4638] Phenylpropionate dioxygenase and related ring-hydroxylating dioxygenases, large terminal subunit
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	0.684708
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	3
Fosmid unclonability p-value	0.000140047
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

TTGTCCGCCC AGCCGACTTT CCCGTTGAAC GCCTGGTACG CCGCCGGCTG GGATTCCGAG 
ATCAAGCGCG AGCTGCTGCC CCGGACGATC TGCAACAAGA AGATCGTCTT GTTCCGTAAG 
GAAAATGGGC AAGCGGTCTG CCTGGAGGAC GCCTGTTGGC ATCGCCTGTT GCCGCTGTCG 
ATGGGGCGGC TCAAGGGCGA CGACGTACAG TGCGGCTATC ACGGCCTTGT ATTCAATGAG 
CACGGCCGCT GTGTTCGCAT GCCCTCGCAG GAGACGATCA ACCCATCGGC CTGCGTGCGG 
AGTTTCCCCC TGGTCGAACG GCACCGGTTC GTGTGGATCT GGCCCGGCGA CCCGGCGCTG 
GCGGATCCGG CCCTGGTTCC CGATCTGCAC TGGAACCACG ACCCGGCCTG GGCCGGCGAT 
GGCAAGGTGA TCCACGCCAA GTGCGACTAC CGGCTGATCG TCGACAATCT GATGGACCTC 
ACTCACGAGA CCTATATCCA CGGATCGAGC ATCGGCAACG ATGCGGTGGC CGAGGCGCCG 
TTCGAGGTCA CCACCGGCGA CAAGACCGCC ATGGTCACGC GCTGGATGAT CGATATCGAG 
CCGCCGCCGT TCTGGCGCCA ACAGCTGGGC AAGCCGGGTA ACGTCGACCG CTGGCAGATC 
ATCCGTTTCG AGGCGCCCTG CACGGTGGCC ATCGATGTCG GGGTGGCCCC GACCGGGACC 
GGCGCGCCGC GGGGCGACCG CTCGCAGGGC GTCAGCATGG TGGTGATCAA CACCATCACC 
CCGGCTACGG ACAAGACTTG TCACTACTTC TGGGCCAATG TGCGCGACTA TCAGCTGGGC 
GAGCAGAAGG TGACCACCCA GATCCGTGAG GCGATCACCA AGGTGTTCGC CGAGGACGAG 
GTTATCGTCG AGGCCCAGCA GCGGGCGATC GACGACCATC CCGACCACGT GTTCTACAAC 
CTCAACATCG ACGCCGGCGC CATGTGGGCC AGGCGGCTGA TCGATCGGAT GGTCGCCGCC 
GAGGCTCCGC CCGTCGCGAT CGCGGCGGAG TAG

Protein sequence

MSAQPTFPLN AWYAAGWDSE IKRELLPRTI CNKKIVLFRK ENGQAVCLED ACWHRLLPLS 
MGRLKGDDVQ CGYHGLVFNE HGRCVRMPSQ ETINPSACVR SFPLVERHRF VWIWPGDPAL 
ADPALVPDLH WNHDPAWAGD GKVIHAKCDY RLIVDNLMDL THETYIHGSS IGNDAVAEAP 
FEVTTGDKTA MVTRWMIDIE PPPFWRQQLG KPGNVDRWQI IRFEAPCTVA IDVGVAPTGT 
GAPRGDRSQG VSMVVINTIT PATDKTCHYF WANVRDYQLG EQKVTTQIRE AITKVFAEDE 
VIVEAQQRAI DDHPDHVFYN LNIDAGAMWA RRLIDRMVAA EAPPVAIAAE