Gene Caul_0441 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_0441
Symbol
ID	5897898
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	+
Start bp	484381
End bp	485763
Gene Length	1383 bp
Protein Length	460 aa
Translation table	11
GC content	65%
IMG OID	641560927
Product	carotenoid oxygenase
Protein accession	YP_001682076
Protein GI	167644413
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG3670] Lignostilbene-alpha,beta-dioxygenase and related enzymes
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	0.786971
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	29
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGACGACC AAAGCCACAC CGATTTTTAC CTTTCAGGCA ATTACGCGCC CGTCCGCAGC 
GAGGACGACT TCGAGCTGGA GATCACCGGC CAGTTTCCCA AAGAGCTGCG CGGGGCGCTC 
TATCGCAACG GGCCCAATCC CCAATTCCAG CCGCGTGATC CCAACCACCA CTGGTTCGGC 
GGCGACGGCA TGGTCCACGG CTTCTATGTC GAGGACGGCA AGGTCCATTA TCGCAATCGC 
TATGTCCGCA CCCCCAAATG GAAAACCGAG AACGCCGCGG GGCGAGCGCT ATTTGGCAGC 
ATGGGCAACC CACGCACGAC CGATCCCAGT GTTCTGGGTC AGGACAGCGG GGTGGCCAAC 
ACCAATATCC TGGCCCACGG CGGCCGGCTC CTGGCGCTTG AGGAGGGCCA CATGCCGTTC 
GAAATGGACG CGCGGTCCTT GGACAGCCTG GGCTATGTCG AGGCCTATAA GGGCCGCGTC 
ACCGCCCATC CCAAGATCGA TCCGGTGACC GGCGAGCTGC TGTGGTTCGG CTATGGGGTC 
GGGGCCACGC CGTTCTCGCC GGGCATGAGT TTTGGTGTGA CCGACCGCAA CGGCGTGGTG 
ACGCGCCGTG ACGATTTCCA GGCGCCTTAC TGCTCGATGG TCCACGACTT CATGGCCACC 
CAGAACCACG TCCTGTTTCC CGTCCTGCCC CTGACCGGCA GTCTGGAGCG GGCGATGAAG 
GGCGCGCCGA TCTGGGCTTG GGAGCCGGAC CAAGCGGCCT ATGTCGGGGT TCTGCGCCGC 
GACGCCGACG TGTCCACCAT CCGCTGGTAC AACACCGGCG CCTGCTACGT CTTCCACACC 
ATGAACGCCT GGGAAGCCGA CGGGAAGATC ATGTGCGACG TCATGCGCTT TGACGAGGCG 
CCGTTCCCGC GCGCCGACGG CACGATGGGG AAAACGGTCT TCCCCCACAT GGTGCGCTGG 
ACGTTCGACC TCTCGCCTGG TTCCGACGCC ATTCGCGAGG AGACCCTGGA TGATCTGGAC 
GGGGAGTTCC CGCGTTTCGA CGACCGCCGG GCGACCCAGA CCTACCGCCA TGGCTGGTTC 
GCGGCCGATC TTCGCAAGAC CTTCGAACTG ACCGGCATCG CGCACCTGGA CCTGGCGACT 
GGCAAGCGAC AGGTCTATGC CCTGCCGCTG GGGGACATGA CGTCCGAGCC GGTGTTCGTC 
GAGCGTTCGG CCGACGCCGA GGAAGGCGAC GGCTGGCTGC TGTCGGTGGT GTGGCGCGCG 
GCGGAAAACC GCTCCGATCT CGTGGTCTTT GACGCCCAGG ACGTGGCCAA GGGTCCGATC 
GCCACGGCGC GGGCTCCGCG GCGCGTGCCC TTCGGCTTCC ATGGCAACTG GGTCAACGCC 
TAG

Protein sequence

MDDQSHTDFY LSGNYAPVRS EDDFELEITG QFPKELRGAL YRNGPNPQFQ PRDPNHHWFG 
GDGMVHGFYV EDGKVHYRNR YVRTPKWKTE NAAGRALFGS MGNPRTTDPS VLGQDSGVAN 
TNILAHGGRL LALEEGHMPF EMDARSLDSL GYVEAYKGRV TAHPKIDPVT GELLWFGYGV 
GATPFSPGMS FGVTDRNGVV TRRDDFQAPY CSMVHDFMAT QNHVLFPVLP LTGSLERAMK 
GAPIWAWEPD QAAYVGVLRR DADVSTIRWY NTGACYVFHT MNAWEADGKI MCDVMRFDEA 
PFPRADGTMG KTVFPHMVRW TFDLSPGSDA IREETLDDLD GEFPRFDDRR ATQTYRHGWF 
AADLRKTFEL TGIAHLDLAT GKRQVYALPL GDMTSEPVFV ERSADAEEGD GWLLSVVWRA 
AENRSDLVVF DAQDVAKGPI ATARAPRRVP FGFHGNWVNA