Gene Caul_0020 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_0020
Symbol
ID	5897732
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	+
Start bp	25534
End bp	26802
Gene Length	1269 bp
Protein Length	422 aa
Translation table	11
GC content	64%
IMG OID	641560503
Product	cytochrome P450
Protein accession	YP_001681656
Protein GI	167643993
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG2124] Cytochrome P450
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	0.0467456
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCGACG GCTCTATCGA TTTTGGCGAC GACGCGCGCG CCAAGGCTTG GTCCATTCCG 
CTGGAGGACT ACCATGTCGC CGATCCGGCC CTGTTCCAGG CCGACGCGAT GTGGCCCTAT 
TTCGAGCGCC TGCGGAAGGA AGATCCGGTC CACTGGTCCA GGGGCATCGA GGAGACCGGT 
CCCTACTGGT CGATCACCAA GTACAACGAC ATCATGGCGG TCGACACCAA CCATCAGGTG 
TTCTCCAGCG ATGCGCATCT GGGCGGCATC ACCATCCGCG ACTTCGACGA GGACTTCGTC 
CTGCCGATGT TCATCGCCAT GGACCCGCCC AAGCACGATA TCCAGCGCAA GACCGTCAGC 
CCGATCGTCT CGCCGCAGAA CCTGGCCCGG CTGGAGGGGA TCATCCGCGA GCGGGTCTGC 
ACGATCCTGG ACGGCCTGCC GATCGGCGAG ACCTTCGACT GGGTCGACAA GGTCTCGATC 
GAGCTGACCA CCCAGATGCT GGCCACGCTG TTCGACTTCC CTTGGGAAGA GCGCCGCAAG 
CTGACCCGCT GGTCGGACGT GGCCACCGCC TCGCCGGAAA GCGGCATCAT CGAGAGCGAG 
GAGGCGCGCC GCGCCGAACT GCTGGAATGC CTGGCCTATT TCACCAACCT GTGGAACGAG 
CGGGTCAACG CCACCGAGCC CGGCGATGAC CTGATCTCGA TGCTGGCCCA TGGCGAGGCC 
ACCCGCGACA TGCCGCCCAT GGAGTATCTG GGCAACATCA TCCTGCTGAT CGTCGGGGGC 
AACGACACGA CCCGCAACTC CCTGACCGGC GGCCTCTACG CGCTCTCCAA GAACCCGGAG 
CAGGAAGCCA AGCTGCGGGC CGATCCCGAG CTGATCCCGT CGATGGTCTC GGAGATCATC 
CGCTGGCAGA CGCCCCTGGC CCACATGCGT CGCACGGCGC TGGCCGATAT CGAACTGGGC 
GGCAAGCAGA TCCGCAAGGG CGACAAGGTC GTCATGTGGT ACGTGTCGGG CAACCGCGAC 
GATACGGTGA TCGAGAACCC CGACGCCTTC ATCATCGACC GCGAGAACCC CCGCCGCCAC 
CTGTCGTTCG GCTTCGGCAT CCACCGCTGC GTCGGCAACC GCCTGGCCGA GATGCAGCTG 
AAGATCGTCT GGGAGGAGAT CCTCAAGCGC TTCCCGAAGA TCGAGGTCCT GGGCGAGCCC 
AAGCGGGTCT ATTCCAGCTT CGTGAAGGGC TATGAGAGCT TGCCGGTTCG GATCCCGACG 
CGGCTTTGA

Protein sequence

MSDGSIDFGD DARAKAWSIP LEDYHVADPA LFQADAMWPY FERLRKEDPV HWSRGIEETG 
PYWSITKYND IMAVDTNHQV FSSDAHLGGI TIRDFDEDFV LPMFIAMDPP KHDIQRKTVS 
PIVSPQNLAR LEGIIRERVC TILDGLPIGE TFDWVDKVSI ELTTQMLATL FDFPWEERRK 
LTRWSDVATA SPESGIIESE EARRAELLEC LAYFTNLWNE RVNATEPGDD LISMLAHGEA 
TRDMPPMEYL GNIILLIVGG NDTTRNSLTG GLYALSKNPE QEAKLRADPE LIPSMVSEII 
RWQTPLAHMR RTALADIELG GKQIRKGDKV VMWYVSGNRD DTVIENPDAF IIDRENPRRH 
LSFGFGIHRC VGNRLAEMQL KIVWEEILKR FPKIEVLGEP KRVYSSFVKG YESLPVRIPT 
RL