Gene Caul_5296 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_5296
Symbol
ID	5897218
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010333
Strand	-
Start bp	4405
End bp	5673
Gene Length	1269 bp
Protein Length	422 aa
Translation table	11
GC content	60%
IMG OID	641550589
Product	cytochrome P450
Protein accession	YP_001672075
Protein GI	167621567
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG2124] Cytochrome P450
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCGACG GCGCGATCGA TCTGAGGGCC GAGGCCCGCG CAAAGGCCTA CGCAATGCCG 
TTGGAGGACA TCAACCTCGC CGACACCGAG CTCTGGCGCA CCGACACGGT GTGGCCATAC 
TTGGAGCGGT TGCGCAAGGA GGACCCGGTT CATCTACACC CGGCGCATCA CCACCCGGAT 
GGCGCCTTCT GGTCCATTAC AAAGTATGCC GACATAATGG CCGTCGACAT CAATCACGAG 
GTGTTCTCGT CGGAGCCATC GATCACGATC TTCGATCCGA AAGAAGACTT TACGCTTCCG 
ATGTTCATCG CGATGGATCC GCCCAAGCAC GACGTCCAGC GTAAAACCGT CAGCCCGATT 
GTCTCGCCGG CCAACCTCCA CCTGATGGAG CCGTTGATCC GCAGCCGCAT CACCAAGACC 
CTGGACGAAC TGCCGATCGG CGAGCCCTTC GACTGGGTCG ATCGGGTTTC CATCGAACTC 
ACTACCCAGA TGCTGGCCAC CCTGTTCGAC TTTCCCTGGG ATGAACGGCG CAAGCTGACC 
CGCTGGTCGG ACATCGCTAC TGCGGTGCCT GAGTCGGGCC TATTCGTTAC GGACGACTAT 
GAGACCGAGC GAAGAATGGA GCTCTTTGGC TGCGTGGATT ACTTCACGCG GCTCTGGAAC 
GAGCGGGTCA ACGCCCCTCC CAAGGGCGAT CTGATCTCGA TGCTGGCCCA CGGTGAGGCC 
ACCCGAAACA TGGACCGCAT GGAGTACCTC GGAAACCTGC TCCTGTTGAT CATCGGCGGC 
AATGACACCA CCCGCAATAC GATGACGGGC TCGATCCTAG CGATGAACCA GAACCCCGAT 
CAGCTGCGAA AGCTGCGCGA GAATCCCAGC CTGATTCCCT CCATGGTCTC CGAGACCATT 
CGCTGGCAGA CCCCGCTCTC CAACATGCGG CGCACCGCCA CACAGGATTT CGAGCTTGGC 
GGCAAGCTCA TCAAGAAGGG CGACAAGGTG CTGATCTGGT ACGCCTCGGG CAACCGGGAC 
GAGGAGGCGA TCGAGAACCC TGAAGCTTAC ATCATCGACC GAGAGCGGCC GCGCAACCAC 
CTGTCCTTCG GCTTTGGAAT TCACCGCTGC GTGGGCAACC GTCTGGCCGA GCTGCAGCTA 
CGGATTCTCT GGGAAGAGAT CCTGCCTCGT TTTCCTGAGA TCCAAGTGCT TGAGGACCCG 
CAGCGCGTGC CGTCGGTCTT GATCCGGGGT TATTCGTCCA TGCCGGTCAT GATCCCCGCG 
CGTTCCTGA

Protein sequence

MSDGAIDLRA EARAKAYAMP LEDINLADTE LWRTDTVWPY LERLRKEDPV HLHPAHHHPD 
GAFWSITKYA DIMAVDINHE VFSSEPSITI FDPKEDFTLP MFIAMDPPKH DVQRKTVSPI 
VSPANLHLME PLIRSRITKT LDELPIGEPF DWVDRVSIEL TTQMLATLFD FPWDERRKLT 
RWSDIATAVP ESGLFVTDDY ETERRMELFG CVDYFTRLWN ERVNAPPKGD LISMLAHGEA 
TRNMDRMEYL GNLLLLIIGG NDTTRNTMTG SILAMNQNPD QLRKLRENPS LIPSMVSETI 
RWQTPLSNMR RTATQDFELG GKLIKKGDKV LIWYASGNRD EEAIENPEAY IIDRERPRNH 
LSFGFGIHRC VGNRLAELQL RILWEEILPR FPEIQVLEDP QRVPSVLIRG YSSMPVMIPA 
RS