Gene Caul_1912 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_1912
Symbol
ID	5899367
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	-
Start bp	2054206
End bp	2055486
Gene Length	1281 bp
Protein Length	426 aa
Translation table	11
GC content	65%
IMG OID	641562402
Product	cytochrome P450
Protein accession	YP_001683539
Protein GI	167645876
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG2124] Cytochrome P450
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	0.997168
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCACCG CCCAGATGAC CCCCAACAAG GATCTCGCCG AGGGCTTCGC CCAAGTCGGC 
GCCCTGTTCG CGGGCAACGA CAAGAATATC GACGCGATCT ACCGCGACCA CCGCCAGAAC 
ATGCCCGTGA TGCGGGGCGA TATCTGCGCC GAACTCGGCG CGGCATCCTT CGCGGGCCAG 
ACAGGCCGCC CGATCTATAC GATCTTCAGG CACGCCGACG TCATGAAGGT GCTGCGCGAC 
ACCAAGACCT TCACCAGCGG GATCCTGATG GAGACCGGCC TGGGCCAGTT CCTGGACGGC 
CTGATGATCA CCGGGCTGGA TGGCGATGAG CACCGGCAGC TGCGTGGCAT TCTGCAGCCG 
TCCTTCACGC CCGCGGTGAT GGAGGAATGG CGCGAGACCT ACATCCGTCC GCTGATCCAG 
CGCTCCTTCG TCGAACCCCT GGTCGCGCTG GGCAAGACGG AGCTGATCGG CAGCGTCGGC 
GTGATGTTCC CCATCCACGT CGTCTACGCC GTCCTGGGCT TCCAGGATAA CGATCCGGCG 
GCGCTTGAGA CCTTCGCCAC CAAGGCCCTC AAGGTTCTGG GCGGCATGGC CGACGACCCG 
GACGCCAAGC GCGCCGCCTT CCAGGCCTTC CAGGAACTCT ACGATCCGAC CCTCGCCGCC 
GTCCAGGCGC GCCGGGCCTC CGGCGCTGAA GGCGCCGACC TGATCAGCCG CCTGATCCGC 
GCCGAGTTCG AGGGCCGGAC CCTGAACGAT CATCAGATCA CCAATTTCGT GCGGATGATG 
CTGCCTGCCG CGTCGGAGAC TACCTCCAGA ACCTTCGCGA CCATGCTGAC CCACCTGTTC 
GATCACCCTG AAGTGCTTGA GCGCCTGCGC GCGGATCGGA GCCTGATGCG CAAGGTTCTG 
GACGAAAGCG TGCGCCACGA CGCCGTGGCC ACGTTCAAGG TCCGGGAATG CCAGGCGGAC 
GTCACGCTCC AGGACGTGAC CATTCCCAAG GGCTCGATCA TCTCGGCCTG CGTCGCCTCG 
GCGAACCGTG ATGAGCTGGT GTTCGACAAA CCCGAAGTGT TCGACATCGA CCGCAAACAG 
ATGCCGGCCT TCGGATTCGG GTTCGGAGCT CACATGTGCG TTGGAATGTG GCTAGCCAAG 
GTGGAGATCG AAGAGGCCGT CGGCCTGCTG CTCGACATGC TGCCCAACCT GCGCCTCGAC 
CCCGACCATC CTCGCCCGGA AGTGCGGGGC GTTTCGCTGC GCGGTCCGGA TGCGGTCCAT 
GTGATCTGGG ATATCCCCTA G

Protein sequence

MSTAQMTPNK DLAEGFAQVG ALFAGNDKNI DAIYRDHRQN MPVMRGDICA ELGAASFAGQ 
TGRPIYTIFR HADVMKVLRD TKTFTSGILM ETGLGQFLDG LMITGLDGDE HRQLRGILQP 
SFTPAVMEEW RETYIRPLIQ RSFVEPLVAL GKTELIGSVG VMFPIHVVYA VLGFQDNDPA 
ALETFATKAL KVLGGMADDP DAKRAAFQAF QELYDPTLAA VQARRASGAE GADLISRLIR 
AEFEGRTLND HQITNFVRMM LPAASETTSR TFATMLTHLF DHPEVLERLR ADRSLMRKVL 
DESVRHDAVA TFKVRECQAD VTLQDVTIPK GSIISACVAS ANRDELVFDK PEVFDIDRKQ 
MPAFGFGFGA HMCVGMWLAK VEIEEAVGLL LDMLPNLRLD PDHPRPEVRG VSLRGPDAVH 
VIWDIP