Gene Caul_3018 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_3018
Symbol
ID	5900473
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	+
Start bp	3285949
End bp	3287961
Gene Length	2013 bp
Protein Length	670 aa
Translation table	11
GC content	66%
IMG OID	641563519
Product	poly(R)-hydroxyalkanoic acid synthase, class I
Protein accession	YP_001684643
Protein GI	167646980
COG category	[I] Lipid transport and metabolism
COG ID	[COG3243] Poly(3-hydroxyalkanoate) synthetase
TIGRFAM ID	[TIGR01838] poly(R)-hydroxyalkanoic acid synthase, class I

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.27509
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCCACGA CTGAAACCTC TCCCAAACCG CGAAAAAAGG CCGTCTCCAA GGCGGATGCG 
ACGCCGACCG CCGCGAAGAC CAAGTCCAAG GCCGCGCCGA AGGCTCCTCC GAAAATCGCC 
CCCGAACCGG CAGCCCGCGC CAAGCCCGCC GAATCGGCCT CGCGCCGCGA ACCGCCTCGG 
GCGGCGGCGC CCACCGGCGC CATGCCCGAG CTCGAGGCCC TCCTGTCGCC CGACCAGCGC 
CAGATGCTCG AGACCCTGTC GGCCAACCTG GCCCGCGCCG CCGTCACCGC CCAGGGGGCG 
ATCGCCGAGG CCGCCCTGCG CCAGGCCGAC CGGCCGGCGG CCCTGAGCGC CGACCCGTTC 
CACGTCGGCC CCGCCTTCAA CGAGGTGATG ACCAGCCTGG CCGCCCAGCC CGACCGCCTG 
CTGCGGGCCC AGGCCGACCT CTTTACCCGC TACATGGACC TGTGGCAGTC GGCCGCCCGC 
AGAATGACCG GCGAGCAGAC CCAACCCATC GTCGCGCCAA CCAGCGGCGA CAAGCGGTTC 
AGCGACCCCG ATTGGGCCAC CAATCCGATG TTCGACATGA TGAAGCAGAG TTACCTGCTC 
TCTTCCAATT GGCTGAACGA TCTGGTGTCG CAGGCCGAGG GCGTCGATCC CAGCGCCAAG 
CGCCGGGTCG AGTTCTTCAC CAAGATGCTG ACCGACGCCT TCTCGCCGTC GAACTTCCTG 
ATCTCCAACC CGGCCGCCCT GCGCGAGGTG ATGCAGAGCA AGGGCGAGAG CCTGGTGCGC 
GGCATGCGAA ACTTCGCCGC CGATCTCGAG CGCGGCGGCG GCCAACTGGC CATCAGCCAG 
ACCGATCTGG CCAAGTTCAA GGTCGGCGAG AATGTCGCCA CCGCCCCCGG CAAGGTGGTC 
TATCAGAACG ACATCCTGCA GCTGCTGCAG TTCGATCCGA CCACGGAGCA GGTGCACGAG 
ATCCCGCTGC TGATCTTCCC GCCGTGGATC AACAAGTTCT ATATCCTCGA CCTGCGGCCC 
GAGAACTCGA TGATCCGCTG GCTGACCGGC CAGGGCTTCA CGGTGTTCGT GGCCTCGTGG 
GTCAATCCCG ACAGTGAACA AGCGACCAAG ACCTTCGAGG ACTACATGTT CGAGGGGATC 
TACGACGCCA GCCAGCAGGT GATGAACCAG ACCGGCGTCA ACAAGGTCAA CACCGTCGGC 
TACTGCATCG GCGGCACCCT GCTGTCCTGC GCCCTGGCCC ACATGGCGGC CAAGGGCGAC 
AAACGGATCA ATTCGGCCAC CTTCTTCGCC GCCCAGCAGG ACTTCTCCGA GGCCGGAGAC 
CTGCTGCTGT TCACCGACGA GGAATGGCTG AAGTCGATCG AGACGCTGAT GGACCAGAAG 
GGCGGCTACC TGCCCAGCCA GTCGATGGCC GACACCTTCA ACAGCCTGCG CGGCAACGAC 
CTGATCTGGT CGTTCTTCAT CAACAACTAC CTGATGGGCA AGGAGCCGCG GCCCTTCGAC 
CTGCTGTTCT GGAACGCCGA CCAGACGCGC ATGCCCAAGG CCCTGCACCT GTTCTATCTG 
CGCAACTTCT ACAAGGACAA CGCCTTGACC ACGGGTCACC TGACCCTGGG CGGCGTGAAG 
CTGGACCTGT CGAAGGTCAA GACCCCGATC TATGTCCAGT CATCCAAGGA CGACCACATC 
GCCCCGTTCC GCAGCGTCTA TCGCGGCGCG CGAGCCTTCG GCGGGCCGGT CACCTTCACC 
ATGGCCGGCT CGGGCCACAT CGCCGGGGTG ATCAACCATC CCGACGCCAA GAAGTACCAG 
CACTGGACCA ACGACCAGTT GCCCGGCTCG GTCGAGGACT GGCGCGCCGG CGCGGTCGAG 
CATCCCGGCT CGTGGTGGCC GCACTGGGCG ACCTGGCTGA AGGCCCGATC AGGCAAGCTG 
GTCCCGGCCC GCGATCCGGC CAAGGGCCTG CTGAAACCGT TGGAGGACGC GCCGGGCAGC 
TTCGTGCGGG TGCGGTCGAA CGCGGCGGCC TGA

Protein sequence

MATTETSPKP RKKAVSKADA TPTAAKTKSK AAPKAPPKIA PEPAARAKPA ESASRREPPR 
AAAPTGAMPE LEALLSPDQR QMLETLSANL ARAAVTAQGA IAEAALRQAD RPAALSADPF 
HVGPAFNEVM TSLAAQPDRL LRAQADLFTR YMDLWQSAAR RMTGEQTQPI VAPTSGDKRF 
SDPDWATNPM FDMMKQSYLL SSNWLNDLVS QAEGVDPSAK RRVEFFTKML TDAFSPSNFL 
ISNPAALREV MQSKGESLVR GMRNFAADLE RGGGQLAISQ TDLAKFKVGE NVATAPGKVV 
YQNDILQLLQ FDPTTEQVHE IPLLIFPPWI NKFYILDLRP ENSMIRWLTG QGFTVFVASW 
VNPDSEQATK TFEDYMFEGI YDASQQVMNQ TGVNKVNTVG YCIGGTLLSC ALAHMAAKGD 
KRINSATFFA AQQDFSEAGD LLLFTDEEWL KSIETLMDQK GGYLPSQSMA DTFNSLRGND 
LIWSFFINNY LMGKEPRPFD LLFWNADQTR MPKALHLFYL RNFYKDNALT TGHLTLGGVK 
LDLSKVKTPI YVQSSKDDHI APFRSVYRGA RAFGGPVTFT MAGSGHIAGV INHPDAKKYQ 
HWTNDQLPGS VEDWRAGAVE HPGSWWPHWA TWLKARSGKL VPARDPAKGL LKPLEDAPGS 
FVRVRSNAAA