Gene Caul_0036 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_0036
Symbol
ID	5897748
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	+
Start bp	43559
End bp	45103
Gene Length	1545 bp
Protein Length	514 aa
Translation table	11
GC content	67%
IMG OID	641560519
Product	TPR repeat-containing protein
Protein accession	YP_001681672
Protein GI	167644009
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG0412] Dienelactone hydrolase and related enzymes
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	0.83786
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.225653
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGCGTAT TGTTTCTGTT GCTGGTGCTT CTTGCCGCAC CGTCCGTAGG CCTCGCCAAC 
TCCAACTTCA CCCGCACGAA CCCGCCCGGC CCGCACGCGG TGGGACTGAA GGTCGTCGAG 
CAATACGATT TCTCCCGCGC CTATCGCGGG CTCACCGACG TCGCCACGGG CAAGGTGGTC 
ACCGGAGAGC GAGCGCGGCC GATCCAGACC TTTGTCTGGT ACCCTGCGGC GAACACCGCG 
AAACCGACCA TGACCGTCGC CGACTATCTC AAGATCGGCG CCAGCGACGA CGATTTCGAG 
CACACCCCCG CCGAGCGCGC GGCCCTGGAG GCCGCGTTCG CCCAGCAACG GACCGGCGCC 
CTGTCGCCGC AGCGCGCCAA GGCCGAGTTG GCCGCGCCGA TGCAGGCCCA TCGTGACGCC 
GCCGCCGTAT CAGGCAAGTT CCCGGTCGTG ATCTACGCCC CCAGCTTCAG CGCCTGGGCG 
TTCGAGAACG CCGACCTGTG CGAATACCTG GCCAGCCAGG GTTATGTGGT CATCGCAAGC 
CCCAGCCTGG GTCAGGCTCA GCGCGACATG GCAACCGACC TAGAAGGTCT CGAGACCCAG 
GCGGGCGACA TCGAGTTCCT GATTGGCTAC GCCCATGGCC TGCCCCAGGC CGACACCAAC 
CGCTTGGCCG TGATCGGCTA TAGCTGGGGC GGCCTGGCCA ATGTCCTGGC CGCGGCCAAG 
GACAGCCGCA TCGACGCCCT GGTCGCCTTG GACGGCTCGG TCCGGTACTG GCCCCAGTTG 
CTCAAGCAGG CCGCCTACGC CACCCAGGCC CGCGCCACCG CCCCGCTGCT CTTTATCGCC 
GCCCGGCCGC GTGAGATCGA GGACCTGGCG GAGGGGCGCA ACGAGGTCAC CAGTCCGCTC 
AACCACATGA AATATGCCGA TGTCTACCGC GTGACGCTGG CCCCGATGGT GCATGAGAAC 
TTCTCGGTGA TGTTCGGCCA GCGCCTGCTG GGCGACAGCC GTTACAGGGA GTACGACAAG 
GATGAGCTGT CGACAGCAAC CGCCTGGATG GAGGCCTATG TCCGCCGGTT CCTGGACGCC 
TATCTGAAAG GCGACGCGGC CAGCCGGACG TTCCTGGACC TGCCGGCCGC CAAGAGCGGC 
GCGCCCGCCC ACCTACTGAC CACCCACGTG ACCCACAGCC AGGGTGCGCC GCCGACCCGC 
GCGGCTTTCG CCGCCGAACT GGCTCGCCAG GGCTTCGGCA AGGCTTCGAG CGTCTACCAA 
GCCTTCAAGG CCAGGGAGCC CGACTTCACG CTCTCCGACG ACGAGCTTGT AAGCTGGGCT 
TACCAGCGCA TGGGCGACGG CGACGTCGGC GCGGCGGTCG CCCTGCTTCG GCTGGACACC 
GAGATCCACG CGGACAGCTG GAACGCCTTC GACAGCCTGG GCGAGGCCTA CGCCAAGAAC 
GGCGACAAGG CCCCGGCGAT CGCCGCCTAC CGCCAGTCTC TGGTGCTGAA CCCGAAGAAC 
ACCAACGGGG TCGAGCAATT GAGAGCGCTC GGGGTGCAGC CTTAG

Protein sequence

MRVLFLLLVL LAAPSVGLAN SNFTRTNPPG PHAVGLKVVE QYDFSRAYRG LTDVATGKVV 
TGERARPIQT FVWYPAANTA KPTMTVADYL KIGASDDDFE HTPAERAALE AAFAQQRTGA 
LSPQRAKAEL AAPMQAHRDA AAVSGKFPVV IYAPSFSAWA FENADLCEYL ASQGYVVIAS 
PSLGQAQRDM ATDLEGLETQ AGDIEFLIGY AHGLPQADTN RLAVIGYSWG GLANVLAAAK 
DSRIDALVAL DGSVRYWPQL LKQAAYATQA RATAPLLFIA ARPREIEDLA EGRNEVTSPL 
NHMKYADVYR VTLAPMVHEN FSVMFGQRLL GDSRYREYDK DELSTATAWM EAYVRRFLDA 
YLKGDAASRT FLDLPAAKSG APAHLLTTHV THSQGAPPTR AAFAAELARQ GFGKASSVYQ 
AFKAREPDFT LSDDELVSWA YQRMGDGDVG AAVALLRLDT EIHADSWNAF DSLGEAYAKN 
GDKAPAIAAY RQSLVLNPKN TNGVEQLRAL GVQP