Gene Caul_1962 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_1962
Symbol
ID	5899417
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	-
Start bp	2104660
End bp	2105871
Gene Length	1212 bp
Protein Length	403 aa
Translation table	11
GC content	67%
IMG OID	641562452
Product	patatin
Protein accession	YP_001683589
Protein GI	167645926
COG category	[R] General function prediction only
COG ID	[COG1752] Predicted esterase of the alpha-beta hydrolase superfamily
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	0.308138
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.105403
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAATGGA CATCGACTTG GCTCGCCCTA ACGCTGGCGA CGGTGTCGCT GGGGTTGGCG 
GCCTGCGGAA CGATCTCTCG ACCGGAGGAT GGCGTCCTGC AGACGCCGGT CCCGCTGAGG 
GCGGTGACCG ATCCGCGCAT CAACGCCAGA GACAGCGTGC GTCTGCGGGC TCTCGAGGGC 
GAGATTGTCG GCCGGATGTC GGCCTCTGGA GACGCGTCGA TCCTGTCGAT TTCGGGAGGC 
GGCGCCAACG GGGCCTACGG CGCGGGCGTC ATCGTTGGCT GGACGAAGGC GGGCGATCGA 
CCCTCATTTC CCATTGTCAC CGGTGTGAGC ACGGGCGCAT TGACGGCGCC CTTCGCCTTC 
CTGGGCCCTG ACTGGGACGA CGAGCTCGCA GCAGCCTATG CTGGCGGACA AGCCCATCAG 
CTCCTGAACT GGCGGCGCTT GGCCGCGCTG GTGGCGCCCA GCCTGTACAG CCCGACCACC 
CTGCGCGACT TGATCCAGCA CAGCGTGACG CCGCAGATGT TGTCGCAGAT CGCCGCCGAG 
CACGCAAAGG GACGGCGTTT GCTGGTGGTC ACCACCAATC TCGACACGGA AGAGACCATC 
ATCTGGGACA TGGGCCTGAT CGCCACTCAA GGCGGCCCCC AGGGTCTTCG CCTTTTTCGC 
GATGTGCTGC TGGCGTCGGC GAGCATTCCG GGGGTTTTTC CGCCGGTGAT CATCGGCGCT 
CGGTCGTCGG ACGGCCGCGT GGTCGGCGAG ATGCATGTCG ACGGCGGCGT CAACACGCCC 
TTCCTCGCCG TGCCCGAGGG TCTCCTGCTG TGGACCGCGC CAAGCTCGCT GGCCACCGGT 
AGCGGCCTCT ATGTCCTGGT CAACAGCAAG GTCGCGCCTG ACCGGCAGAT CACCCGCGGG 
CGCTTGCCTG ATATTCTCAG GCGCAGCTAC GACAGCGGCA GCAAGGCGTC GCTTCGCGCC 
CACTTGGCCG TCAACGTCGC CTTCGCCAAA CGCAACGGCA TGGCGATCTA CGTGGCGTCG 
ATACCCAGCG ATCTGCAGGC CAGCAGCCTC GATTTCAACC AGAACGCCAT GCGCGCCTTG 
TTCGAGGCCG GCCGCAACAG CGGGATGTCC GGGCAAGCTT GGCGCTCGGT CGCCAATCTC 
GCAGAGCCTT CATCGCCGTC GCCATCGGCG CCGGGACCGT CAGCGACGCC ACCCGCCCGC 
GCCGTCCCCT GA

Protein sequence

MKWTSTWLAL TLATVSLGLA ACGTISRPED GVLQTPVPLR AVTDPRINAR DSVRLRALEG 
EIVGRMSASG DASILSISGG GANGAYGAGV IVGWTKAGDR PSFPIVTGVS TGALTAPFAF 
LGPDWDDELA AAYAGGQAHQ LLNWRRLAAL VAPSLYSPTT LRDLIQHSVT PQMLSQIAAE 
HAKGRRLLVV TTNLDTEETI IWDMGLIATQ GGPQGLRLFR DVLLASASIP GVFPPVIIGA 
RSSDGRVVGE MHVDGGVNTP FLAVPEGLLL WTAPSSLATG SGLYVLVNSK VAPDRQITRG 
RLPDILRRSY DSGSKASLRA HLAVNVAFAK RNGMAIYVAS IPSDLQASSL DFNQNAMRAL 
FEAGRNSGMS GQAWRSVANL AEPSSPSPSA PGPSATPPAR AVP