Gene Caul_2447 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_2447
Symbol
ID	5899902
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	+
Start bp	2669859
End bp	2670986
Gene Length	1128 bp
Protein Length	375 aa
Translation table	11
GC content	67%
IMG OID	641562938
Product	patatin
Protein accession	YP_001684072
Protein GI	167646409
COG category	[R] General function prediction only
COG ID	[COG1752] Predicted esterase of the alpha-beta hydrolase superfamily
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	0.191371
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.648479
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGTCGAAGT CTTGGATGAA GCAGCTTGGC CGGACCGATG CGCCGCCACC CGGCGTCGCC 
GCGGAACCGG CCGGGTTTCC AAAAGTGCGT TTCATCAATG GCGCGGCGCA GGATGATCCG 
GTTTGGTTGT TCGGCGGCTT GTCGCCGGGC GACCCGTCGG CGCCCGCGCA AAACCTCAAC 
GTCCTGGCGC TCTCCGGCGG CGGGGCTGGC GGGGCGTTCG GGGCCGGCGC CCTGGTCGGC 
CTCACCGAGA CTGGAACGCG TCCGATCTTC GACTTGGTGA CTGGCGTCAG CACCGGAGCG 
TTCATCGCGC CGTTCGCCTT CCTCGGATCG ACCTGGGACC ATCGCCTGGC CGACGCCTAT 
TGCGATGGGC ACGCCGCCGA CCTCCTGGCG CTCAAGGGCC TAAGGCCAGG AGCCAGCCTG 
TTCGGCGCCG AGCCCCTCAC GAACCTCGTC GAACGCCACA TCGACGCGCC GTTGCTGGAG 
GCCGTCGGCG CGGCCCACCT CGCTGGGCGG CGCCTCTTTG TCGCCACCGC CAATCTCGAC 
ACCGAGGCCA CATCGATCTG GGACATGGGC GCGATCGCCA GCCAGGGCGG CGAGGCGGGT 
CTGACCCTGT TTCGCGACAT CCTGGTGGCC TCGGCGAGTC TTCCGGGACT GTTCCCGCCC 
AAGATGATCG CGGTGGAGAG CGAGGGGCGC CGCTATGAAG AAATGCATGT GGATGGCGGC 
ACGATCAGTC CGCTGTTCGT GACGCCAGAA CCCCTGACAT TTGCGCGCCC GTCAGGGTGG 
TCAGACCGGG CCGTCGATGT CTATGCCTTG GTCAACACCA CGCTCAATGG CGGGGCGACG 
ACAACGTCCA TGAACGTGAT TCCCATCCTG ATGCGCAGCT TCGAGCTGAT GCTCAAGACC 
TCGTATCGCA ACGCTCTGAG GACCGTGGCC GCCTTTTGCG AGATCAATGG CTTCGCGCTC 
CACACCGCCT GCATACCCGC TGAACTTGGC GGGGTCAGCA TGCTGCGCTT CGAAGAGCCG 
GCGATGATCG ACATGTTCGA GCGTGGCGTT CGGGCCGCCC GCGAGGGCCA GCTATGGTCG 
ACCGTGGCCG CCCCCGCCGA GTCCTCCCGG CCGGCGGCGG CGTCCTGA

Protein sequence

MSKSWMKQLG RTDAPPPGVA AEPAGFPKVR FINGAAQDDP VWLFGGLSPG DPSAPAQNLN 
VLALSGGGAG GAFGAGALVG LTETGTRPIF DLVTGVSTGA FIAPFAFLGS TWDHRLADAY 
CDGHAADLLA LKGLRPGASL FGAEPLTNLV ERHIDAPLLE AVGAAHLAGR RLFVATANLD 
TEATSIWDMG AIASQGGEAG LTLFRDILVA SASLPGLFPP KMIAVESEGR RYEEMHVDGG 
TISPLFVTPE PLTFARPSGW SDRAVDVYAL VNTTLNGGAT TTSMNVIPIL MRSFELMLKT 
SYRNALRTVA AFCEINGFAL HTACIPAELG GVSMLRFEEP AMIDMFERGV RAAREGQLWS 
TVAAPAESSR PAAAS