Gene Caul_2159 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_2159
Symbol
ID	5902553
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	-
Start bp	2342277
End bp	2343254
Gene Length	978 bp
Protein Length	325 aa
Translation table	11
GC content	70%
IMG OID	641562650
Product	PDZ/DHR/GLGF domain-containing protein
Protein accession	YP_001683785
Protein GI	167646122
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0265] Trypsin-like serine proteases, typically periplasmic, contain C-terminal PDZ domain
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	30
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	8
Fosmid unclonability p-value	0.0222521
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGGCTTCAC CGTTTCAAGG TCATGAGGTC GAGGCGCGAC TGCGGCCCGC CGCCAGCGGT 
TACGCCTTCG ACCTGGACCA CGCACTGTCC GCCGTCGTCG CGCTGGAGGC GCGGGTTCCC 
GCCGACGCCT TCACCGCCGG GATCCTCGGC ACCGAGCGGC TGGGCAATGG CGTGGTGATC 
AGCGAGAACG GCCTGGTGCT GACCATGGGC TACCTGATCA CCGAGGCCAG CCAAGTGGTG 
CTGACGCTGA ACGACGGCGC GCGGGTGCAC GCCCACGTCC TGGGGTTCGA CTCGCAGACG 
GGCCTGGGCC TGGTGCAGGC GCTGGAGCCC CTGGGCCTGC CGCCGCTGCA CCTGGGGTCT 
TCGAAGGACC TGAGGGCGGA AAGCCCGGTC ATCATCGCCG GCGCGGGCGG GCGGGCGCAC 
GCGGCCGCCG GCCAGGTGCT GGCGCGCATG CCCTTCGCCG GCTACTGGGA ATATCTGCTG 
GACGACGCGA TCATCACCGA ACCGGCTCAC CCGCACTGGA GCGGCGCGGC GCTGATCGAT 
TCGACGGGAA ACCTCGTCGG CGTGGGCTCG CTCAGCCTGG CGGGACAGTC GCGCGGCGGC 
CAGGCCAAGC CCATGAACAT GTTCGTTCCC GCCGACCTCC TGCCGCCAAT CCTGGACGAT 
CTGGCGCGCG GCCGGCCGGC CCATCCGCCT CGCCCCTGGC TGGGGGTCTT CGCCCAGGAG 
ACGGATTCCC ACGTCATCGT GGTCGGCGTT TCGCCCAGTA GTCCGGCGGC CCGCGCCGAG 
CTTCGAGCCG GCGACCTGAT CCTCGCCGTC GCGGGCGAGC CCGTTTCCGA CCTCGCCGAA 
TTCTACACGG GCCTCTGGGA TCAGGGCCTG GCGGGCGCGA CCATCCCGCT ACGCATCCTG 
CGCGAACAGG ACGTGTTCGA GGTCGAGGTG CGCTCGGTGG ACCGCAACAC GCTGTTGAAG 
AAGCCTCGGT TCAATTAG

Protein sequence

MASPFQGHEV EARLRPAASG YAFDLDHALS AVVALEARVP ADAFTAGILG TERLGNGVVI 
SENGLVLTMG YLITEASQVV LTLNDGARVH AHVLGFDSQT GLGLVQALEP LGLPPLHLGS 
SKDLRAESPV IIAGAGGRAH AAAGQVLARM PFAGYWEYLL DDAIITEPAH PHWSGAALID 
STGNLVGVGS LSLAGQSRGG QAKPMNMFVP ADLLPPILDD LARGRPAHPP RPWLGVFAQE 
TDSHVIVVGV SPSSPAARAE LRAGDLILAV AGEPVSDLAE FYTGLWDQGL AGATIPLRIL 
REQDVFEVEV RSVDRNTLLK KPRFN