Gene Caul_0089 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_0089
Symbol
ID	5897801
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	-
Start bp	101360
End bp	102160
Gene Length	801 bp
Protein Length	266 aa
Translation table	11
GC content	68%
IMG OID	641560572
Product	two-component response regulator
Protein accession	YP_001681725
Protein GI	167644062
COG category	[K] Transcription [T] Signal transduction mechanisms
COG ID	[COG1595] DNA-directed RNA polymerase specialized sigma subunit, sigma24 homolog [COG2204] Response regulator containing CheY-like receiver, AAA-type ATPase, and DNA-binding domains
TIGRFAM ID	[TIGR02937] RNA polymerase sigma factor, sigma-70 family

Plasmid Coverage information

Num covering plasmid clones	34
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.0453236
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGTCTTC TTGCCCGGCT GGCGCCGCAC TTGCCTTATG TTCGTCGCTA CGCCCGCGCG 
CTGACCGGCG ACCAAACCAC GGGCGACCAC TATGTCCGGG TCGCGCTCGA GGCCCTGGCG 
GCCGGCGAGC GGTCGCTGGA CGCCAACCTG TCGCCGCGCG TCGCGTTGTA TCGCGTTTTC 
CACGCCATCT GGCTGTCCTC GGGCGCCCAG CTTGAAGCCC GCCGCGACGA AGCTCCAAGT 
CAGGCCGACG ACGCGTCGCA GCGACTGATG CGCATCGCGC CCCGCTCACG GCAGGCGTTC 
CTGCTGACCG CCCTGGAAGG CTTCACGCCG ACCGAGGCGT CGCAAATTCT CGACTGCGAC 
TTTGGCGAGG TCGAACGGCT GATCGCCGAG GCCCAAACCG AGATCGACGC CGAACTGGCC 
ACCGAGGTCC TGATCATCGA GGACGAGCCG GTGATCGCCG CCGATATCGA GGCGCTGGTC 
CGCGAACTCG GCCACGAGGT CATCGACATC GCCGCCACCC GTGGCGAGGC GGTGGACGCC 
GTCAGTCGTC GCACGCCGGG CCTGGTCCTG GCCGACATCC AGCTGGCGGA CGGCTCTTCG 
GGCATCGACG CGGTCAAGGA CATCCTGGCG CGTCTCGACG TGCCGGTGAT CTTCATCACC 
GCCTTCCCCG AACGCCTGCT GACGGGCGAG CGACCGGAGC CGACCTTCCT GATCACCAAG 
CCCTTCCAGC CGGAAACGGT GAAGGCGGCC ATCGGCCAGG CGCTGTTCTT CCATCCGCGC 
CGCAGGCAGA AGGCCGCCTG A

Protein sequence

MSLLARLAPH LPYVRRYARA LTGDQTTGDH YVRVALEALA AGERSLDANL SPRVALYRVF 
HAIWLSSGAQ LEARRDEAPS QADDASQRLM RIAPRSRQAF LLTALEGFTP TEASQILDCD 
FGEVERLIAE AQTEIDAELA TEVLIIEDEP VIAADIEALV RELGHEVIDI AATRGEAVDA 
VSRRTPGLVL ADIQLADGSS GIDAVKDILA RLDVPVIFIT AFPERLLTGE RPEPTFLITK 
PFQPETVKAA IGQALFFHPR RRQKAA