Gene Caul_0166 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_0166
Symbol	hrcA
ID	5897878
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	-
Start bp	185097
End bp	186173
Gene Length	1077 bp
Protein Length	358 aa
Translation table	11
GC content	69%
IMG OID	641560650
Product	heat-inducible transcription repressor
Protein accession	YP_001681801
Protein GI	167644138
COG category	[K] Transcription
COG ID	[COG1420] Transcriptional regulator of heat shock gene
TIGRFAM ID	[TIGR00331] heat shock gene repressor HrcA

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	0.714476
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.458775
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACACAGC TGTTTTCCGG GTTTTCCGCT CAGACGCCCA GTCTCACCGA CCTGGATGGG 
CGGGCTCGCG ACATTTTCCG GCGGGTGGTC GAATCCTATC TCGAGACCGG CGAACCGGTC 
GGATCGCGGA CCATCTCGCG CGGCGGGGTG CAGCTGTCGC CGGCCTCGAT CCGCAACACC 
ATGCAGGATC TGGCGCAGCT GGGCCTGCTG GACGCCCCCC ATTCCAGCGC CGGCCGCATC 
CCCACCCATG CGGGCCTGCG GATGTTCGTC GACGGCCTGC TGGAGGTGGG CGACATCGGC 
GAGGAGGAGC GGCGGACCAT CGAATCGCGA CTGTTCGCCC ACGGTCGCTC GTTCGAAGAG 
GCGATGGGCG AAGCCAGCGC CATCCTGTCG GGCCTGGCCG GCGGGGCGGG CATCGTAGTC 
ACCCCGGTCC GCGAAGGCGG GGTCAAGCAC GTGGAGTTCG TGGCCCTGGG CGCCGACCAG 
GCCCTGGCGA TCATGGTGTT CGACGACGGC ACGGTTGAGA ACCGGTTGAT GAAGCGCTCG 
GCCGGCGTCA CGCCGGCCTC CCTGCAGGAG GCCTCCAACT TCCTCAACGC CCGCCTGCGC 
GGCCGCACCC TGAACGAGGC CAAGACCGAG ATGGCGGCCG AGCTGGACAC GGCCCGGCGC 
GAACTGGACG CCACGGCGGC GCGCCTGGTC GAGGACGGCC TGGCGGCCTG GAGCGGCGGC 
GACGACCCCG ACCGCGCCCT GATCGTCCGC GGTCGCGCCA ACCTGCTGGC CGACGCCAGC 
GCCCGGGAAG ATCTCGAGCG CGTCCGGCGG CTGTTCGATG ACCTGGAGCA GAAGGGCCAA 
CTGATCGGCC TGCTGGACGA TGTGCGATCC GCCGAGGGCG TGCGCATTTT CATCGGGGCC 
GAAACGCGAC TCTTTTCGCT TTCGGGTTCC TCCCTGATCG CGGCGCCCTA TATGTCGGGC 
CGACAAAAGG TGTTGGGAGC GATCGGCGTG ATCGGTCCCA CGCGTTTAAA CTATGCCCGG 
GTGATCCCGC TGGTGGACTA TACCGCTCGC GTGCTTGGCC GGATGATGGA CGGATAG

Protein sequence

MTQLFSGFSA QTPSLTDLDG RARDIFRRVV ESYLETGEPV GSRTISRGGV QLSPASIRNT 
MQDLAQLGLL DAPHSSAGRI PTHAGLRMFV DGLLEVGDIG EEERRTIESR LFAHGRSFEE 
AMGEASAILS GLAGGAGIVV TPVREGGVKH VEFVALGADQ ALAIMVFDDG TVENRLMKRS 
AGVTPASLQE ASNFLNARLR GRTLNEAKTE MAAELDTARR ELDATAARLV EDGLAAWSGG 
DDPDRALIVR GRANLLADAS AREDLERVRR LFDDLEQKGQ LIGLLDDVRS AEGVRIFIGA 
ETRLFSLSGS SLIAAPYMSG RQKVLGAIGV IGPTRLNYAR VIPLVDYTAR VLGRMMDG