Gene Caul_0191 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_0191
Symbol
ID	5897465
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	-
Start bp	209019
End bp	210614
Gene Length	1596 bp
Protein Length	531 aa
Translation table	11
GC content	72%
IMG OID	641560675
Product	histidine kinase
Protein accession	YP_001681826
Protein GI	167644163
COG category	[K] Transcription [T] Signal transduction mechanisms
COG ID	[COG0642] Signal transduction histidine kinase [COG0745] Response regulators consisting of a CheY-like receiver domain and a winged-helix DNA-binding domain
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	36
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.363458
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAACAACC GTCCTTCCTC CGCCGGGGTC ACGCCCGAAC AGTTGGCCAC GCTAAGCCAT 
GAGTTCCGCA CCCCCCTGAA CGGCGTGCTG GGCATGGCCC GGCTGCTGGA GGGAACGCGG 
CTGACCGCCG AGCAGCGAGC CTATGTCGGC GCCCTGCGCG AGAGCGGCGA CCACCTGCTG 
TCGCTGGTCA ACGACGTGCT GGATTTCGCC CGGCTGGGGG CCACGGCCAT CGAGCTGCAT 
ACAGCCTCGG TCGATGTCGA GAACCTGCTG CGCCAGGTGG CCGAGTTGCT CAGCCCCCGG 
GCTCACGAGA AGAACATCGA GATCGCCTGG GCCGCCGCGC CCGGCCTGCC GGCCATCCTG 
GCCGACGAAG GGCGCCTGCG GCAGGTGCTG CTGAACTATG CCGGCAACGC CATCAAGTTC 
ACCGAGACGG GCGGGGTCCT GCTGAGCGCC GAACTCGTGG TCCCCACCTC CGATTCCGAA 
GGCCGTCTTC GCTTCAGCGT CCGCGACACC GGGCCGGGCG TCGCCCCGGA AGCCCGCGCC 
GCGATCTTCG AGGCCTTCGT CCAGACCGAT CCCTCGCACC AGGCCCAGCT GGGTGGAGCG 
GGCCTGGGCC TGGCCATCGT CGCCCGCCTG GCCGGCGCCA TGAGCGGCGA GGCCGGGGTC 
GGGGGCGAGC TGGGCCAGGG CGCCGACTTC TGGTTCGAGG CCCCCTTTGA TTTCGCGCCG 
GCCATGCCGG TCGAACTGCC TCTGCACGGA CGCGCTGTCG CCATCGCCTC GCCCAACGCC 
ATGGTCCGCG AGGCCGCCAT CCGCCAGATC CGCGCCAGCG GCGGCCAGGC CCTGTCGGGC 
AAAACCGTCG TCTCGGCCCT GAAGGGCGCG CCCGCCGACG CGGTGCTGCT GCTCGACGCC 
GCCCTCGCCG GATCGCGTGG GGCCGGATCG CGTGGGGCCG GGCCGCGCGG CGCGCTGAAG 
CCGCCCATCG GCCGGGCCTG CGTGGTGCTG CTGACCCCCG ACCAGCGCGA CCGCATCCCC 
AAGCTGAAGG CCGCCGGCCT CGGTTACCTG ATCAAGCCCC TGCGTCGCGC CTCGCTGATC 
GCCCAGGTCC TGGCCGCCCA ATTTTCCGCC AAGGTGGCCG CCAACGAGCG CGAGATCGCC 
CCGACCGCCA CGCCGGTCGC CCACGAGGAC GACCGGATCG CCCCGGCCGC CGCCCCCGGC 
GTCCGCGTTC TGCTGGCCGA GGACAATCCG ATCAACGCCC TGCTGGCCCG GGCCCTGCTG 
GAACGCGAGG GCTGCAAGGT CGACCGCATC GCCAGCGGCG ACGAGGCCGT CTCGGCCCTG 
TCGCGCGGCT TCTACGACCT GATCCTGATG GACCTGCGCA TGCCGGGCCT GAACGGCATG 
GAGGCCACCA AGGCCCTGCG CGAACGCGGT GTCACCACCC CCATCGTCGC CCTGACCGCC 
GACGCCTTCG ACGAGGACCG CCGCGCCTGC CTGGCGGCCG GCATGAACGA CTTCCTGGCC 
AAACCCCTGA CCCCGGCGGC CCTGCGCGGC GTGCTGATCA ACTGGACCGG GCTTGGCTGG 
ACGAAAGCGG CGACGCGGGC CAAGGTCGCC TCCTAA

Protein sequence

MNNRPSSAGV TPEQLATLSH EFRTPLNGVL GMARLLEGTR LTAEQRAYVG ALRESGDHLL 
SLVNDVLDFA RLGATAIELH TASVDVENLL RQVAELLSPR AHEKNIEIAW AAAPGLPAIL 
ADEGRLRQVL LNYAGNAIKF TETGGVLLSA ELVVPTSDSE GRLRFSVRDT GPGVAPEARA 
AIFEAFVQTD PSHQAQLGGA GLGLAIVARL AGAMSGEAGV GGELGQGADF WFEAPFDFAP 
AMPVELPLHG RAVAIASPNA MVREAAIRQI RASGGQALSG KTVVSALKGA PADAVLLLDA 
ALAGSRGAGS RGAGPRGALK PPIGRACVVL LTPDQRDRIP KLKAAGLGYL IKPLRRASLI 
AQVLAAQFSA KVAANEREIA PTATPVAHED DRIAPAAAPG VRVLLAEDNP INALLARALL 
EREGCKVDRI ASGDEAVSAL SRGFYDLILM DLRMPGLNGM EATKALRERG VTTPIVALTA 
DAFDEDRRAC LAAGMNDFLA KPLTPAALRG VLINWTGLGW TKAATRAKVA S