Gene Caul_1079 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_1079
Symbol
ID	5898534
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	-
Start bp	1140444
End bp	1141982
Gene Length	1539 bp
Protein Length	512 aa
Translation table	11
GC content	72%
IMG OID	641561561
Product	CBS sensor hybrid histidine kinase
Protein accession	YP_001682707
Protein GI	167645044
COG category	[T] Signal transduction mechanisms
COG ID	[COG0642] Signal transduction histidine kinase [COG0784] FOG: CheY-like receiver
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	0.721589
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGATACGC TCGACCGCCT TATTGACCGC CGAGCCCCGA TCGATCCCGC GACCCCCTGC 
GCGGACGTCC GGGCGATTTT CTTGGCCGAA GCGCACGCCG CCGCCGTGGC CGTCGTCGTG 
GCGGGCAAGC CCGTGGGGCT GGTCTATCGC GACGTGTTCC TGGGCCAGAT GGCCGTCGCC 
GATCTGGACG CCCGCCCGGT CTCCGAGGTC ATGGACCGCG AACCGCGGAC CGTCGAGTGC 
AGCCTCACGG CCACCGCCTT CGTCGAGAGC ATCACGCAGA GCGCCATCCC CGTCTTCCGC 
AGCGCCTATG TCAGCGTCGA CGAAGCCGGC GACTATGTCG GCGTTGGCGG CCTGAGCTCG 
CTGCTCGCCT CGCACCGCCG CCGCCAGCGC GAGGCCGAGG AGGCCATGGC CCTGGTCGAG 
CGCATGGCCG TCGATGTCAG CCACCATCTG GAAGGCGTCC TGGCCTTCAC CGAGCGGCTG 
GAGCAGTCGC GCCTGACGCC CGACGCCGCC GCCTATGTCC GCGCCATCGG CGACACCAGC 
CGCGACATGA GCCAGGTGCT CGGCCGGGCC ATGGACCTGC GCCGCGCCGC CACCGGCGGC 
CTGACCCTGA CCCCCGCCCC GTCCCTGCTG CGCGACCTCA GCGACGCCGT CGAGGCCCGC 
TGGAGCGCCC GCGCCGCCGA GGGCGGCTCA ACCCTGCTGT TCTCCTACGA CGGCGACCCC 
GAAGCCGCCG CCCTGATCGA CGCCGACCGT GTGTTGCAGG TGTTCGACGC CCTGATCGAC 
AGCGCCCTGT CCAGCGGTCG CGGCGTGATC GAGGCCAGCC TCAAGGCCCG TCCGGTCAAT 
CTTGAGCATG GGGGCGGCCT GCGGCTTGAA GGCCGCGTGC GCGACAACAC CGCCGGCTCG 
CCCGAGGAAC GCCTGGCCCG GGTCTACGAC CCGCTGGGCG CGGGCAGCAT CGAGGATCGC 
AACGAACTGG CCCTGGGCGT CAGCATGGCC CTGGCCCACG GCCTGACCCG CGCCATGGGC 
GGCCCGCTGC GCGCCGAGGC CAATCTTGGC GCCGGCCTGA CCCTGCACTT CTCGGTGACC 
GCCCCGCAGG TCAACATGAT CCAGGGTCCC GCCGAGGAAC CGACGATGGA CGCCCGCTCG 
GCCCACATCC TGATCGTCGA TGACAACGCC ACCAACCGCA TGGTCGCCGA GGCCCTGTGC 
GAGATGTTCG ACTGCACCTC CGAGCAGGTG GTCGACGGGC TCGAGGCCGT CGAGGCCGCC 
AAGTCTGGCC GCTTCGACCT GATCCTGATG GACATCAAGA TGCCGCGCAT GGACGGCGTC 
GCCGCCACCC GCGCCATCCG CGAACTGCCC GGCCGGGCCG GCAGCGCCCC GATCGTCGCC 
CTGACCGCCA ACGCCGACCC CGCCGACGTC GCCACCTACG TCGCCGCCGG CATGCAGGAC 
GTGGTCGAAA AGCCGATCAA GCCCGAACGC CTGGCCGTGG TGCTCAGCGC CCTGCTCGGC 
GGCGACAACG AGAACGCGGA CGCCGAAGCG GCGGCCTAG

Protein sequence

MDTLDRLIDR RAPIDPATPC ADVRAIFLAE AHAAAVAVVV AGKPVGLVYR DVFLGQMAVA 
DLDARPVSEV MDREPRTVEC SLTATAFVES ITQSAIPVFR SAYVSVDEAG DYVGVGGLSS 
LLASHRRRQR EAEEAMALVE RMAVDVSHHL EGVLAFTERL EQSRLTPDAA AYVRAIGDTS 
RDMSQVLGRA MDLRRAATGG LTLTPAPSLL RDLSDAVEAR WSARAAEGGS TLLFSYDGDP 
EAAALIDADR VLQVFDALID SALSSGRGVI EASLKARPVN LEHGGGLRLE GRVRDNTAGS 
PEERLARVYD PLGAGSIEDR NELALGVSMA LAHGLTRAMG GPLRAEANLG AGLTLHFSVT 
APQVNMIQGP AEEPTMDARS AHILIVDDNA TNRMVAEALC EMFDCTSEQV VDGLEAVEAA 
KSGRFDLILM DIKMPRMDGV AATRAIRELP GRAGSAPIVA LTANADPADV ATYVAAGMQD 
VVEKPIKPER LAVVLSALLG GDNENADAEA AA