Gene Caul_4551 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_4551
Symbol
ID	5902012
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	-
Start bp	4926712
End bp	4928154
Gene Length	1443 bp
Protein Length	480 aa
Translation table	11
GC content	72%
IMG OID	641565070
Product	histidine kinase
Protein accession	YP_001686169
Protein GI	167648506
COG category	[T] Signal transduction mechanisms
COG ID	[COG0642] Signal transduction histidine kinase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	31
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.412829
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCGATGG CCTCGCCGTC TTCGTCAGCC CGTTCCGACG GGTCCGTTCC CACGCCGCTC 
GGCCTGTGGG CCGCGGTGCT GGTGGGACCC GCGGCGCTTC TGGTCCTGGC CGCGACGGGG 
GCGGCCAATC CCGGCGCGGC GGTTCCGTTC GCCCTGGCCA GCGGCGCGGC CGGGCTGTTG 
CTGGTGCGCC GAGCCCAGCG TCGGACGCCG GACCGGGCGG CCCCGGTCCC GCTGCCGGCC 
GTGGTCGACC AACCGCCGCC GTTCGGCCTG ATTCTCGAAA CCCTGCCCGA TCCGCTGATG 
GTCATCGCCG CCGAGGAGGC CGACGACCTG ACCGGCCGGC GATTCGTGTT CGCCAACGCC 
GCGGCGCGCG ACCTGTTCAA GCTGCAGCCG CGCGGCGGGC TGCTGGTCTC GGCCATGCGC 
AGCCCGCAGG TGCTGGAAGC GGTGGACGAA AGCCTGTTCG GCGGCGTGCG GCGCTCGGTC 
GACTATGTCG GCGGCGGCGC CCAGGGGCGG GAATGGGCGG CGCACTCCGC GCCGCTGGGC 
GTCGATGAGC GCGGCTCGCG CCTAGCCCTG CTGGTGCTCA GCGACGAGAC CGACACCCGT 
CGCAGCGAGC GCACCCGGGC CGACTTCCTG GCCAACGCCA GCCACGAGCT GCGCACGCCC 
TTGGCCTCGC TGTCGGGCTT CATCGAGACC CTGCGCGGCC ACGCCAAGGA CGATGTCGGG 
GCGCGCGACA AGTTCCTGGG CATCATGCAG GCCCAGGCCG AACGGATGGC CCGGTTGATC 
GACGACCTGA TGAGCCTGTC GCGCATCGAG CTCAACGAGC ACATCGCGCC GCTTGGCCAG 
GTCGACCTGG CCATGGCGAC GATCGACGTG CTCGACGCCC TGGCTCCCCA GGCCAAGGAC 
AAGGCCGTGA GCTTCGATCC CATCCTGCCG CCGCGCGGCG CGGCCGTGGT CGAGGGCGAT 
CGGGACCAGA TCGTCCAGGT GATCCAGAAC CTCATCGACA ACGCCATCAA ATATACGCCC 
CGCCACGGCG CGGTGCGGGT GGAGGTGTTT TCGGGCCTGA CCGCCGACAT GGCCGCCGCG 
CCGCGCGACC CCGCCGCCGC GCGGATGTCG CTGCTGACCC CCGATCACGC GGTCGAGGAG 
CGCTACGCGT CATTCCGGGT CAGCGACAAG GGGCCAGGCA TGGCCCGCGA GCACCTGCCG 
CGCCTGACCG AGCGATTCTA TCGGGTCGAG GGCCAGAAGA GCGGCGAACG CTCGGGCACG 
GGCCTGGGCC TGGCCATCGT CAAGCACATC ATGAACCGCC ACCGCGGCGG CATGACGGTG 
GAGAGCGTGC AGGGCGCGGG CGCGACGTTC GGGGTCTATT TTCCCATGGC CAAGGTGGTC 
CCGGAGAAGA TCCGCGCCTT GCCGGAGGCC GCCGGGACGG ACGCTGTCGC AAAACCGTCG 
TGA

Protein sequence

MPMASPSSSA RSDGSVPTPL GLWAAVLVGP AALLVLAATG AANPGAAVPF ALASGAAGLL 
LVRRAQRRTP DRAAPVPLPA VVDQPPPFGL ILETLPDPLM VIAAEEADDL TGRRFVFANA 
AARDLFKLQP RGGLLVSAMR SPQVLEAVDE SLFGGVRRSV DYVGGGAQGR EWAAHSAPLG 
VDERGSRLAL LVLSDETDTR RSERTRADFL ANASHELRTP LASLSGFIET LRGHAKDDVG 
ARDKFLGIMQ AQAERMARLI DDLMSLSRIE LNEHIAPLGQ VDLAMATIDV LDALAPQAKD 
KAVSFDPILP PRGAAVVEGD RDQIVQVIQN LIDNAIKYTP RHGAVRVEVF SGLTADMAAA 
PRDPAAARMS LLTPDHAVEE RYASFRVSDK GPGMAREHLP RLTERFYRVE GQKSGERSGT 
GLGLAIVKHI MNRHRGGMTV ESVQGAGATF GVYFPMAKVV PEKIRALPEA AGTDAVAKPS