Gene Caul_3968 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_3968
Symbol
ID	5901430
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	-
Start bp	4296608
End bp	4298188
Gene Length	1581 bp
Protein Length	526 aa
Translation table	11
GC content	75%
IMG OID	641564489
Product	integral membrane sensor signal transduction histidine kinase
Protein accession	YP_001685591
Protein GI	167647928
COG category	[T] Signal transduction mechanisms
COG ID	[COG0642] Signal transduction histidine kinase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	0.179224
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATCGAGC GGTCGCGGGC CTGGGCCAGG ACCTGGTGGC CGGCTCTGCG GCTGCGCACC 
ATCCTGCTGA GCGTGCTGCT GTTCGCCGCC GCCATGCCGG CCATCGGGGC GGTGTTCCTG 
CGCACCTACG AGAACACCCT GGTGCGCCAG ACCGAGGCCG AGCTGGCCAG CCAGGGCGCG 
GCCCTGGCGG CGACGGCCGG CGCCCTGTGG CCCGGAGCCA TCCGCGACAC CACCCCGGCC 
GATCCCGACG CCCGCGACGA CCCCGGCTAC TACCGGCCCG AGGCCACCAG CATCGACCTG 
CGCGACTCGC CGGTGCTGCC CGAGCGTCCG GCCGCGCCGC CCGGCCCGCC CGCCGATCCC 
CAGGCTGAGG CGGCGGCCGA GGTGCTGGAG CCGATCCTCG ACCGGACCAG CCGCAGCACC 
CTGGCCTCGA TCCTCATCGT CGACCGTCAC GGCGTGGTGG TGCGCGGCCT GGGGCAGGGC 
GGGAGTCTCG CGGCCCTGCC GGAGATCCAG GCGGCGCTGA AGGGCCGGTC GCGCACGGTC 
CTGCGCCGCA ATGGCGGCTA TCATCCGCGC TACCGGTTCG AGTGGCTCAG TCGCGCCTCG 
GCCGTGCGCC TGCACCATGC CCGGCCGATC ATCGTCAACG GCAAGGTGCA GGGGGCGCTG 
CTGCTGTCGC GCTCGCCCCG GGCGCTATTC CGAGGCGTCT ACCAGGACCG GGGCAAGATC 
GCGATCGGTG CGGGGGCGAC GATCCTGCTG CTGGTGCTGC TGTCGGGCCT GGTGTCGCGC 
GGCGTGACCC GGCCGATCGA GGCCCTGAGC GCGGCGACCC GCGGCGTGGC CAGCGGCCAG 
GGGACCGTGC CGGAGACCCC CGTCACCGCC GCCGTCGAGA TCCGCGACCT CTACCAGGAC 
TTCCGGGTGA TGGCCGACGC CATCGCCGTG CGCTCGCGCT ACCTGCGCGA CTTCGCCGCC 
GCCGTCAGCC ACGAGTTCAA GACCCCGCTG GCCGGGATCA CCGGGGCGGT CGAGCTGCTG 
GACGACCATT TCGACACCAT GACCCCGGAC GAGCGCCGGC GGTTCCTGGG CAACATCTCG 
GCCGACAGCG CCCGGCTCTC GCACCTGGTG GGCCGGCTGA TGGACCTGGC GCGGGCCGAC 
ATGGCCATGC CGCAGGCGGG GGTGACGTCC GAGCTGGCCG CCGCCGCGCG GCGGGTGGCC 
GACGCGCAGG GGCGCGACAT CGCCGTGGTG CTGGACCTGC CGGCTGGCCT GCCGCGGGTG 
GCCGCGCCCG AGGCGACGGT GGAGACGGTG CTGACGACGC TGGTGGAGAA CAGCCGGCAG 
GCGGGCGCGC GGACGGTTCG GATCGTCGCG CGGGTCGTGG GCGAGGAGGT GGTGCTGCGG 
GTCAGCGACG ACGGCCCCGG CGTGCCGCCG GCTGACCGCG ACCGCCTGTT CGAGCCGTTC 
TTCACCAGCC GGCGGGAGAC GGGCGGCACG GGGCTCGGGC TGTCGATCGC GCGGTCGCTG 
CTGGCGGCGA GTTCCGGGCG GGTGGGGTTG GTCGAGGGCG AGGCGGGGGC GGTGTTCGAG 
GTGGGGTTGT TGTGGGGGTA G

Protein sequence

MIERSRAWAR TWWPALRLRT ILLSVLLFAA AMPAIGAVFL RTYENTLVRQ TEAELASQGA 
ALAATAGALW PGAIRDTTPA DPDARDDPGY YRPEATSIDL RDSPVLPERP AAPPGPPADP 
QAEAAAEVLE PILDRTSRST LASILIVDRH GVVVRGLGQG GSLAALPEIQ AALKGRSRTV 
LRRNGGYHPR YRFEWLSRAS AVRLHHARPI IVNGKVQGAL LLSRSPRALF RGVYQDRGKI 
AIGAGATILL LVLLSGLVSR GVTRPIEALS AATRGVASGQ GTVPETPVTA AVEIRDLYQD 
FRVMADAIAV RSRYLRDFAA AVSHEFKTPL AGITGAVELL DDHFDTMTPD ERRRFLGNIS 
ADSARLSHLV GRLMDLARAD MAMPQAGVTS ELAAAARRVA DAQGRDIAVV LDLPAGLPRV 
AAPEATVETV LTTLVENSRQ AGARTVRIVA RVVGEEVVLR VSDDGPGVPP ADRDRLFEPF 
FTSRRETGGT GLGLSIARSL LAASSGRVGL VEGEAGAVFE VGLLWG