Gene Caul_4331 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_4331
Symbol
ID	5901792
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	-
Start bp	4704519
End bp	4706156
Gene Length	1638 bp
Protein Length	545 aa
Translation table	11
GC content	65%
IMG OID	641564849
Product	signal transduction histidine kinase
Protein accession	YP_001685949
Protein GI	167648286
COG category	[T] Signal transduction mechanisms
COG ID	[COG3920] Signal transduction histidine kinase
TIGRFAM ID	[TIGR00229] PAS domain S-box

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.364366
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCGCCTG TGGATTGGCT GTTAAATCCT TCCGGACTAA CGCCTCATGG CTTTTGCCTG 
AGTTGGGCCC CAGGTCTGAT CGCGCTGCAC GTCGGGTCCG ATGTGCTCAT CGGTCTGGCC 
TATTTCTCCA TTCCGCTGGC CATCGCCGCC TTCGTCAAGC AGCGGCCGGA TATCCGTTAC 
GGGTGGGTCG CCTATCTCTT CGTTGGCTTC ATACTGGCCT GCGGCGCGAC GCACCTGATG 
TCGATCTTCA CCCTCTGGGT CCCGGCCTAC GGCGTGGAAG GCCTGATCAA GCTGGTCACG 
GCGATCCTGT CGATCGCCAC CGCGGCCATC CTTTGGCCGT TGATGCCCAA ACTGCTGGCC 
GTGCCGTCGG CGGCGCATCT TGAGCGCCTC AACGCCGAAC TGGCCGACAC TGTGGCCGCG 
CAAGGCCGCA CGGCCGCGCT GTTGCGGGAG AGCGAAGCCC AGGTGCGCTC TTCAAATTTG 
GCGCTGGAGC GGCGGGTCGA GGAGCGCACG GCGCAGCTGC GGGCGACCAA TGTCCAACTG 
ACCGAGGCCT TGGCGGAACG GGCCCTGGCC GAGCGGGCCC TGGCCCGGAG CGAGGAGGCC 
TTTCGCGCCA GTTTCGAGGC CGCCGCCGTG GGCAAGGCCC AGAGCGATCC CCTGTCGGGA 
CGGATTATCC GCGCCAACCG CGCCTTCGCC CAGATGCTGG GCTACGAGCC GGAGGAGATC 
GTCGGCCGGC TGGGCTGGGA GTTCACCTGG CCCGAGGACC GCGACGCGGA GATGGCGGAG 
TATAACCGCG TCGTCGCGGA CGAAATCCCC GCCTATGTGC GGGAGAAGCG CTACGTGCGC 
CGCAACGGCG AACCGTTCTG GGGCCGGGTT TCGGCCAGTA TCGTGCGCAA CCCTGAAACG 
CTGGAACCGG TGCTGACAGT CGCCGTCATC GAGGACATCG ACGAGACCTA CAAGGCGCAG 
AGCGCGTTGC GGGACGCGAC ACAGGAACTG GAGCTTCTGG TCGAGGAGCT GACCTCCACG 
GTGAGCCAGC GCGACCTGCT GCTGCGCGAG GTCTATCACC GCGTGAAGAA CAACCTGCAG 
ATCGTCGACA GTCTGCTGGT CATGCAGGCT CGCAAGCTGT CTGACCCGGA AGCCAAGCAG 
GCCCTTCTGG GGCTGCGCGG CCGGATCTAC GCCCTGGGCC TCGTGCACGG ACAGTTGATG 
GGGTCGAAGG ACCTCAGGAC GTTCGACATC ACGCCGTTCC TGCGGGAGCT GTCTTCCAAC 
ATCGTCGATG GCGTGGCTGG CAATGAGGTC CAGCTGACCG TTCAGGGCGT CCCGATGGAC 
GTGGGCCTGG ACTTCGCCAT CCCGCTGGGG CTGCTGGTCA CCGAACTCGT AACCAATTCG 
CTCAAGCACG CGTTTCCAGC GGGCGTCGGG ACGATCGATG TCGGCCTCGG CCGAACCGAG 
GAAGGGGACG TCATGCTCAC CGTCGCGGAC AACGGCGTGG GCCATGACGG GAGCGAAACG 
CCGGCTCGCG GCGTGAGATC CACGCTTGGC GTCACCATCA TCGAGGGGCT GGTCGCGCAA 
TTGAAGGGGA CGATCATGGT GCGAAAAGAC AATGGAACAC GAACCGAGAT CCGGGTCGCC 
GCGCCGGTGC TGTCATGA

Protein sequence

MSPVDWLLNP SGLTPHGFCL SWAPGLIALH VGSDVLIGLA YFSIPLAIAA FVKQRPDIRY 
GWVAYLFVGF ILACGATHLM SIFTLWVPAY GVEGLIKLVT AILSIATAAI LWPLMPKLLA 
VPSAAHLERL NAELADTVAA QGRTAALLRE SEAQVRSSNL ALERRVEERT AQLRATNVQL 
TEALAERALA ERALARSEEA FRASFEAAAV GKAQSDPLSG RIIRANRAFA QMLGYEPEEI 
VGRLGWEFTW PEDRDAEMAE YNRVVADEIP AYVREKRYVR RNGEPFWGRV SASIVRNPET 
LEPVLTVAVI EDIDETYKAQ SALRDATQEL ELLVEELTST VSQRDLLLRE VYHRVKNNLQ 
IVDSLLVMQA RKLSDPEAKQ ALLGLRGRIY ALGLVHGQLM GSKDLRTFDI TPFLRELSSN 
IVDGVAGNEV QLTVQGVPMD VGLDFAIPLG LLVTELVTNS LKHAFPAGVG TIDVGLGRTE 
EGDVMLTVAD NGVGHDGSET PARGVRSTLG VTIIEGLVAQ LKGTIMVRKD NGTRTEIRVA 
APVLS