Gene Caul_3297 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_3297
Symbol
ID	5900752
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	-
Start bp	3569529
End bp	3570611
Gene Length	1083 bp
Protein Length	360 aa
Translation table	11
GC content	69%
IMG OID	641563803
Product	hypothetical protein
Protein accession	YP_001684922
Protein GI	167647259
COG category	[T] Signal transduction mechanisms
COG ID	[COG3920] Signal transduction histidine kinase
TIGRFAM ID	[TIGR00229] PAS domain S-box

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	0.747205
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.456251
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCGACG CGGTTCAGAC GGCGACAACC CCCCATGGCG ACCCACCCGC CGCGTCCACG 
GCGCGGGGGC GCGCCGATCG CAAGGAGCTG GCGTCCTTCG CGGTCGAGCG CACGCGCATG 
CCGATGGTCA TCGCCGACGC GCGGCACGGG GACCATCCCA TCGTCCTGGC CAACCAGGCC 
TTCCTGGATC TGACGGGCTA TGGCGCGGAG GAAGTGGTCG GACGCAATTG CCGGTTTCTC 
CAAGGGGCGG GAACCTCGGA CGCGGCCATA GCCAAGATCC GCGCTGCGGT GGCGGCGGGC 
CAGGAGTGCG ACGTCGAAAT CCTCAACTAT CGAAAGGACG GATCAGACTT CTGGAACCAG 
CTGCATCTGA GCCCTGTCCA CGACGAGGCC GGTCAGCTTC TCTACATCTT CGCCTCCCAG 
CGCGATGTCA GCGACTTCCG CAAGGTCCGG GACCTCGAGG CCGCAGAGCG CCGTCTGCTG 
AGGGAGGTCG ACCATCGCGC GATGAACGCC TTGGCCATCG TCGAAGGCAT CGTCCGACTC 
AGCTGCGCCG ACGACCCCTC ACAGTACGCC GCCGCCATCC AGCGCCGGGT GCAGGCCCTG 
GCCAGCGCCC ATGCCCTGCT TGGCCGCCAG GCTTGGCGCG ATGTTCAGCT TGAGGAGTTG 
CTGCGCACAC AGGTCGAGGG CTACGCGGGC AGGCGCATCG CGTTCGAGGG TCCGCCCATC 
GAAATCGGCG CCGCCCTGGT TCAGCCCCTG GCGCTCGTCC TGCACGAGAT GGCGGCCAAT 
GCGAGCCGTC ACGGGGCGCT GTCGGCGCCG GACGGCGAGA TCCGCCTGGG ATGGTCGCGA 
GGTCCTGGCG AAGGCCTTGT TCTGACCTGG ACGGAGATCG GCGGCCCCCC GCCCGCCGCG 
ATCCGCCCGC GCGGCTTTGG GGCGACGATG ATCTCGGCGA TCGTCGAACG GCAACTTGGG 
GGCCAGGCGT TGCTGGCGTG GCGACCCGAA GGCCTGGCCG CGCGTTTTGT GTTGCCGCGC 
CGTGATCGCA TTGAGAACTT CCGGCTGTCG GCGGCCACCG AGGACGCCGC GTCTCAAGCC 
TGA

Protein sequence

MSDAVQTATT PHGDPPAAST ARGRADRKEL ASFAVERTRM PMVIADARHG DHPIVLANQA 
FLDLTGYGAE EVVGRNCRFL QGAGTSDAAI AKIRAAVAAG QECDVEILNY RKDGSDFWNQ 
LHLSPVHDEA GQLLYIFASQ RDVSDFRKVR DLEAAERRLL REVDHRAMNA LAIVEGIVRL 
SCADDPSQYA AAIQRRVQAL ASAHALLGRQ AWRDVQLEEL LRTQVEGYAG RRIAFEGPPI 
EIGAALVQPL ALVLHEMAAN ASRHGALSAP DGEIRLGWSR GPGEGLVLTW TEIGGPPPAA 
IRPRGFGATM ISAIVERQLG GQALLAWRPE GLAARFVLPR RDRIENFRLS AATEDAASQA