Gene Caul_0236 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_0236
Symbol
ID	5897510
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	-
Start bp	258686
End bp	260668
Gene Length	1983 bp
Protein Length	660 aa
Translation table	11
GC content	69%
IMG OID	641560720
Product	methyl-accepting chemotaxis sensory transducer
Protein accession	YP_001681871
Protein GI	167644208
COG category	[N] Cell motility [T] Signal transduction mechanisms
COG ID	[COG0840] Methyl-accepting chemotaxis protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	0.105118
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAATTCG ACGATCTGAA GATCTCCACC AAGGTGGCCC TGCCGGCCGT CATCCTGACC 
GTGGTGGCCC TGTCCATCAC CGGTGTCGGC GCCTGGCAGT CCAAGGTTTC GGAAGCCGCC 
ACCAAGGTGC TCGTCGAACA GCGCGCCCCG GCCGAGCTGG AAGGCTCGCG GTTCAACCGC 
CGGGTCGCGA CCATTGGCTA CGCCGCCTAT CGCACCATCT CCAACGACGC CGCCTCGCCC 
GAGGCCAAGC AGGCCAGCGA CGAGATCGAC CTCGCCTACA AGGAGGGCAA GATCGCCCTC 
GGCAAGATCA AGGCCGCCGA CCCGGCCGCC GCCAAGAAGG TCGCCGACTA TCAGGTCCGC 
CTGGACCGCA TCTATTCCAG CGCCCGGCAG GGCGCGGACC TGGGCCTGCA GAACGCCAAC 
GATGCGGCCA AGATGGTCAT GGGCGTGATC GATCCGGACA TCGCCAGCCT GAGCAAGGAC 
GTCTCGACCT ATACCAACAC CCATAGCGAC CAGACCCGCG CCATGGTGGC CAAGGCCGCC 
AAGGCGGCGT CGGCCGGCAC GCTGATGACC ATCCTGTTTG GCCTGATCGC CTCGGCCTCC 
GCCCTGGTCT TCGCCCTGTG GATCGGTCGT TCGAAGATCT CGGCCCCGCT GGCCGGCCTG 
TCCAAGACCA TGGAAGTCCT GGCCCAGGGC TCGGTGGACG TCGAGGTGGT GGGCGCCCTG 
CGCAAGGACG AGGTCGGCGC CATGGCCCGC TCGGTCCAGG TGTTCAAGGA CAACGCCCTG 
GCCCTGCGCA CCGCCGAGGC CGCCCAGCAG CGCCTGAGCG CCGAAACGGA AACCGAGCGT 
CAACGCAACC AGGAAGCCGC CGAGGCCGCC GCCCGCGAGC AGGCCTTCGT GATGGAGAAC 
ATCGCCACGG GCCTGACCAA GCTGGCCGAG GGCGATCTGA CCTATCGCGT CGACGCCCAG 
TTCCCGCAGG CCTACCAGCG CCTGCAGAGC GACTTCAACG GCGCCATCGC CCAGATGGAA 
GAGGCGATGC GCACCATCGT CCACGCCGCC AGCAGCATCG GCTCGGGCAG CGACGAGATC 
GCTTCGGCCG CCGACGACCT GTCGCGCCGC AGCGAGCAGC AGGCCGCCAG CCTGGAAGAA 
ACCGCCGCCG CCCTCGACGA GATCACCGCC ACGGTGAAGC GCTCGTCGGC CGGCGCCGTC 
GAGGCCTCGC GCGTCGTCAC CTCGACCCGC GCCGATGCCG AACGCTCCAG CGTCGTGGTG 
CGCGGCGCCG TCGAGGCCAT GAACCAGATC GAGAAGTCGT CGCAGTCGAT CAGCCAGATC 
ATCGGCGTCA TCGACGAAAT CGCCTTCCAG ACCAACCTCC TGGCCCTGAA CGCCGGGGTC 
GAGGCGGCTC GGGCCGGCGA TGCTGGCCGC GGCTTCGCGG TCGTGGCCCA GGAAGTGCGG 
GCCCTGGCCC AGCGCTCGGC CGACGCGGCC AAGGAAATCA AGACCCTGAT CTCGACCTCC 
TCGCAGCAGG TCGGCCAGGG CGTGTCGATG GTCGGCCAGA CCGGCGATGC TCTGCAGGCC 
ATCGTCGGCA AGGTCAGCGA GATCGACGCC CTGGTCAGCG AGATCGCCGC CGGCGGGGCC 
GAGCAGGCCA CCGGCCTCAA CGAGGTCAAC GCCGCCGTCA ACCAGATGGA CCAGACCGTC 
CAGCAGAACG CCGCCATGGT CGAGCAATCG ACGGCCGCCA GCCACGCCCT GAAGGGCGAG 
GCCAACAACC TGATGCAAAT GATCGGGCGT TTCCAAGTTA GCGGCGCCAG CGCCGCCGTG 
CGCTCCACCA CTCGCCGCGC CGCGCCGCCG ACCCAGGTGA CCCGTCCGGC TCCGCGCCCG 
ACGCTCGCCC CGGCCACCGC GGCCAACCGT CCCGGCGCCA ACCCGGTTCG CGCCGCCCAG 
GCCAAGCTGG CGGCCTTCGC CGGCTCGGCC CAGCCCAGCA GCGACGACTG GGAAGAATTC 
TAG

Protein sequence

MKFDDLKIST KVALPAVILT VVALSITGVG AWQSKVSEAA TKVLVEQRAP AELEGSRFNR 
RVATIGYAAY RTISNDAASP EAKQASDEID LAYKEGKIAL GKIKAADPAA AKKVADYQVR 
LDRIYSSARQ GADLGLQNAN DAAKMVMGVI DPDIASLSKD VSTYTNTHSD QTRAMVAKAA 
KAASAGTLMT ILFGLIASAS ALVFALWIGR SKISAPLAGL SKTMEVLAQG SVDVEVVGAL 
RKDEVGAMAR SVQVFKDNAL ALRTAEAAQQ RLSAETETER QRNQEAAEAA AREQAFVMEN 
IATGLTKLAE GDLTYRVDAQ FPQAYQRLQS DFNGAIAQME EAMRTIVHAA SSIGSGSDEI 
ASAADDLSRR SEQQAASLEE TAAALDEITA TVKRSSAGAV EASRVVTSTR ADAERSSVVV 
RGAVEAMNQI EKSSQSISQI IGVIDEIAFQ TNLLALNAGV EAARAGDAGR GFAVVAQEVR 
ALAQRSADAA KEIKTLISTS SQQVGQGVSM VGQTGDALQA IVGKVSEIDA LVSEIAAGGA 
EQATGLNEVN AAVNQMDQTV QQNAAMVEQS TAASHALKGE ANNLMQMIGR FQVSGASAAV 
RSTTRRAAPP TQVTRPAPRP TLAPATAANR PGANPVRAAQ AKLAAFAGSA QPSSDDWEEF