Gene Caul_3214 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_3214
Symbol
ID	5900669
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	+
Start bp	3475594
End bp	3477192
Gene Length	1599 bp
Protein Length	532 aa
Translation table	11
GC content	71%
IMG OID	641563719
Product	methyl-accepting chemotaxis sensory transducer
Protein accession	YP_001684839
Protein GI	167647176
COG category	[N] Cell motility [T] Signal transduction mechanisms
COG ID	[COG0840] Methyl-accepting chemotaxis protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.409706
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATCGAGT TCGACAGTAT CGAGGCCCAG CGCCGCATCG GCGGCCATCT GATCATGGCC 
TGTATCGCCG CGATGATCCT GGTGGTTCCG GCCGCGCGCC TGTTCGCCGG CGGCCCCGTC 
GTCGGCCTGG CCCTGGGTTC GGTGGGGTTC GCGGCCATGG CCTGGGGCGG GTACGCCATC 
TGGCGCGACA GCGTCGCCCA GCGGATCTCG ACCGCCATCA GCCTGGTCGG CCAAGTCACC 
CTGTTCGTGG CCGCCTTCTC GGGCCATGCC TGGCAGGCCG ACGCCCGCAT GGCCTATCTG 
GCCGCCTTGG CCCTGCTGGT CGCCTATGGC GATTGGCGCG TGGTGGCGAC CGGCGCTGTC 
AGCGTCGTGG CGGTTGAGAT CGGCGCCTCC GTCCTGGCCC CCCATTTGCT GATTCCAGGC 
GAGGTCTCAC CGCTGCGGAT CGCTTTCAAC GCCGGCGTGA CCCTGGTCAC CGCATGGTCC 
CTGATCTGGC TGACGGCCGG CGTGTCGCGG CTGTTCGTCA CCGTCACCGC GCGGACCGAC 
AAGGCGCTGG ACGCGGCGCG GGAAGCCGAC GCCGCCAATG TCGCCGCCGA GGCGGCCCGC 
GCCGCCCGCG ACGCCGACAA CGCCGAACAG GCCGCCCAGA AGGCCGCCCT TGAGGCCGAA 
CAGACTCTGG TGGTCGACAC CGTGGCCGAG GGCCTGGCCC ACCTGTCGCG CGGCGACCTG 
ACCTGCCGCC TGACCCAGCC CTTCGCCGCG CGCTACGAGC CGCTGCGCAT CGACTTCAAC 
GGCGCGATGG AGAAACTGCA GGCGGCGATG CGGGAGATCA CCGGCAACGC CTCCAGCATG 
ACCGCCGGCG TGGCCGAGAT GGCCCGCGCC ACCGACGAGC TGGCCGACCG CACCGAACAG 
CAGGCCGCCA GCTTGGTGGA GACCGTGGCG GCCCTCGACC AGATCACCGC CGCCGTCCGC 
TCGACCGCCG ACGGCGCCCA CCAGGCCAAC GCCGCCGCCG CCAGCGCCCG CTCCGAGGTC 
GAACGCTCCG ACCCCGTGGT CACCGAGGCT GTCGAGGCCA TGACCCTGAT CGAAGCCTCT 
TCCGGCAAGA TCGGCCATAT CATCGGGGTG ATCGACGAGA TCGCCTTCCA GACCAATCTT 
CTGGCCTTGA ACGCCGGGGT CGAAGCGGCC CGGGCCGGCG AGGCGGGCCG CGGCTTCGCC 
GTCGTCGCCC AGGAAGTGCG AGCCCTGGCC CAGCGCTCGG CCGACGCGGC CAAGGAGATC 
AAGGGCCTGA TCAACGAGTC GGGCGCCCAG GTCGCGGCCG GTGTCGAACG CGTGGGCCGC 
ACGCGCGAGG CTTTGCAACG GATCGTCAGC GTGGTGGCCC AGATCGATCA ACAGGTCACC 
GCCATCGCCC GCTCGGCCCA GGACCAGGCC CTGGGCCTGG GCGAGGTCAA CACCGCCATG 
GCCGAGATGG ATCGGGTCGT GCAGCGCAAC GCCGCCATGG TCGAGGAAAC CACCGCCGCC 
GCTCACGCGC TGCAGGGCGA AAGCCGCGAA CTTGGGCAAC GGATCGATCT GTTCGATATC 
GGCCAGGCGC AAGCGGCGGG TGACCGCCGG GCGGCTTAG

Protein sequence

MIEFDSIEAQ RRIGGHLIMA CIAAMILVVP AARLFAGGPV VGLALGSVGF AAMAWGGYAI 
WRDSVAQRIS TAISLVGQVT LFVAAFSGHA WQADARMAYL AALALLVAYG DWRVVATGAV 
SVVAVEIGAS VLAPHLLIPG EVSPLRIAFN AGVTLVTAWS LIWLTAGVSR LFVTVTARTD 
KALDAAREAD AANVAAEAAR AARDADNAEQ AAQKAALEAE QTLVVDTVAE GLAHLSRGDL 
TCRLTQPFAA RYEPLRIDFN GAMEKLQAAM REITGNASSM TAGVAEMARA TDELADRTEQ 
QAASLVETVA ALDQITAAVR STADGAHQAN AAAASARSEV ERSDPVVTEA VEAMTLIEAS 
SGKIGHIIGV IDEIAFQTNL LALNAGVEAA RAGEAGRGFA VVAQEVRALA QRSADAAKEI 
KGLINESGAQ VAAGVERVGR TREALQRIVS VVAQIDQQVT AIARSAQDQA LGLGEVNTAM 
AEMDRVVQRN AAMVEETTAA AHALQGESRE LGQRIDLFDI GQAQAAGDRR AA