Gene Caul_3960 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_3960
Symbol
ID	5901422
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	-
Start bp	4289104
End bp	4290207
Gene Length	1104 bp
Protein Length	367 aa
Translation table	11
GC content	69%
IMG OID	641564481
Product	methyl-accepting chemotaxis sensory transducer
Protein accession	YP_001685583
Protein GI	167647920
COG category	[N] Cell motility [T] Signal transduction mechanisms
COG ID	[COG0840] Methyl-accepting chemotaxis protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	0.273719
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.409706
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCGGCTG AAGACGCCAG CCTCCGCCCA GAACGTATTC TGGAACTCAG CGAACGCCTC 
AGCGCCGTGG CCGGCGAGAA GATCGGCGAG ATCGCCTACG TCAACCGCTC GGCCAAGATG 
CTGGCGATCA ACGCCCTGAT CGTCGCCGCC CGCGCGGGCG AGGCGGGGCG CGGCTTCGCG 
ATCGTCGCCG AGGAGTTCAA GACCATCTCC ACCCAGATCG ACGTGGTGGC CGCCGCCCTG 
GAGAGCCAGG TGCGCGCCGA CCTCGACGAA CTGACCAAGA TCGGCGGGGC GATCCTGGGC 
CACCTGCGCG GCCAGCGCCT GGCCGACCTG GCCCTGAACG CCATCGAGAT CATCGATCGC 
AACCTCTATG AGCGCACCTG CGACGTGCGC TGGTGGGCCA CCGACAGCGC CGTGGTCGAC 
TGCGTGGCGG CCCCGTCGCG CGAGGCCTCC ACCCATGCCA GCCAGCGCCT GAAGGTGATC 
CTCGACGCCT ACACCGTGTA TCTCGACCTG TGGATCGCCG ATCCGTCGGG GCGGGTGATC 
GCCAGCGGTC GTCCCGACAG GTACCCGGCC GCCAAGAACG CCTCGGTGGC CGAGGCCGAG 
TGGTTCAAGA ACGCCCTGCG CACCAAGTCG GGCGACGACT TCACCGTCTG CGACATCGAA 
CGGGTCAAGG CCCTGAACGA CGCCCCGGTC GCCACCTACG CCACCGCCAT CCGGGCCGGC 
GGCCAGGCCA ATGGCAAGGT GATCGGCGTG CTGGGCGTTC ATTTCGACTG GAAGCCCCAG 
GCCCAGGCCG TGGTCGACGG CGTGCGCCTG ACCGAGGAGG AGCGCGCCCG CTCGCGCGTG 
CTGCTGCTCG ACCAGAACCA CCGGGTGCTG GCCAGCTCCG ACGGCAAGGG CGTTCTGGAG 
GAAACCTTCA AGCTCGACAC CTCGGCCGGC GACATGGGCA GCTACGCCGA GGGCGCGCGC 
ACCGTCGGCT ACGCCCTGAC CCCGGGCTAC GAGACCTATG TCGGCATGGG CTGGTACGGC 
TGCCTCGTTC AGACGGCGGA GGTCGAGACG CCAGCGGCGA CGTTTCGCCC GGCCGTGACG 
CCGGGCAAGC TCAACGCGGC TTAG

Protein sequence

MSAEDASLRP ERILELSERL SAVAGEKIGE IAYVNRSAKM LAINALIVAA RAGEAGRGFA 
IVAEEFKTIS TQIDVVAAAL ESQVRADLDE LTKIGGAILG HLRGQRLADL ALNAIEIIDR 
NLYERTCDVR WWATDSAVVD CVAAPSREAS THASQRLKVI LDAYTVYLDL WIADPSGRVI 
ASGRPDRYPA AKNASVAEAE WFKNALRTKS GDDFTVCDIE RVKALNDAPV ATYATAIRAG 
GQANGKVIGV LGVHFDWKPQ AQAVVDGVRL TEEERARSRV LLLDQNHRVL ASSDGKGVLE 
ETFKLDTSAG DMGSYAEGAR TVGYALTPGY ETYVGMGWYG CLVQTAEVET PAATFRPAVT 
PGKLNAA