Gene Caul_5142 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_5142
Symbol
ID	5897376
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010335
Strand	+
Start bp	61807
End bp	63606
Gene Length	1800 bp
Protein Length	599 aa
Translation table	11
GC content	68%
IMG OID	641555245
Product	methyl-accepting chemotaxis sensory transducer
Protein accession	YP_001676576
Protein GI	167621791
COG category	[N] Cell motility [T] Signal transduction mechanisms
COG ID	[COG0840] Methyl-accepting chemotaxis protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.367406
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.838811
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCCCTGG TAGATCTCAA GGTCTCCAAG AAGATCCTGT CGGCGTTCGC CGCGCTGATC 
GCCCTGTCGG CGGTCGGTGA TGCGATCGTC CTGGCTCAAC TGAGGGCGAT CGACCGCTCG 
GCGCGGCTCA ACGACCAGGC TTTTGACCTG TCCAGCGACG TGCGGACGAT CAAGAGCGGG 
TTGGTCGAGC AACAGAACGC CATTCGCGGC TACGTGATGT CGGGCAACGC GACGTTCCTG 
GACACCTACC GCCAACAGGC GGCCGCCACC CAGACCGCCC TGGATCATTT TGCGTCGAAC 
GCCCAAAGCC CTGGCCAGCG CGAGCAGGCC GAGGTCCTGA AGGGGAAGAT CGACGCCTGG 
CGGGTTCAAT ACGGCGATCG GCCTCTGGCG CTGAGCGATG ACGCCGCCAC TCACGATCAG 
GCCATGGCGA TCATGAGCAC CAAGACCTTG GGTGAGTTGC GCACCGCGAT CGATGCGTTG 
GAGACCGAGC AAGCCCGGGT CCAGGACGCT CGCTTCGTCC ACGAGACCCA AGCCATCCTC 
ATCGGGCAGG TCGCTCTGGC GCTCGGGGCG GTGCTGGCCA TGGCCGCTTC GCTGAGCATG 
GCCCGGCTGC TGGGGCGTTT GGTCGCCGCG CCGATCGTGC GCATGACGCA GGCGATGCGC 
CGACTGGCTC AAGGCGACCT CACCATCGAG GTGCCAGATG GCACTCGCGG CGACGAACTG 
GGCGAGATGG CCGCCGCCGT CGAGCACTTC AAGGCCGCCG CCATCGAGAA GCTGCGCCTT 
GAAGGCGAAA GCCGCGAGGT GGAAGCTGCG CAGATCGCCG CGGCCAAGGC CGAGGCCACG 
CGCCAGCAGG CCTTCGTCGT CGACGCCTTG GCGCAGGGGC TGGAAAAGCT GGCCGCTGGC 
GAGCTGACCT GGCGGGTCAA CGAGCCCTTC CCCCTCGAAT ACGAGAAGCT GCGCGGCGAC 
TTCAACGCCG CCATGGGCCG ACTGCAGGAG ACCATGGGCG TCATCGCCCG GGCCGCCGAC 
GGCATTCGCG CCGAGACCGG AGAGATCAGT CAGGCGGCCG ACGATCTGTC GGCCCGCACC 
GAGCGCCAGG CCGCGAGCCT GGAGCAAACC GCCGCGGCGC TGGATCAGGT CACCGCCACC 
GTGCGACGCA CGGCCGACTG GGCCAGTCAG GCCCTCGGCG TGGCCAAGTC GGCCCGCGGC 
GAGGCCCAGT CGTCTGGGGG CGTGGTGCGT GACACGGTCG GCGCCATGGG CCGCATCGAA 
CGATCGTCCC AGCAGATTGG CCAGATCACC GGTCTAATCG ACGAGATCGC CTTCCAAACC 
AACCTTTTGG CCCTCAACGC CGGAGTAGAG GCCGCCCGGG CCGGAGACGC GGGTCGCGGC 
TTCGCCGTCG TCGCCCAGGA AGTGCGGGCC CTGGCCCAGC GCTCGGCCGA GGCCGCCAAG 
GAGATCAAGG CCCTGATCGC CGCCTCCAGC GACCAGGTCG CCGCCGGCGC CAACTTGGTG 
GGTCAGACCG GGGCGGCTCT TGAACGCATC GTCCAAAGAG TGGGTGAACT GGACGGGGTG 
ATCGGCGACA TCGCCGCCTC GGCCCAGGAG CAGGCGCTGG GCCTTCAGCA GGTCAACACG 
GCCGTCAACC AGATGGATCA GATCACCCAG CAGAACGCCG CCATGGTGGA GCAGTCGACC 
GCCGCCAGCC ATGGCGTGGC GCGCGAAGCC GAGGGGCTGA GCCGTCTGAT GGGCGGCTTC 
CAACTCGATG GCGAGAGCAA ATCCCGCGTC CGGCCGCGCC TGCGCGCGAT CGCCGGATGA

Protein sequence

MALVDLKVSK KILSAFAALI ALSAVGDAIV LAQLRAIDRS ARLNDQAFDL SSDVRTIKSG 
LVEQQNAIRG YVMSGNATFL DTYRQQAAAT QTALDHFASN AQSPGQREQA EVLKGKIDAW 
RVQYGDRPLA LSDDAATHDQ AMAIMSTKTL GELRTAIDAL ETEQARVQDA RFVHETQAIL 
IGQVALALGA VLAMAASLSM ARLLGRLVAA PIVRMTQAMR RLAQGDLTIE VPDGTRGDEL 
GEMAAAVEHF KAAAIEKLRL EGESREVEAA QIAAAKAEAT RQQAFVVDAL AQGLEKLAAG 
ELTWRVNEPF PLEYEKLRGD FNAAMGRLQE TMGVIARAAD GIRAETGEIS QAADDLSART 
ERQAASLEQT AAALDQVTAT VRRTADWASQ ALGVAKSARG EAQSSGGVVR DTVGAMGRIE 
RSSQQIGQIT GLIDEIAFQT NLLALNAGVE AARAGDAGRG FAVVAQEVRA LAQRSAEAAK 
EIKALIAASS DQVAAGANLV GQTGAALERI VQRVGELDGV IGDIAASAQE QALGLQQVNT 
AVNQMDQITQ QNAAMVEQST AASHGVAREA EGLSRLMGGF QLDGESKSRV RPRLRAIAG