Gene Caul_1387 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_1387
Symbol
ID	5898842
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	-
Start bp	1473499
End bp	1475346
Gene Length	1848 bp
Protein Length	615 aa
Translation table	11
GC content	67%
IMG OID	641561874
Product	methyl-accepting chemotaxis sensory transducer
Protein accession	YP_001683015
Protein GI	167645352
COG category	[N] Cell motility [T] Signal transduction mechanisms
COG ID	[COG0840] Methyl-accepting chemotaxis protein [COG4564] Signal transduction histidine kinase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	30
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCATGG CGAAATTCCG CAATCTATCG ATCATGGCGC GCCTGCGCCT GGTGGTGCTG 
TTCGCCGGAA TCGGTCTGGC CGTGGCGATC GGCGTGGGCC TGCTGAACCT CTCGGCCGCC 
ATGCACGAGG ATATCTCGCT CAAGACCCGC AGCCAGGTGG AGACGGCGGT GTCCGTCGCC 
CAGCACTATG TCGACGAGGC CAAGGCCGGA CGGATGAGCG AGGCCGACGC CAAGATCGCG 
GCGATCGGCG CGCTGAAGGC GATGCGCTAT GGCGGCAAGG AATATTTCTG GATCACCGAT 
CTCGACACGC GGATGGTGAT GCACCCCAAC AAGCCGGCGT TGGATGGCGC CGACGTGTCC 
AAGGAACTCG ACCCGACGGG CAAGGCGCTG TTTTCCGAGA TGACCAAGGT CGCCACGTCT 
CAAGGCGCCG GCTTCGTCGA CTACATGTGG CCCAAGCCCG GTCACGACAA ACCGCAGCCC 
AAGATTTCGT ACGTCGCGCT GATGCCCGCC TGGGGGTGGG TGATCGGAAC GGGGGTGTAT 
GTCGATGACA TCGACGACGC GATCGGGATG GCCGCCCTGA AACTGGCCGG GATCGGCCTG 
GCGCTGCTGC TGGTCGTCGG CCTGGGCGCG ACCCTGCTGG GCGTGACCAT CACCCGTCCG 
ATCATGACCC TGACCCAGCG CATGAGCGGG CTGGCCAAGG GCGACAAGGA CAGTCAGGTC 
CCCTTCACCG ATCTGGCCAA TGAAACCGGC GAGATGGCCC GCGCGCTGGC GATCTTCCGT 
GACGCGGCGC TTGATCGCGA GCGCCTGGAA GTCGAAGCGG AGGCCATGCG TGGCGAAGCC 
GCGGCCGATC GTCAACTGCG GGAAGCCGCC GATCGCGCGG CGGCGGAAGT TCAACAGCGG 
GTCGTCACCG ATGTCACCGC CGTGGCGGGG CGGCTGGCCG CCGGCGACCT GACCGTGCGG 
CTGAGCGATG ACTTCCCAAG CGGCTACGCC GAACTGCGTG AAAATCTGAA CGCCGCGCTT 
GTGCAACTGG CGTCCGCCAT GAAGGCCGTG CGCGACAACG CCCACGGCAT CCAGCATGGC 
GCCGACGACA TCGCCTCGGC CTCCGACAAT CTGTCGCGCC GGACCGAGCA GCAGGCCGCC 
ACCCTCGAAG AGACCACAGC GGCGCTGGGC GAACTGACCA GCACCGTGCG GCGCTCGGCC 
GAGGACGCCA GCCAGGCCCG CGCCGCGGTC GCCGTGGCTC AGGAGCAGGC CCAGTACAGC 
GGGACCGTCG CCGACCAGGC GGTGGCCGCC ATGGGCGAAA TCGAGGGATC GTCGCAACAG 
ATCCAGCAGA TCATCGGCGT GATCGACGAG ATCGCCTTCC AGACCAATCT CCTGGCTCTG 
AACGCCGGCG TCGAAGCCGC GCGAGCCGGC GACTCCGGCC GGGGCTTCGC GGTCGTCGCC 
CAGGAGGTTC GCGCCCTGGC CCAACGGTCG GCCGAAGCGG CCAAGGAGAT CAAAAGCCTG 
ATCGGCGCGT CTTCCCGGCA GATCGGCGAC GGCGTCACCC TGGTGCGGGA CATGGGCGGC 
GCCCTGCAGG ACATCGTGGG CAAGGTGAAC GAAATCGACG TGCTGATGCG CGGCATCGCC 
GGCCTCGCCG CCGACCAGTC CGAGGGCCTG AGCCAGATCA ATATCGCCAT GCTGCAGATC 
GACCAGAACA CGCAGCAGAA CGCGGCCATG GTCGAGGAGG CGACCGCGGC GGTGCACTCG 
CTGAAAAACG AGACCAATGA ACTGGCGGAT CTGGTCGGCC GCTTCGAACT TGATGAGGCG 
AGCCCCCACG TCGTCGCCGC ATCCGACCGT CGCCGATTGC GCGCCTAG

Protein sequence

MSMAKFRNLS IMARLRLVVL FAGIGLAVAI GVGLLNLSAA MHEDISLKTR SQVETAVSVA 
QHYVDEAKAG RMSEADAKIA AIGALKAMRY GGKEYFWITD LDTRMVMHPN KPALDGADVS 
KELDPTGKAL FSEMTKVATS QGAGFVDYMW PKPGHDKPQP KISYVALMPA WGWVIGTGVY 
VDDIDDAIGM AALKLAGIGL ALLLVVGLGA TLLGVTITRP IMTLTQRMSG LAKGDKDSQV 
PFTDLANETG EMARALAIFR DAALDRERLE VEAEAMRGEA AADRQLREAA DRAAAEVQQR 
VVTDVTAVAG RLAAGDLTVR LSDDFPSGYA ELRENLNAAL VQLASAMKAV RDNAHGIQHG 
ADDIASASDN LSRRTEQQAA TLEETTAALG ELTSTVRRSA EDASQARAAV AVAQEQAQYS 
GTVADQAVAA MGEIEGSSQQ IQQIIGVIDE IAFQTNLLAL NAGVEAARAG DSGRGFAVVA 
QEVRALAQRS AEAAKEIKSL IGASSRQIGD GVTLVRDMGG ALQDIVGKVN EIDVLMRGIA 
GLAADQSEGL SQINIAMLQI DQNTQQNAAM VEEATAAVHS LKNETNELAD LVGRFELDEA 
SPHVVAASDR RRLRA