Gene TM1040_0984 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	TM1040_0984
Symbol
ID	4078146
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ruegeria sp. TM1040
Kingdom	Bacteria
Replicon accession	NC_008044
Strand	+
Start bp	1052015
End bp	1053841
Gene Length	1827 bp
Protein Length	608 aa
Translation table	11
GC content	60%
IMG OID	638006288
Product	methyl-accepting chemotaxis sensory transducer
Protein accession	YP_612979
Protein GI	99080825
COG category	[N] Cell motility [T] Signal transduction mechanisms
COG ID	[COG0840] Methyl-accepting chemotaxis protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.0666136
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	0.983928
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTTCTTAG CATCTTGGTT CCGGAACATG CCCGTGAAGC GTAAGATCCT GCTTCCTGGG 
ATGGCTGGAT TGCTCATGAT GATCTGCGTG ATCACGACTT ACTGGACTCA GCGCCTGTCG 
ACGGCGCTCT ATAGCGGCTT TGAAGAGCAG GTCGCGCTGA CTGAGTCCTA CATCGCGGCG 
CCCCTCGCGA CGGCCGCATG GAACTATGAT GGCGACTTGG CCAATACGAC ACTGGCTTCG 
CTTGCCGAGC GCGAGTCCTT TGTGTTTGCG CGTGTGGTCA GCAGCGGCGA TGTGCTTGCC 
GAAGCCTTCA AGGGAGAGGC GATGGAAGAG GCGTGGATCG CGCAATCTAC CAGTCTGCTT 
GAATCCGATC AGGTGCGGCT GGAGGATGGC GATTTCACCT ACTTCAAGAC GCCCTTGATG 
TTCGAAGGTG AAGAAGCCGG CAATATGGTC TGGGCGCTCG ACACCTCGAT CATTGCCAAC 
CAGATCATGA ATGCCAACAT TATCGCGGCC AGCCTTGGTT TTGCGATTTT CGCAGGCTTT 
TCGGTCGTCT TCTACCTCAT CGCAGTTGCG GTATCGCGCC CGATCGAGAA TGTGGTGACG 
CATATTGACG CGCTGCAGCA CGGTGACACG ACGCGTGAAA TCCCCGAGGC GAACCGCCGT 
GATGAAATTG GCGCATTGGG CAAGGCGCTG GTCGATTTCC GCGACACATC CGCCGAGCAG 
AAGCGCATGG AAGAAGAAAA ACGCAAGCAG GACGCGGTGC AGGAACATGT CGTGACCGTT 
CTCTCCGAGG CGCTTGGCAA GCTGTCCACC GGCGACCTCA CGGTGAGCAT CAAGGACGAT 
TTCCCGGCGG ATTACGAGAA GCTCAGCAAG GATTTCAACG CTCTGGTCAA TCGCCTGTTC 
GATACGGTTT CGGCTGTGGT CGATGCGGCG GACAGCATCC AGAACGGTTC CACCGAGATC 
AGCTCGGCCT CTGACGATCT TGCGCGCCGC ACCGAGAGCC AGGCGGCCAC CCTTGAAGAA 
ACCGCTGCTG CACTGGATGA GCTGACTGCA TCGGTGCGTC AGGCCGCCGA AGGGGCTGGA 
AGCGTGTCCA ACACCATGGA AGAGGCAAAA GCCGAAGCCG TGAACAGCGG CACCATCGTC 
AACAATGCCG TTTCGGCCAT GACCGAGATC GAGCAATCCT CGAATCACAT CTCTCAGATC 
ATCGGCGTGA TTGATGACAT TGCCTTCCAG ACCAACCTTC TGGCGCTGAA CGCGGGTGTC 
GAAGCCGCGC GTGCAGGTGA AGCAGGGCGC GGGTTTGCCG TGGTGGCCTC CGAGGTGCGC 
GCCTTGGCGC AACGCTCCTC CGATGCAGCC ATGGAGATCA AGACCCTCAT CGGCGACAGC 
TCCAAACAGG TGGAACGTGG TGTGGATCTC GTCGGCAAGG CAGGCGATGC GCTTCACAAC 
ATCGTTGAGC GTGTCACCCA GATCTCCGGC CTGATCTCTG ACATTGCACA AGGCGCGAGC 
GAGCAATCCG CAGGTCTTGG CGATATCAAC AGCGGCATGG TGGAACTGGA TCAGGTGACC 
CAGCAGAACG CCGCCATGGT GGAAGAGGCG ACTGCCGCGA GCCATATGCT CAAGGCCAAT 
GCGGTCAACC TCGCGCAGAT GGTTGCTCAT TTCCAGCTCG GCGCCGGTGG GCGCGCGGCT 
TCTGCTGCTC CAGCCCCTGC TGCAAAGGAT GCCGAGACGA TCGCGCCGTC GGCCCATGGC 
GAGGATTGGG ACTATACGCC CGAACCAAGT CAGGTGGCCG TCGCCAGCAG CGGCAACGCG 
GCGGCGAAGA TCTGGGAAGA CTTCTGA

Protein sequence

MFLASWFRNM PVKRKILLPG MAGLLMMICV ITTYWTQRLS TALYSGFEEQ VALTESYIAA 
PLATAAWNYD GDLANTTLAS LAERESFVFA RVVSSGDVLA EAFKGEAMEE AWIAQSTSLL 
ESDQVRLEDG DFTYFKTPLM FEGEEAGNMV WALDTSIIAN QIMNANIIAA SLGFAIFAGF 
SVVFYLIAVA VSRPIENVVT HIDALQHGDT TREIPEANRR DEIGALGKAL VDFRDTSAEQ 
KRMEEEKRKQ DAVQEHVVTV LSEALGKLST GDLTVSIKDD FPADYEKLSK DFNALVNRLF 
DTVSAVVDAA DSIQNGSTEI SSASDDLARR TESQAATLEE TAAALDELTA SVRQAAEGAG 
SVSNTMEEAK AEAVNSGTIV NNAVSAMTEI EQSSNHISQI IGVIDDIAFQ TNLLALNAGV 
EAARAGEAGR GFAVVASEVR ALAQRSSDAA MEIKTLIGDS SKQVERGVDL VGKAGDALHN 
IVERVTQISG LISDIAQGAS EQSAGLGDIN SGMVELDQVT QQNAAMVEEA TAASHMLKAN 
AVNLAQMVAH FQLGAGGRAA SAAPAPAAKD AETIAPSAHG EDWDYTPEPS QVAVASSGNA 
AAKIWEDF