Gene TM1040_1083 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	TM1040_1083
Symbol
ID	4076316
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ruegeria sp. TM1040
Kingdom	Bacteria
Replicon accession	NC_008044
Strand	-
Start bp	1157674
End bp	1159446
Gene Length	1773 bp
Protein Length	590 aa
Translation table	11
GC content	62%
IMG OID	638006387
Product	methyl-accepting chemotaxis sensory transducer
Protein accession	YP_613078
Protein GI	99080924
COG category	[N] Cell motility [T] Signal transduction mechanisms
COG ID	[COG0840] Methyl-accepting chemotaxis protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGAATC TCTCGCTGCG CAAACAAATC TTTGGTTTTG CGGGAATCTT TATCGCGATG 
ATCCTGATCA TCGCCGCGAT TTCGTGGTTT GCAAACCAAC GCCTTGCCGG GGCCACCTAT 
CACTATCGCG CGGTCAGCAC CCAAAGCAAA AGCTTCGACG CCATCAAGGA AGACATCGAA 
CAAGGTATCG GCGATCTCTT GTCCTATACC GTCGGCATGC CCGAGGGGCT GAGCGACCTG 
CGCGCCAATA TCGAAGAGAT CCGTAGCGAG CTTGCCGTCG CAGAGGATAA TTTCAAATCC 
ACCCCCATCA TCGCCGCACG GGACATGCAG GCCTACGACG CGCTGGTCTC GACCGAGCCG 
CTTCTGGATC AGCTTGAGGC AACATTGCAG GAGGTAGAGC GCACCGAAGG CGAGGCGCAG 
CTGCGCGTGG TCTTTGACAA GGTGTTCCCG CTCGCCGGAC AGGTGCGCGA TGTGGTGGAT 
GCGCTTCAGG ACAAACTTGC CGCCACCAGC AAATCCGTCC GCGCAGAGGT CGACTCCCTC 
ATTTTGTTCT GCCAGATCAT ACAGATCGCC ACCAGCGTCG CAGCGGCGCT TGTCGCGGTG 
ACCGTGGCCT TTGTCTTTGG GCGCAAATTG AGCCAACCAG TGTCTGACGC AGCGCAGAGC 
ATCGCGGCGC TGGCAAAGAA GGACTACGTG GCAGAGATTT CCGGCACTCA GCGCGGCGAC 
GAACTCGGTC AGATTGCCCG CAATCTCAAG GATTTGCGCA CTCAGCTCGC CGAGGCTGAC 
GCGCATGACC GCCAGAACGC CGCCGAAAAC GCGCGCCGGG TCGAGCTATT TGGCGTCCTC 
GGTGCCTCCA TGAGCGGTCT CAAGAGCGGC GATCTCGACC AGAACATCGT GGCGCAGGAC 
TGGGAAGACC TCGGCCCCGG TTACGCCACG CTCTGCGAGG ATTTCAACGC GCTCTCCTCC 
TCGCTTTCGG ATCTGGTGGC CCAGCTCAAT CAAAGCTCCA CCGTCGTGGA ACAAAACGCG 
CGCGAAATGG AACGGATGTC GGATCAGATG TCGCAGCGCT CCGAGACCCA GGCCGCCACG 
CTGGAAGAAA GCGCTGCCGC GCTGGAAGAA ATGTCGACCG CCGTGCAATC CAGCGCCGCG 
CAGGCCAAGG CCGCCGACCG CGAAGTTGAG GAAGGCCGCC GCCGCGCCGA ACAGGGCGGC 
GAGGTGATGG CGCAGGCGAG CCGCGCCATG GCCTCGATTG CGGAATATTC CAACCGCATC 
TCCCAGATCA TCACCGCGAT CGACGATATC GCCTTTCAGA CCAGTCTGTT GGCGCTCAAC 
GCGGGCGTCG AGGCCGCGCG GGCCGGGGAA GCCGGCCGTG GCTTTGCGGT GGTGGCCTCC 
GAAGTGCGCG GACTGGCCAT GAAAGCGGCC CATTCTGCAA GTGAAATCAA GCAGTTGGTT 
CAGGAAAGCT CCAGCCAGGT CGAAGAGGGA GAGCAGCTGG TACAGGCCAC CGCCGAAACC 
CTGACCCAGA TCGTCGAGAG CGTCACCAAT GTCTCTGGCA TGGTCTCCGC CATCGCCAGC 
TCCTCCAGCG AGCAGGCTGC CGGCATCCAG GAAATCAACA TCGGCGTGGC GCAGCTCGAC 
AAGGCCACGC AGGAAAACGC CGCCATGGTG CAGGAAACCT ATTCCGCCAG CCATGAGATG 
CGCACCCAGG CCTCCCGCCT CACCAACCTG CTAGAAGGCT TTACCGGTGG GCAGGCAAGC 
TCTAGCACCG CAGCTCCCGC CCGCGCGGCC TGA

Protein sequence

MTNLSLRKQI FGFAGIFIAM ILIIAAISWF ANQRLAGATY HYRAVSTQSK SFDAIKEDIE 
QGIGDLLSYT VGMPEGLSDL RANIEEIRSE LAVAEDNFKS TPIIAARDMQ AYDALVSTEP 
LLDQLEATLQ EVERTEGEAQ LRVVFDKVFP LAGQVRDVVD ALQDKLAATS KSVRAEVDSL 
ILFCQIIQIA TSVAAALVAV TVAFVFGRKL SQPVSDAAQS IAALAKKDYV AEISGTQRGD 
ELGQIARNLK DLRTQLAEAD AHDRQNAAEN ARRVELFGVL GASMSGLKSG DLDQNIVAQD 
WEDLGPGYAT LCEDFNALSS SLSDLVAQLN QSSTVVEQNA REMERMSDQM SQRSETQAAT 
LEESAAALEE MSTAVQSSAA QAKAADREVE EGRRRAEQGG EVMAQASRAM ASIAEYSNRI 
SQIITAIDDI AFQTSLLALN AGVEAARAGE AGRGFAVVAS EVRGLAMKAA HSASEIKQLV 
QESSSQVEEG EQLVQATAET LTQIVESVTN VSGMVSAIAS SSSEQAAGIQ EINIGVAQLD 
KATQENAAMV QETYSASHEM RTQASRLTNL LEGFTGGQAS SSTAAPARAA