Gene GM21_0854 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GM21_0854
Symbol
ID	8136175
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sp. M21
Kingdom	Bacteria
Replicon accession	NC_012918
Strand	+
Start bp	1016790
End bp	1018481
Gene Length	1692 bp
Protein Length	563 aa
Translation table	11
GC content	53%
IMG OID	644868470
Product	methyl-accepting chemotaxis sensory transducer
Protein accession	YP_003020679
Protein GI	253699490
COG category	[N] Cell motility [T] Signal transduction mechanisms
COG ID	[COG0840] Methyl-accepting chemotaxis protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	94
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTTTTTCC GAAAATATCT TTCTTCCCTG CGCAGTACCT ATATCTTCAT GGTCTGCTTC 
GGCCTTCTTA TGGGAGTTGT TTTCCCTTTC TATTCCTGGC TCTTCTTTGG CGGCAAGGCA 
TTCGCGCCGC TGTACGTCTT CGGCTGCATC GCCGCTGGTT TCATCGTCGG CAGTTTTTGC 
TATCAGATCA TAAAGGAAGC ACTGAGGCTC TACGTCGAGC ATCAGTTGCA AACACTTTAT 
AGAATCACCA ACGATGCGTC CGCAAAGGTT GGTCTCGGTC AGGGAGACGA GCTAAAGCAA 
CTGATGGAGT GCAACGAGGC ACTGATGAAC AGGGTGCTGG TAATGGTGGA AAACGTCTCA 
CGCCTAGCTG CCGACATTTC TGACAGACAG GGACGCCTTA CTTCCGACTT CAGCAGGACC 
GTGGATAACA ACGTCCAGCA AGCCGCCAAA GAGAAAGAGA CAATCAGAGC CATCGATGAC 
ATGAACGCCT TCTTCAAGGA CCTGCTTCGT GAAATCAAGG ACATCGCCTC CCGTACAGCT 
GAGCGCGCTT CCATTTCAAC TCAAATGAGC GCAGCCACAG ACGCCATTGC CCTCAGTATC 
CAGGAATATT CCGCATCGGT CATGGAAACT TCCGGTTCGA TAGAAGAAAT GGCGGCAAGC 
ATCAAAGGGA CTTCCACGAA CATAGAGGCG CTCACTGCAT CGACAGAGCA GACCTATAAC 
TCCATCAATG GCATTGGGGA TTCCATCGTC GATATTCGTG ACAATGCCCG TCGCACTTCC 
GACTGCTCGG ACAAGGTGCG TGTCCAGGCA GTTGAAGGCA TGGATGCGAT GGCTGCTACC 
ATTGCGGCGA TGGGTGAGAT TGAGGACCAT AGCGATCGGT CCGTGAATGC GATCAAACGG 
CTCTCTTCTC ATTCGTTGCG GGTGGGCGAG TTCCTCGATG TGATAAAGGA AGTCGTCTCA 
CAGACGAACC TTCTGTCCCT GAACGCATCC ATTATCGCGG CTCAGGCTGG CGACCGTGGC 
AAGGCGTTTG CCGTAGTAGC CGAGGAGGTG CGCGGTCTTG CAAAGAGAAC GTCCGCATCG 
ACCGATGAAA TCGAGGAATT GGTCATCAAC ATTCAGAAGG AGACCGTTGC GGCGGAAACC 
GCGGCGCGAT TGGGCAAGGA AAAAGTAGCC GAAGGTGTCA AGGTATCGGA AAAGGCCGAC 
GCAGCCTTGC ACAGGATAGA GGAAAGCGCG GCTGAGGCTT CGCGAATGGT TCAGCAGATT 
GCCGCAGCTA CCGACGAGCA GGCGTTCGGT AGCAGGTTGA TTACCGAGGA GGCCGAGAAG 
AACCTGTCAC GCGTGAAGCA GTTCAGTCGC GCCATCCAAG AGGAGGAGGC CGGAGCCCAG 
CTCATCGTTC GAAGTCTCGA CCGGATGCGT GACTTGTCCG AGAAGATCAC CATCTCTACC 
GACGAGCAGG CACGCGGCAA CCGGCTCTAT CTGATGAGCG TGCAGGACGA TAATAACAAG 
GTCAAAAGGT TGAAAGAGAC CTGCATGGAA CAAATCGCCA TAGGTGAGAT GCTGCGCAAT 
GATGTAGCAG AGGTCGACCA ACTGATAGAG GGCACCGCTG AAGAAGCCAA GAAGATGCTT 
GGAGAAATAG AGACGATCAG CAACCTGATA AACGACATGC ATCGTGAAAT GGAGAGCTTC 
AGGAAGTTGT AA

Protein sequence

MFFRKYLSSL RSTYIFMVCF GLLMGVVFPF YSWLFFGGKA FAPLYVFGCI AAGFIVGSFC 
YQIIKEALRL YVEHQLQTLY RITNDASAKV GLGQGDELKQ LMECNEALMN RVLVMVENVS 
RLAADISDRQ GRLTSDFSRT VDNNVQQAAK EKETIRAIDD MNAFFKDLLR EIKDIASRTA 
ERASISTQMS AATDAIALSI QEYSASVMET SGSIEEMAAS IKGTSTNIEA LTASTEQTYN 
SINGIGDSIV DIRDNARRTS DCSDKVRVQA VEGMDAMAAT IAAMGEIEDH SDRSVNAIKR 
LSSHSLRVGE FLDVIKEVVS QTNLLSLNAS IIAAQAGDRG KAFAVVAEEV RGLAKRTSAS 
TDEIEELVIN IQKETVAAET AARLGKEKVA EGVKVSEKAD AALHRIEESA AEASRMVQQI 
AAATDEQAFG SRLITEEAEK NLSRVKQFSR AIQEEEAGAQ LIVRSLDRMR DLSEKITIST 
DEQARGNRLY LMSVQDDNNK VKRLKETCME QIAIGEMLRN DVAEVDQLIE GTAEEAKKML 
GEIETISNLI NDMHREMESF RKL