Gene GM21_1105 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GM21_1105
Symbol
ID	8136427
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sp. M21
Kingdom	Bacteria
Replicon accession	NC_012918
Strand	+
Start bp	1294500
End bp	1296191
Gene Length	1692 bp
Protein Length	563 aa
Translation table	11
GC content	61%
IMG OID	644868716
Product	methyl-accepting chemotaxis sensory transducer
Protein accession	YP_003020924
Protein GI	253699735
COG category	[N] Cell motility [T] Signal transduction mechanisms
COG ID	[COG0840] Methyl-accepting chemotaxis protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	111
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAATGGT TCAGCAACCT CAAAGTCGGC ACCAAGCTAA TATCGGCATT CATCGTGGTC 
TCGCTCATCA CCGCCATCGT CGGCTATATC GGCATCCGCA ACATGGGTGC CATCAACGAC 
ATGGCTGATG AAATGTATCA GAAGGAACTG CTTGGGATCT CCTACATCAA GGAGGCCAAC 
ATCAACCTCA TCTACATCTC GCGGGCCGAG AAGAACTTCC TGCTGGCCAC CAGCGCGCAG 
GAGCGGGAGA CGTCCCAGGG CAACATCAAC AAGTACAAGG CGGGATACAA GGAGTGGCTG 
GACAAGGCGA GACCGATGTT CACTTCCGAG AAGGGGAAGG AGATCCTGAA GCGGCTGGAG 
GCCGCGAACG AAGAGTGGTT CGCGGTACAG CAAAAGGTGA TCGACCTGGG CGCGAAGGAG 
GCGCTTAACG ACAGGAAGCA GTCGGTGGAA CTTTCCTTTG GAGAAGCGAG GACCAAGCAG 
ATGGCGGTGG ACGATAACCT CACCGAGCTG GCCAGGTTGA AGGAGGGCAA CGCCAAGGAT 
GCCTCGGACG AGACCACCAG GATCTACAAG TCGAGCCTCA CCATGATGGT CGGCCTGGTC 
GCGGGCGGCG TGCTGATCGG CCTGGCGCTG GGGATATTCA TTGCGCGGAT GATCAGCGTG 
CCGCTGCGGC GTGGCGTAGA ATTCGCCACT TCCGTGGCCG GGGGCGATCT GACCAGGAGT 
ATCAATCTGG ACCAGAAAGA CGAGGTCGGG CAACTCGCGG CGGCGCTGAA CGACATGGTG 
GGAAGGCTGA AGGAAATCGT GGCGGAGGTG AAAAGCGCCT CGGACAACGT CGCCAGCGGC 
AGCCAGCAGC TCTCGTCGGG TGCTGAGGAA ATGTCGCAAG GAGCGACCGA GCAGGCGGCC 
TCGGCCGAAG AGGCCTCCTC CTCCATGGAA GAGATGACTT CCAACATCCG GCAGAACGCG 
GACAACGCCA TGCAGACCGA GAAGATAGCA GTGAAGTCGG CGCAGGACGC GAAGGAAGGG 
GGGCAGGCGG TCCAGGCGAC GGTCAACGCC ATGAAGGAGA TAGCAGGCAA GATCACCATC 
ATCGAGGAGA TCGCGCGCCA GACGAACCTC TTGGCCTTAA ACGCGGCGAT CGAGGCGGCG 
AGGGCCGGCG AGCACGGCAA GGGATTCGCC GTGGTGGCCA GCGAAGTGCG CAAGCTTGCC 
GAGAGAAGCC AGAAGGCGGC AGCCGAGATC AGCGACCTCT CCTCCAGCAG CGTGGACGTC 
GCGGTGAAGG CCGGGGAGCT CTTGGCCAAG ATGGTTCCCG ATATCCAGAA GACCGCTGAG 
CTGGTGCAGG AGATCAGCGC CGCGAGCCGC GAACAGGACA CCGGGGCGGA GCAGATCAAC 
AAGGCGATCC AGCAGCTCGA CCAGGTCATC CAGTCAAACG CAGGCGCCTC GGAGGAGATG 
GCCTCCACCG CCGAAGAGCT CTCCAGCCAG GCGGAGCAAT TGCAGAGCGC TGTAGCCTTC 
TTCAAGATCG GGGATGACCG GTTCGGCAGG GGGGGCAAAG CCGTGGCGGG CTCTCATTCG 
GCAGCAAAAC CGAGGGCTTT GACCCGTTCC AAGGCTGCGC CCGGCGCTGC GCCGCTGAAG 
AAGGCGGCCG GGCACGACCT TGAGCTTTCG GAGAAAAAGG AGCTACACGA CGGGGACTTC 
GAGAAGTACT GA

Protein sequence

MKWFSNLKVG TKLISAFIVV SLITAIVGYI GIRNMGAIND MADEMYQKEL LGISYIKEAN 
INLIYISRAE KNFLLATSAQ ERETSQGNIN KYKAGYKEWL DKARPMFTSE KGKEILKRLE 
AANEEWFAVQ QKVIDLGAKE ALNDRKQSVE LSFGEARTKQ MAVDDNLTEL ARLKEGNAKD 
ASDETTRIYK SSLTMMVGLV AGGVLIGLAL GIFIARMISV PLRRGVEFAT SVAGGDLTRS 
INLDQKDEVG QLAAALNDMV GRLKEIVAEV KSASDNVASG SQQLSSGAEE MSQGATEQAA 
SAEEASSSME EMTSNIRQNA DNAMQTEKIA VKSAQDAKEG GQAVQATVNA MKEIAGKITI 
IEEIARQTNL LALNAAIEAA RAGEHGKGFA VVASEVRKLA ERSQKAAAEI SDLSSSSVDV 
AVKAGELLAK MVPDIQKTAE LVQEISAASR EQDTGAEQIN KAIQQLDQVI QSNAGASEEM 
ASTAEELSSQ AEQLQSAVAF FKIGDDRFGR GGKAVAGSHS AAKPRALTRS KAAPGAAPLK 
KAAGHDLELS EKKELHDGDF EKY