Gene GM21_3345 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GM21_3345
Symbol
ID	8138712
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sp. M21
Kingdom	Bacteria
Replicon accession	NC_012918
Strand	-
Start bp	3870951
End bp	3872579
Gene Length	1629 bp
Protein Length	542 aa
Translation table	11
GC content	62%
IMG OID	644870963
Product	methyl-accepting chemotaxis sensory transducer
Protein accession	YP_003023128
Protein GI	253701939
COG category	[N] Cell motility [T] Signal transduction mechanisms
COG ID	[COG0840] Methyl-accepting chemotaxis protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	59
Fosmid unclonability p-value	0.0226154
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGTATCT TGCAGAACAT GAGACTGGCT CAGAAATTCG GTGTCGTCGG AGGTGTCAGC 
GCGATCCTGC TCTGTCTTTC CTTGGCCGCG TCGGTGATTG GTATCAAGGA TCTATCGGCG 
GGATTCTCAA ACTTCGTGGA AAGGGACCAG GCTGTCTCCC TGGCGTTGAA GGACATGTAC 
GCCCAAGGAT TGCAGTCGGA GCAGGCTACC AGGAACATCC TGCTGAACCC TGCTGACGAA 
AAGGCGGCCA AGAACTACGC CCAGGCCATG GAGGATTTTG ACAAGGCATA CGGCGTGGTG 
GTTGCCAAGA GCGGCGGCTT GCCGGAGGTG AAGGGGCAGG TCGAGCAGGT GATGGCTGTG 
TGGAAGGAGG CCGCCGCGTT GCGCCTGCAG GTACAGAGCC TGGCCAAGGA GGGGAAGAAG 
GACGAGGCGC TTACCCTGCT GGTGAAGGAA GAGACACCGA AGTGGCGCGA GGTGAAGGAG 
AAGTTGTTCA AACTGAGCGG CGAGAGGCTG AAGCAGATGG AGCAGACCAA AACCACGGTG 
GTTGACCTCT CCAGCAAGGC GCTCACCATT TCGCTGTCGC TCGGCGTGTT CGCCATCCTG 
AGCACCATGC TCCTGCTGGG TCTGGTTGCT GCAGGGGTGA CCAGGAGGGT CAGGACGATG 
AGCGACCACA TGGACGACAT CGCAAGAGGT GAAGGAGACC TCACCGTTCG ACTGGATGTG 
GCATCGCGGG ATGAACTGGG GAACCTCGGG AATTCGTTCA ACCTCTTCCT TGCCAAGTTG 
CACGACCTTA TCGCCACTGT CGCGGAGACC ACCAAGCAGG TCTCGTCGGC CGCAGCCGAG 
CTTGACGCTA CTGCCGGACG GATGGCGGTC GGCACCGAGG AGGTCGCATC CCAAACCGAG 
ACCGTGGCGG CGGCAGGGGA GGAGATGACG GCGACCTCCA CCAGCATCGC TCAAAACTGC 
ATGGCTGCGG CCGAAGGGGC GAAGCGCGCC GGCGAGGCCG CGGTAGCGGG CGCGGCGGTG 
GTGCAGGAGA CGGTGCACGG GATGGAAAGG ATCGCTGGAA GGGTGAGGGA ATCGGCCCGG 
ACTGTTGAGA GTCTCGGATC CAGATCCGAC CAGATCGGAG AGATCATAGG CACTATCGAG 
GACATAGCGG ACCAGACCAA CCTTCTCGCC CTAAACGCGG CGATCGAGGC CGCCCGCGCG 
GGAGAGCAGG GACGCGGCTT CGCGGTGGTG GCGGATGAGG TGCGCGCCCT GGCTGAAAGG 
ACCACCAAGG CCACAGGCGA GATCGGCAAC ATGATCAAGT CGATCCAAAG CGAAACCCGG 
AGCGCGGTCG GCGCGATGGA GGGGGGCGTA AAGGAAGTCG AGAAAGGAAC CTCGGAAGCC 
GCCAGATCGG GAGCGGCGCT TCAGGACATC ATCGCGCAGA TAGACAGCGT GACTCAGCAG 
GTGAATCAGA TAGCCGTTGC TGCCGAGGAA CAGACCGCAA CCACCAGTGA GATCAGCAGC 
AATATCCAGC AAATAACCGG GGTCGTGCAT GAAACCGCCG CCGGGGCCCA ACAGTCGGCG 
ACGGCGGCGG GGCGGCTTTC GGGTCTGGCG GAGAGGCTGC GGCATGTGGT TGGGCAGTTC 
AAGTTGTAG

Protein sequence

MSILQNMRLA QKFGVVGGVS AILLCLSLAA SVIGIKDLSA GFSNFVERDQ AVSLALKDMY 
AQGLQSEQAT RNILLNPADE KAAKNYAQAM EDFDKAYGVV VAKSGGLPEV KGQVEQVMAV 
WKEAAALRLQ VQSLAKEGKK DEALTLLVKE ETPKWREVKE KLFKLSGERL KQMEQTKTTV 
VDLSSKALTI SLSLGVFAIL STMLLLGLVA AGVTRRVRTM SDHMDDIARG EGDLTVRLDV 
ASRDELGNLG NSFNLFLAKL HDLIATVAET TKQVSSAAAE LDATAGRMAV GTEEVASQTE 
TVAAAGEEMT ATSTSIAQNC MAAAEGAKRA GEAAVAGAAV VQETVHGMER IAGRVRESAR 
TVESLGSRSD QIGEIIGTIE DIADQTNLLA LNAAIEAARA GEQGRGFAVV ADEVRALAER 
TTKATGEIGN MIKSIQSETR SAVGAMEGGV KEVEKGTSEA ARSGAALQDI IAQIDSVTQQ 
VNQIAVAAEE QTATTSEISS NIQQITGVVH ETAAGAQQSA TAAGRLSGLA ERLRHVVGQF 
KL