Gene GM21_2571 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GM21_2571
Symbol
ID	8137913
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sp. M21
Kingdom	Bacteria
Replicon accession	NC_012918
Strand	-
Start bp	3002030
End bp	3003250
Gene Length	1221 bp
Protein Length	406 aa
Translation table	11
GC content	62%
IMG OID	644870179
Product	response regulator receiver sensor signal transduction histidine kinase
Protein accession	YP_003022369
Protein GI	253701180
COG category	[T] Signal transduction mechanisms
COG ID	[COG4251] Bacteriophytochrome (light-regulated signal transduction histidine kinase)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	66
Fosmid unclonability p-value	0.156881
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAGGTGC TAGTTGTCGA CGATTCCCGC AACGATCGCA AGATCATCCG CTACAACTTC 
GAATGGCACG GCTGCGAGGT CCTGGAGGCC TCCAACGGGA AGCAGGGGCT GGAGCTGGCA 
GCGGCGGAGA AACCCGACCT GATCGTTTCC GACTGCCTGA TGCCGGTCAT GGACGGCTTC 
CAATTCCTTC ACGAAATCAA GAAGTTTCAA GACACAAAAA CCATCCCCTT CATCTTCTAT 
TCAGCCGTCT ATACCGGGAG CCGCGAGGCG GAATTGGCGG CTTCCCTGGG AGCCCGCGCA 
TTCCTGGCGA AACCCATGCG CCCGGAGGAG CTTTGGGATG AGGTGGGGCG GCTGATGGCG 
GCGGAGCCGG CCGGCGAGGC GGTGGAGCGA AAGCCGTGGC CCGAAGAGGA ATTCCTCAAG 
AACTATAGCC AGCTGGTAGC GGGCAAGCTG GAGGAAAAGG TCCGCGAGCT TACCGAAACG 
AACGAAAGCC TCCTCAGGCT GAACAGCGAA TTGGAGCGCA GGGTGGTGGA GCGGACCTCG 
CAACTGGAGG CAGCAAACCG CGAGCTCGAC ATGTTCAGCT ATTCCATCTC CCACGACCTG 
CGCGCCCCTT TGCGGCACCT GGAGGGGTTC AGCCAGGCGC TGATCGACGA ATACGCGACC 
AAGCTGAACC ACACGGGGAG GGAGTACCTG GAGCGGCTCA GGAAGTCCGC CCGACGGCTG 
ACGGACATGA TAGACGCGCT CTTGGAACTG TCGCGGCACA CGAGGGGGAA GCTGGTCAAG 
GAGAGCGTGG ATTTAACCTC CATCGCCAAG GAGGTCGCGG CTCAACTGGC GCGGTCCCAG 
CCGGAGCGTA AGGTATCGAT GGAGGTGGCG GAGGGGATGA TGGTGCGCGG GGACTCGCGG 
TTGTTGAAGG TGGTGCTGGA GCAATTGATC GGCAACGCCT GGAAGTTCTC GCAACCGCGA 
GGGGAGGAGG CGCTGGTAGA GGTCTTTCCC ACCGAGCTTG AAGGGCGACC CGCCTGCGCG 
GTCAGGGACA ACGGGGTCGG CTTCGAGATG GAGTACGCGG ACAAGCTCTT CTCCCCGTTC 
CAGAGGCTGC ACGCGCAGGA CGAGTTCCCC GGCCGCGGGA TCGGGCTCGC CATCGCCAAG 
AGGATAATCA CCCGCCATGG AGGGAAGATG GAGGCGCAGG CCGAACTGGG GAAGGGGGCG 
ACCTTCACCT TCAGCGTCTA G

Protein sequence

MKVLVVDDSR NDRKIIRYNF EWHGCEVLEA SNGKQGLELA AAEKPDLIVS DCLMPVMDGF 
QFLHEIKKFQ DTKTIPFIFY SAVYTGSREA ELAASLGARA FLAKPMRPEE LWDEVGRLMA 
AEPAGEAVER KPWPEEEFLK NYSQLVAGKL EEKVRELTET NESLLRLNSE LERRVVERTS 
QLEAANRELD MFSYSISHDL RAPLRHLEGF SQALIDEYAT KLNHTGREYL ERLRKSARRL 
TDMIDALLEL SRHTRGKLVK ESVDLTSIAK EVAAQLARSQ PERKVSMEVA EGMMVRGDSR 
LLKVVLEQLI GNAWKFSQPR GEEALVEVFP TELEGRPACA VRDNGVGFEM EYADKLFSPF 
QRLHAQDEFP GRGIGLAIAK RIITRHGGKM EAQAELGKGA TFTFSV