Gene GM21_0538 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GM21_0538
Symbol
ID	8135849
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sp. M21
Kingdom	Bacteria
Replicon accession	NC_012918
Strand	+
Start bp	658575
End bp	660227
Gene Length	1653 bp
Protein Length	550 aa
Translation table	11
GC content	59%
IMG OID	644868154
Product	histidine kinase
Protein accession	YP_003020373
Protein GI	253699184
COG category	[T] Signal transduction mechanisms
COG ID	[COG0642] Signal transduction histidine kinase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	105
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATGCCAG GAAGCCGAAA GGACATTGGC GATCAGAAGC ACCAGCAGTA TTACGCGCTC 
TATAAGGAGC TCATCTTCGC GGAACAGGTC AAGCAGCTCT ACCGTCTGGC TCCGCTGGGG 
ATGGTGGCGA CATTAGTGAA CGCGCTGCTT GTGTTCTTCG TCATGAAGGA CGTCATGCCT 
CGGCGGTTTC TCATCTTCTG GCTGTTCGGG ATCGTCTTGG TCACCCTCCT CAGAGGCTTG 
CTCGGTTTCC AATATGCGAA GCATCAACCT GAACCGGCGC AGGCGCGGCT TTGGGCAAAC 
AGGTTCCTGG TCGGCCTGCT GGCTATAGGC GCTGCGTGGG GAAGCATCGG AGTCTTCTCC 
TTTGCCGAAG CATCCATGGA GCATCAAGTC TTCATCGCCT TCGTCTTGGG CGGGATGGCG 
GCCGGAGCGT CAACGACCTT CGCGACGGTG CGCCATGCCT ACCTCGCATT CAGCATCCCG 
GTCCTCGTGC CGCTGGCCGT ACACTTCGTT CTGATCCAGG ACATCTTCCA TTACCTCATG 
GCTGCGATGA CCACTCTCTT TGGTTTTCTG CTTTGGCGCA TCTCGCTGCA CAATTACTCG 
ATAAACCGCG ACTCGTTGCT GCTCAGCTAC GAGAACAGGG AGATGATCGA GACCCTGAAG 
CAGGCGAAGG AGCGGGTCGA AGGTTTGAAC TCACAGTTAA TGGAGGAGAT TACCGCCAGG 
CTCGAAGCTG AAGCGGCGTT AAGGGGTAAT CAGGAGCAGC TCGAAAATCT GGTGGAGGTC 
CGGACCGCGG ATCTTGTGAG CAGCAACGAG CAGCTGAAAA AAGAGATCGA GGAGAGAAAG 
CAGTACGAAC AGGCGCTGCT ACAGGCCGGT GAACGGCTGG CCGTCGCCCA GCGGCAGTCG 
GAGGCGGCGA ACAGGGCGAA AACCGAGTTT CTCGCCAATA TGAGCCACGA GATGAGGACG 
CCCCTGGCTG GGGCGCTCGG GATGATCAGG CTGGTCCTCG ACATGAATAT TGGTGCGGAG 
GAGCGGCAAC TCCTTGAGAT GGCAAAACGG TCGGCGGACT CCCTGGTTAG GATCATCGCC 
GATCTGCTCG ACTTCTCCCG GCTGGAGGCC GGGGTGATGA CCTTCGAAGA TAAGCCGTTC 
TTATTGAAGG AGGTGGTCAG GTCGGCGGTG GAGGTGGTTT CCCTGGTTGC GGAAGAAAAG 
GGGCTCAGCC TCTCCTGGGC GGTCAACGCC GCAGTTCCCG AGCAATTGAG GGGCGACGAG 
GGAAGGCTTA GGCAGGTGCT GGTGAATCTC TTGGGGAACG CAGTGAAATT CACCGAGCGA 
GGCGGGATAG AGGTCGGCAT CGGAACCTTC GAGCCTCTTG AGGCACAAGG GGAGCAGTAC 
GTCGAGTTTT CCGTGAGGGA CACGGGAGTC GGTATTCCCG CCGATCAGTT GGAGAGGATA 
TTCGACCGCT TTACCCAGGT GGACTCATCG CTTACCAGGA GGCATGGCGG CACCGGCCTG 
GGCCTCGCCC TCACGCGCCA GATCGTCGAG AAGATGGGTG GGAGCATCTG GGCCGAGAGC 
GTTGTAGGCT CGGGAAGCAC GTTCCATTTC ACCGTCCCCA TGGTGTCGAA CGCGGCAGCC 
GGACCTGAGC GCGATTCGGA CCGTCTTTCG TAA

Protein sequence

MMPGSRKDIG DQKHQQYYAL YKELIFAEQV KQLYRLAPLG MVATLVNALL VFFVMKDVMP 
RRFLIFWLFG IVLVTLLRGL LGFQYAKHQP EPAQARLWAN RFLVGLLAIG AAWGSIGVFS 
FAEASMEHQV FIAFVLGGMA AGASTTFATV RHAYLAFSIP VLVPLAVHFV LIQDIFHYLM 
AAMTTLFGFL LWRISLHNYS INRDSLLLSY ENREMIETLK QAKERVEGLN SQLMEEITAR 
LEAEAALRGN QEQLENLVEV RTADLVSSNE QLKKEIEERK QYEQALLQAG ERLAVAQRQS 
EAANRAKTEF LANMSHEMRT PLAGALGMIR LVLDMNIGAE ERQLLEMAKR SADSLVRIIA 
DLLDFSRLEA GVMTFEDKPF LLKEVVRSAV EVVSLVAEEK GLSLSWAVNA AVPEQLRGDE 
GRLRQVLVNL LGNAVKFTER GGIEVGIGTF EPLEAQGEQY VEFSVRDTGV GIPADQLERI 
FDRFTQVDSS LTRRHGGTGL GLALTRQIVE KMGGSIWAES VVGSGSTFHF TVPMVSNAAA 
GPERDSDRLS