Gene GM21_3966 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GM21_3966
Symbol
ID	8139340
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sp. M21
Kingdom	Bacteria
Replicon accession	NC_012918
Strand	+
Start bp	4549526
End bp	4551559
Gene Length	2034 bp
Protein Length	677 aa
Translation table	11
GC content	62%
IMG OID	644871582
Product	PAS/PAC sensor hybrid histidine kinase
Protein accession	YP_003023740
Protein GI	253702551
COG category	[T] Signal transduction mechanisms
COG ID	[COG4191] Signal transduction histidine kinase regulating C4-dicarboxylate transport system
TIGRFAM ID	[TIGR00229] PAS domain S-box

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	33
Fosmid unclonability p-value	0.0000000186378
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGAAGAAAG CCTCTGACCC GCCCCAACCC GATCCCCAGG ACGCCCAGGA CGCCCTGGCG 
ACGCTGCGGC AAAAGCTCGC GGGACTCGGG GAATCCTCGA TGCGCAAGAG CTACTATCCC 
GAACTGCAGG AGCGCCTTGA GGAACTGGAG CGGTTCAAGG CCTTGCTGGA TCACAGCAAC 
GAAGCCATCA TCCTGATCGA AGTCTCCACC GGGCGCATCG TCGACCTGAA CGACTCGGCC 
AGCCGCCAGA CCGGCTGGAG CCACGACGAG CTGCTGCAGC AATCCCTCTT CGACCTCTCC 
AACCTTGAGC AAAATCCCGC CGCGCAAGCG CTGATCAGGT CCGCCGACGA CATGGGAGCC 
AGCGGGATGC TGGTCGTCAC CGAGCTCCAC CGCAAAAACG GCGGACGCTT CCCCGCCGAA 
ATCACTTTGA ACCGGATGCA ATTCCGCGAT AATTCCTACG TGCTGGCGGT CGCCCGCGAC 
ATCACACAGA GGAAGGCGAT GGAGGAGGCG CTTAGGGAGA GCGAGGAATT TCTCAAGAAC 
ATCGTTGATC ACATCCCTGC GGTGGTTTTC GCCAAGGAGG TGCAGGGGCT GCGCTTCGTC 
ACCATCAACA AGGCGTGCCA GGAGGTGTTC GGCCTGAGCC GGGCGGAGGT GCTCGGCCGC 
ACCAACTACG ACCTGTTTCC CAAGGAGCAG GCGGACTTCT TCACCAAGGT CGACCGGGAG 
ACCCTCGCCA AGGGCGAGCT GGTGGAGGTC CCGGAGGAAA TCATCAGCAC CCCCAGCGGC 
GACCGCATAC TGCGGGTCAA GAAGATTCCG CTCTTCGACA ACCAGGGAAA GGAGCGTTTC 
CTGTTGGGGA TCGCCGAGGA CATCACCGAA CGGAAGCAAC TGGAAGAAAA GCTGCTGCAA 
TCGCAGAAGA TGGAGGCGAT TGGGCAACTG GCCGGCGGGG TGGCGCACGA CTTCAACAAC 
ATCCTGATGG TGATTCTCGG CTACGGGAGC ATTCTGCTGA ACGAGGGGGC GCTGCCGGCG 
CGGCAAAAGG AGCAGGTGGA GCAGATCATG AACGCGGCGG ACAAGGCGGC GAAGCTCACC 
TCGGACCTCC TCGCCTTCAG CCGAAAGCAG GTGATCAAGC CCGCCACCAT GAACCTGAAC 
GACATCATCC TGCACGTGGA AAAGTTCCTC TCCCGCATCA TCGGCGAGGA CGTCCAACTG 
AAGGCTCGGC TCACCCCGCG CGAACTGCAG GTCGACGTCG ACCGTGGGCA GATAGAGCAG 
GTGCTGATCA ACCTCGCCAC CAACGCCCGG GACGCCATGC CCAAGGGGGG GCTGCTCACC 
ATCGAGACCT CGTCGCTGCA GATCGACGAC GCCTTCGTCC AGGCCAACGG CATCGGCGCC 
CCCGGCCCTT ACGCCGTCAT CTCCATCTCC GACACCGGCG TCGGCATGAA CGAACAGACC 
CGCAGGAGGA TCTTCGAGCC GTTCTTCACC ACCAAGGAGA TGGGGAAGGG CACCGGCCTT 
GGCATGTCCA TCGTCTACGG CATCATCAAG CAGCACAACG GCTTCGTGAA CGTCTACAGC 
GAGCCGAAGA TAGGGACCAC CTTCCGCATC TACCTCCCCT TCAGCGAACA AAGCTCCGAG 
GCGGCCCTGG ACCCCCAAGC CCCCGACAGC GCACCGGGGG GGGCGGAGAC CATACTGGTG 
GTGGAGGACG AGCCGGATCT GCGCCTTCTC TTGCAGAACA TCCTTTCCGG AGCCGGGTAC 
TGCGTCCTCT TGGCAGAAAA CGGGCAGGTG GCGGTCGAGC GGTACGCGGC CGGCGCAGGG 
GGGGAGATAG CGCTGGTGCT GATGGACATG ATCATGCCGG GGATGAGCGG CAAGGAAGCC 
TGCCGCGCCA TCCGCGCCAT CGACCCTGCG GCCAAGGTGC TTTACACCAG CGGCTACACC 
ATGGACATCA TCAAGAGCCG CGATCTGTTG GAGGAAGGGA CCGAACTTCT CATGAAACCG 
GTCCGCCCTC TGGAGCTTTT AAAGAAGGTG CGGGAGATGC TGGATAGGTT GTGA

Protein sequence

MKKASDPPQP DPQDAQDALA TLRQKLAGLG ESSMRKSYYP ELQERLEELE RFKALLDHSN 
EAIILIEVST GRIVDLNDSA SRQTGWSHDE LLQQSLFDLS NLEQNPAAQA LIRSADDMGA 
SGMLVVTELH RKNGGRFPAE ITLNRMQFRD NSYVLAVARD ITQRKAMEEA LRESEEFLKN 
IVDHIPAVVF AKEVQGLRFV TINKACQEVF GLSRAEVLGR TNYDLFPKEQ ADFFTKVDRE 
TLAKGELVEV PEEIISTPSG DRILRVKKIP LFDNQGKERF LLGIAEDITE RKQLEEKLLQ 
SQKMEAIGQL AGGVAHDFNN ILMVILGYGS ILLNEGALPA RQKEQVEQIM NAADKAAKLT 
SDLLAFSRKQ VIKPATMNLN DIILHVEKFL SRIIGEDVQL KARLTPRELQ VDVDRGQIEQ 
VLINLATNAR DAMPKGGLLT IETSSLQIDD AFVQANGIGA PGPYAVISIS DTGVGMNEQT 
RRRIFEPFFT TKEMGKGTGL GMSIVYGIIK QHNGFVNVYS EPKIGTTFRI YLPFSEQSSE 
AALDPQAPDS APGGAETILV VEDEPDLRLL LQNILSGAGY CVLLAENGQV AVERYAAGAG 
GEIALVLMDM IMPGMSGKEA CRAIRAIDPA AKVLYTSGYT MDIIKSRDLL EEGTELLMKP 
VRPLELLKKV REMLDRL