Gene GM21_0008 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GM21_0008
Symbol
ID	8135307
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sp. M21
Kingdom	Bacteria
Replicon accession	NC_012918
Strand	+
Start bp	12181
End bp	14448
Gene Length	2268 bp
Protein Length	755 aa
Translation table	11
GC content	62%
IMG OID	644867625
Product	PAS/PAC sensor signal transduction histidine kinase
Protein accession	YP_003019853
Protein GI	253698664
COG category	[T] Signal transduction mechanisms
COG ID	[COG5002] Signal transduction histidine kinase
TIGRFAM ID	[TIGR00229] PAS domain S-box

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	73
Fosmid unclonability p-value	0.865749
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCAACTTC GTTTTGGCAT AAGAACAAAA CTGCTCCTGT CCATACTCGC CATCCTCTTC 
GTATCATATT CAACCCTGTT GTACTCCTCG ATGAAGACCC TCAACGCGTC GCTTCGGACC 
GAGCTGGACC GTAACCTCGC CACCAACATC AAGTACGCAC GCAGCCAGTA CCTGGCTCAA 
GCCGAGATCG CCAAGTTCTC CGTGATGCAG TCGGTGGTTT CGCAGTCGGT GCAGCAGCAC 
CTGCGCGAGC GGGACAGCGC CTGGTTCTCC TCGCGCGTGA AGCACTGGCA TGCCGTGCTC 
CCCTTCGTGG ACCTGGTGGT CGTGGTGGAT CCCGAGGAAC AGGTACTGGC CACCCTGCAA 
GGCCCCCGAA ACGGCGGCCC GATGGAGCTG CCGGTGGTGG TGGAACAGGC CCTGGCCAGC 
AAAAAAGCCA TCTTGTCCAC CGAGCTTCTG AGCGGCGAGT TCATGTGCCG GGCGGGAGTG 
GAAGGATACT GCGAACGCCC CGACAGCGAG ACCCTGGTTG CCACGGTGGC GGTCCCGATC 
ATAGGCGCGG ACGGCGGCGT GCTCGGTTGC GTGGTGACCG GAGACATCAT GAACCACCAC 
CCGAACCTCC CGGCCAAGCT GCAGGAGGTC TCCGGGAACA ACGTGGAGGT GACGCTCACC 
CAGCGCGGGC TTCGGGTCGC CAGCAGCTTG CCGGAGCGGG TGCTGGAATC CTATACCCTC 
TCCCCCGCGG TGCTCGACGT GCTGGAGCGC GGCGAGGTGT ACCGCGGCCG GACCGCCATG 
GGCACCAAGA GCTACGAGAC CATCATCGAC CCCCTTTTGA ACAGCAGGGG GGAGTTCGTC 
GGGTCGCTTT CCGTGGCCAT ATCCACCGAA ACGGTGACCA GCGGCAGGCG GGAAAACCTG 
CAGTACATCC TCGCCTCGGC TTTCCTCGGC ATCATCTGCT CCTTCGGCAT GGCCTACATC 
GCCTCGCGTC ACCTGACGGG GCCGTTGCGG CAGTTGGCGG CGAGCGCGCG CCGCATCGAA 
GAGGGGGATC TCGACCAAAG GGTCGTCGGC CACCAGCGGG ACGAGGTGGG TATGCTGGCC 
TCCTCCTTCA ACAACATGGC GGAATCGCTC AAGGAGCGGG ACAGCATCAT CAACAGGAAG 
ACCGGCGACC TGCAGGAACT CAACGAGCAG CTGGAGAGAA TGGTCGAGCA GCGGACCTCC 
GCCCTCAGCA TGGAGATGGG GAGGTTGGAG GCGGTCTTGA CCAGCCTGGC CGAAGGGGTG 
GTGGTGACCG ACAGGGACAA CCTCGTGGTG CTCTTCAACC CGGCGGCTCA GCAGATCTTC 
GAACTGGTCC CGCATCGCGT GGTCGGGCAG TCCGTCGAGC GCCTGTGCGA GATGACGGGC 
TTTTGCAACG TTCTGGAACA GGTCGGCGAG CAGACGCCGC GGGAGCGCAA CCGCGGCGGG 
AAAAAAGAGA TCACCGTGAA AGGGAAGCGG CTGAACGTGA ACAAGGCCAC CCTCCAGGAC 
GAGGCAGGTG AGTTCGCCGG TATGGTCATG TCGCTGCGCG ACGTCACCAA GGAGGAGCAG 
GTGGACCGGA TGAAGACCGA GTTCATATCC ACCGTCTCCC ATGAGTTGAA GACGCCGCTT 
ACCTCGATCA AGGGGTCGCT GCAACTGCTT TTGACCCGCA GCAAGTGGCT CACGGACACC 
GAGAGGCAGC TTTTGACCGT CTGCTTCCGG AACACGCAGA GGCTGATCCG GCTGATCAGC 
GAGATCCTCG ACATTTCCGG CATCGAATCG GGCGGGATGA TCTTCAACTT CAAGTCGCTT 
TGCATCGGTG AACTCGCGGT GTACGCGGTC GAGGAGATCA AGTCCTACGC CATGGGACGG 
GACATCACCA TCGTCAACAC CGTGGGCGAG CATCTTCCCA TGGTGTTTGG CGACAGCGAC 
CGCCTGATCC AGGTGATGAC CAACCTCCTC TCCAACGCGG TGAAGTTTTC CCCCGAGGGG 
AAGGTGGTCA TGGTCACCGC CGAGCAGGAA GGAAACTACG TTGTGGTTTC GGTGGCCGAC 
CGGGGGCGGG TGATACAGTG GTCCGACCGG GACAAGCTTT TCAAGAAGTT CCAACAGATC 
GAATCGACCG AACGCGGCAA GATCGGCGGC ACCGGGCTGG GGCTCGCCAT CTGCAAGGAG 
ATAGTAGAGC GGCATCACGG CAGGATCTTC TACACCGCCG CCAAGGAATA CGGCAATACC 
TTCAGCTTCA CGGTGCCGAT AATAGGGGAG ACAGATGCAA AAGGATAA

Protein sequence

MQLRFGIRTK LLLSILAILF VSYSTLLYSS MKTLNASLRT ELDRNLATNI KYARSQYLAQ 
AEIAKFSVMQ SVVSQSVQQH LRERDSAWFS SRVKHWHAVL PFVDLVVVVD PEEQVLATLQ 
GPRNGGPMEL PVVVEQALAS KKAILSTELL SGEFMCRAGV EGYCERPDSE TLVATVAVPI 
IGADGGVLGC VVTGDIMNHH PNLPAKLQEV SGNNVEVTLT QRGLRVASSL PERVLESYTL 
SPAVLDVLER GEVYRGRTAM GTKSYETIID PLLNSRGEFV GSLSVAISTE TVTSGRRENL 
QYILASAFLG IICSFGMAYI ASRHLTGPLR QLAASARRIE EGDLDQRVVG HQRDEVGMLA 
SSFNNMAESL KERDSIINRK TGDLQELNEQ LERMVEQRTS ALSMEMGRLE AVLTSLAEGV 
VVTDRDNLVV LFNPAAQQIF ELVPHRVVGQ SVERLCEMTG FCNVLEQVGE QTPRERNRGG 
KKEITVKGKR LNVNKATLQD EAGEFAGMVM SLRDVTKEEQ VDRMKTEFIS TVSHELKTPL 
TSIKGSLQLL LTRSKWLTDT ERQLLTVCFR NTQRLIRLIS EILDISGIES GGMIFNFKSL 
CIGELAVYAV EEIKSYAMGR DITIVNTVGE HLPMVFGDSD RLIQVMTNLL SNAVKFSPEG 
KVVMVTAEQE GNYVVVSVAD RGRVIQWSDR DKLFKKFQQI ESTERGKIGG TGLGLAICKE 
IVERHHGRIF YTAAKEYGNT FSFTVPIIGE TDAKG