Gene GM21_3221 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GM21_3221
Symbol
ID	8138573
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sp. M21
Kingdom	Bacteria
Replicon accession	NC_012918
Strand	+
Start bp	3735309
End bp	3737081
Gene Length	1773 bp
Protein Length	590 aa
Translation table	11
GC content	64%
IMG OID	644870826
Product	PAS/PAC sensor signal transduction histidine kinase
Protein accession	YP_003023006
Protein GI	253701817
COG category	[T] Signal transduction mechanisms
COG ID	[COG0642] Signal transduction histidine kinase
TIGRFAM ID	[TIGR00229] PAS domain S-box

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	64
Fosmid unclonability p-value	0.128603
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAGGATAT CCACAAGCAA AATCCCGGTC GTCGTTCTTC TGAGTGCGGT GAGCATCGCG 
CTGGTGATGA TGGCGGCAAG CCACCTCATG CTCGGGCAGA TCAGGCAGGA GGCCGTGCGC 
CAGGCCACCA AGCAGCAGGA AAGCAGCATG TCGGCCCTAT GGGAGCAGAT GGCGCGCCGC 
GGCAGGAACT TCCGCATCGA GGACGGCAAG CTCTACGTCG GGGACTACTA CGTCCTGAAC 
GACAACAACG AGATTCCGGA CCGCATCTTC GCCATCACCG GGAGCAGGGC CACCATCTTC 
ATGGGAGACA CCCGGGTCGC CACCAACATC ATGCGGGCCG ACGGCACGCG CGCGATAGGA 
ACCAGGATGA TGGGCCCCGC CTACCGGGCC GTCTTCGGCG AGGGGACCCG CTACCGCGGC 
GAGGCCGATA TCCTCGGCAT CTCCTACTTC ACCGCCTATG ACCCGGTCAG GGACGCGCGC 
GGCAAGATCA TCGGCGCCCT CTTCGTGGGG GTGAAGCAAA GCGAGTACCT GGCCCGCTAC 
GACAGCATCA ACCTGAAGAT CCGCGCCGTC AACGTGATGC TGGCAGCGAT CTTCGTCCTA 
TTGGCCGTGC TTTTGATCCA GCTCCGCAAA AGGAGCGAGA TCGCGGTTCA GCAACAGCTC 
GCTTTCCAGC AGCTGCTTTT GGACACGATA CCCAGCCCGA TCTTTTCCAA GGACGCCCAG 
GGGCGCTACA ACCTCTGCAA CAAGGCCTTT CAGGCCTACG TGGGGATGCC GCGCGAGGAG 
CTTTTGGGCA AGACGGTGTT CGAGCTTTGG CCCAAGGAGC TGGCGCAAGA GTACTGGCGC 
ATGGACCAGG TCATCATGGA AAGCTCCGGA ACGCAGATTT ACGAGTCGCA GGTCAAGTAT 
GCGGACGGCA CCCTGCACGA CGTGCTCTTC CACAAGGCGG CTTTCCGGGA CGAGAGGGGG 
ACCCCCGCCG GGCTGGTCGG CGTCATACTG GACATCACCG AGCGCAAGGA GGCCGAGATG 
GAGAACAGCA GACTCGCGGC GCAGATGCAC CAATCCCGGA TGATCGAGTC GCTGATGATC 
CAGCTGAACC ACGACCTGAA CACCCCGCTT ACCCCCCTGT TCGCCCTGCT CCCCATGATC 
CAGAAGCAGG TGGACGACCC GGGGCTTAGG AGAATGCTGG AGATCTGCCA GCAGTGCGCG 
AACCAGATCA AGGGACTGGC CGAGAAGTCC CTGGACCTGG TCCGGATCTC GTCCGGCCAC 
CCCCAGTTGA TCCCGGTGAA GCTCGCCGGC ACGGCGGAGT TCGCGCGCGG TGAAGTCGCG 
AACACCCTGT CGCTGCGCGG CGTGACCTGC CACAACGACA TCCCCGCCGA CCTGTGGGTC 
CTGGGAAGCG CGGAACAGCT TTCCCTGCTC TTCAGGAACC TGCTCACCAA TGCCGCGCGC 
TACGCCTGCG CCAACGGGCA CATCGTGCTG GGGGCCGCGC CCAAGGACGG GATGGTGCAG 
GTCTGCGTCC AGGACGACGG CGAGGGGCTG GACCAGGAGC ACTTGGCCCT GGTCTTCAAC 
GAGTTCTTCA AGACCGATCC GGCCCGCCAG GACGTGAACA CGCAGGGGCT GGGTCTCGCC 
ATCTGCAAGC GGATCATCGC CAACCACGAC GGCAGGATCT GGGCCGAGAG CCCCGGCAAG 
GGGCAAGGGA CCACCATCTT CTTGACGCTT AACCCCGCAG GCGATGCGCC GGGGGAAGCC 
AAACCCGATC ATCCGGGGAG TTACGAGATA TGA

Protein sequence

MRISTSKIPV VVLLSAVSIA LVMMAASHLM LGQIRQEAVR QATKQQESSM SALWEQMARR 
GRNFRIEDGK LYVGDYYVLN DNNEIPDRIF AITGSRATIF MGDTRVATNI MRADGTRAIG 
TRMMGPAYRA VFGEGTRYRG EADILGISYF TAYDPVRDAR GKIIGALFVG VKQSEYLARY 
DSINLKIRAV NVMLAAIFVL LAVLLIQLRK RSEIAVQQQL AFQQLLLDTI PSPIFSKDAQ 
GRYNLCNKAF QAYVGMPREE LLGKTVFELW PKELAQEYWR MDQVIMESSG TQIYESQVKY 
ADGTLHDVLF HKAAFRDERG TPAGLVGVIL DITERKEAEM ENSRLAAQMH QSRMIESLMI 
QLNHDLNTPL TPLFALLPMI QKQVDDPGLR RMLEICQQCA NQIKGLAEKS LDLVRISSGH 
PQLIPVKLAG TAEFARGEVA NTLSLRGVTC HNDIPADLWV LGSAEQLSLL FRNLLTNAAR 
YACANGHIVL GAAPKDGMVQ VCVQDDGEGL DQEHLALVFN EFFKTDPARQ DVNTQGLGLA 
ICKRIIANHD GRIWAESPGK GQGTTIFLTL NPAGDAPGEA KPDHPGSYEI