Gene GM21_0010 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GM21_0010
Symbol
ID	8135309
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sp. M21
Kingdom	Bacteria
Replicon accession	NC_012918
Strand	+
Start bp	16171
End bp	17262
Gene Length	1092 bp
Protein Length	363 aa
Translation table	11
GC content	62%
IMG OID	644867627
Product	PAS/PAC sensor signal transduction histidine kinase
Protein accession	YP_003019855
Protein GI	253698666
COG category	[T] Signal transduction mechanisms
COG ID	[COG4251] Bacteriophytochrome (light-regulated signal transduction histidine kinase)
TIGRFAM ID	[TIGR00229] PAS domain S-box

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	78
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGCACTGC GTGAAAGTGA CGCCGGATAT CGCGAATTGT TTGAAGAAAA CCCTCAGCCG 
ATGTGGGTAT ATCAGCGGGA GAGCCGGAGA CTTCTTGCGG TGAACGAGGC GGCCCTGCGG 
CTTTATGGAT ATCGTCGCGA GCAGTTTCTC GAACTGGCCC TGGAGCATCT AAGCGGCGGC 
GAGCCGATGG GGGACCCGGG TTCGTCGCAG GACCAGCAGC CGCGCTGCAG GCAGATGAGA 
AAGGACGGCA GTTCCTTCGA AGCGCAGCTG GTCTGCCACC CTTGCCAGTT CCAGGGGGAG 
CGGGTGCAAC TGGTGCTGGT GCGCGAGGAC GGTGGCGCCC AGCAAGAGGC GCAGCTTAGG 
TACCGGGTGC TCCAGCAGGG AAGTCTTTTG GAGGCGGCGC AGCGCGAACT GGAGACCTTC 
AGCTATTCCG TCTCGCACGA CCTGCGCGCG CCGCTACGCC ACATAGACGG CTTCAGCCGG 
GCTCTCATGG ACGATTACGG AACCATTCTG GACGGCCAGG GCAAGGAGTA CCTGACCAGG 
ATCTGCCAGG CGGCGGAGAA GATGTCGCAG TTAATCGACG CCATGCAGCA ACTGTCGCGG 
GTGGGTAGGA CGGAGTTGAG CCTGGAGAAG GTCGACCTGA GCGTGAAGGC CCAGGTGATT 
TCATTGGAAC TGAAGCACCG GGAGCCCGAA CGCCGGGTCG ACTTCGCCAT CGAGGAGGGG 
GTGAGAGCCG AGGCCGACGC CAAGCTGGTG CGTCAGCTTC TGGAGATCCT GATGGGGAAT 
GCCTGGAAGT TCAGTTCCAA GACACCCTCC GCGGTGATAG GCTTCGGCTC CGTCGAGCTG 
CAGGGGGAGA CCGCGTACTT CGTCAGGGAC AACGGGGCAG GGTTCGACAT GGCCTACGCC 
GACAAGCTCT TTTCCGTATT TCACAGGCTC CATCGTGCCG ACGAGTTCGA GGGAAGCGGC 
GTGGGGCTTG CCATCGCCCA GCGCATCGTA GCGCGCCACG GTGGCCGGAT CTGGGCCGAA 
AGCGCGCCCG GCGCCGGTGC CACCTTCTAC TTCACGTTGA AAGGCGAGAA ACAATTGACG 
ATTGACAATT GA

Protein sequence

MALRESDAGY RELFEENPQP MWVYQRESRR LLAVNEAALR LYGYRREQFL ELALEHLSGG 
EPMGDPGSSQ DQQPRCRQMR KDGSSFEAQL VCHPCQFQGE RVQLVLVRED GGAQQEAQLR 
YRVLQQGSLL EAAQRELETF SYSVSHDLRA PLRHIDGFSR ALMDDYGTIL DGQGKEYLTR 
ICQAAEKMSQ LIDAMQQLSR VGRTELSLEK VDLSVKAQVI SLELKHREPE RRVDFAIEEG 
VRAEADAKLV RQLLEILMGN AWKFSSKTPS AVIGFGSVEL QGETAYFVRD NGAGFDMAYA 
DKLFSVFHRL HRADEFEGSG VGLAIAQRIV ARHGGRIWAE SAPGAGATFY FTLKGEKQLT 
IDN