Gene GM21_1970 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GM21_1970
Symbol
ID	8137304
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sp. M21
Kingdom	Bacteria
Replicon accession	NC_012918
Strand	-
Start bp	2284942
End bp	2286207
Gene Length	1266 bp
Protein Length	421 aa
Translation table	11
GC content	46%
IMG OID	644869584
Product	PAS/PAC sensor signal transduction histidine kinase
Protein accession	YP_003021781
Protein GI	253700592
COG category	[T] Signal transduction mechanisms
COG ID	[COG4585] Signal transduction histidine kinase
TIGRFAM ID	[TIGR00229] PAS domain S-box

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	140
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGACATTG GGGAAAATAC CAACAGCAAA AAAAAGACCC GCTCCAAAAC AGGAGCGTTG 
GCGGCTAGGC AGTTACAGAG CCTGTTACGA CACGTGCCTG TGGTCTTATT TCAGTATCAA 
AAACATAATG ACGGAAGGCA TAGCTTTCCT TATGTAAGTG AGACCTTGAC ACAAATTTTC 
CATCTTGGCC CATGTGAAGC CACGACTGAG GCTTCGGATT TCTTTTCACT TTTACACCCC 
GATGACATAG GTATCGTGAC TGCGTCAATT GCAGACTCAG CAGCGAACTT ATCTCTTTGG 
CAGCAGGAGT TTCGCATTGT TATAGAGCGG GAGCATTGGA TTGAAGCAGC AGCCACTCCG 
GTCATGATTA ACGATGGCAG TTGCTTGTGG AGTGGGTATG CGAGAGAGAT AAATGAGAGA 
AAGGTTTTAG AGCAGGATTT GCGAGAAGTA CAGGAAGACT TAATGCGGAT GACCGAGGAA 
CGGACCAACA AACTGGTTGA GGCGAATACA AAATTATGTG CTTTAAACCA GGAGATAAAA 
GAAGAGATTA ACCAGCGCAT CAGATTAGAG AATAGCCTAA AAGAATCATA TGAACTTCTG 
TCTTTGCTCG CTGCAAATCT AGTATTTTCA GAAGAACGAG AGCGGAGAAG AATCGCAACC 
GAGTTGCACG ACGATGTGGT GCAACATCTG GCGCTTTGCA AATTGAGACT GGATATGGAA 
CTCAAAGACG GTGCTCCGTC GCGTGTATTG CAGGAAGAAC TCGTAGGTGA GCTGGTAAGG 
ACAATGCAAC AAATCAGACG TATCTGCTAC GATCTGAGCC CGCCGGTGCT GTACGATTTT 
GGGCTTCCTA ATGCGCTGCA AAATCTAGGA GAAACAATGA CGCAGGCAAC AGGTCTGCAA 
TTTAGGTTTC AAAACGGCTT GAAGAAGCTT GAATTACCGA ATCATATACG CACTGTACTG 
TATCAAACAG CTAAAGAACT GCTAGCCAAT GTGATGAAAC ACGCGATGGC GAGCAATGTC 
TCGGTAGCCC TCACTAAAAG TGAGGAATTA ATCAGGCTAT CGGTAACTGA CGATGGAGTT 
GGGTTCCCAT CACTTGGCAA GAAGGGTTTC GGATTGTCAC ATATTCAGCA AAGAGTGGCT 
TTCCTCAAAG GAAATCTGAG CATTTCCTCA GGACCCGGCA GAAAAACTGT TGTAGCAGTT 
GAGATACCGG CAACACCTGC GAGCAGTGCC AACACGCCCC CCTCACCTCG TAATCAGCCT 
ACTTGA

Protein sequence

MDIGENTNSK KKTRSKTGAL AARQLQSLLR HVPVVLFQYQ KHNDGRHSFP YVSETLTQIF 
HLGPCEATTE ASDFFSLLHP DDIGIVTASI ADSAANLSLW QQEFRIVIER EHWIEAAATP 
VMINDGSCLW SGYAREINER KVLEQDLREV QEDLMRMTEE RTNKLVEANT KLCALNQEIK 
EEINQRIRLE NSLKESYELL SLLAANLVFS EERERRRIAT ELHDDVVQHL ALCKLRLDME 
LKDGAPSRVL QEELVGELVR TMQQIRRICY DLSPPVLYDF GLPNALQNLG ETMTQATGLQ 
FRFQNGLKKL ELPNHIRTVL YQTAKELLAN VMKHAMASNV SVALTKSEEL IRLSVTDDGV 
GFPSLGKKGF GLSHIQQRVA FLKGNLSISS GPGRKTVVAV EIPATPASSA NTPPSPRNQP 
T