Gene GM21_0550 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GM21_0550
Symbol
ID	8135861
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sp. M21
Kingdom	Bacteria
Replicon accession	NC_012918
Strand	-
Start bp	673306
End bp	674928
Gene Length	1623 bp
Protein Length	540 aa
Translation table	11
GC content	63%
IMG OID	644868163
Product	PAS/PAC sensor hybrid histidine kinase
Protein accession	YP_003020382
Protein GI	253699193
COG category	[T] Signal transduction mechanisms
COG ID	[COG4191] Signal transduction histidine kinase regulating C4-dicarboxylate transport system
TIGRFAM ID	[TIGR00229] PAS domain S-box

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	59
Fosmid unclonability p-value	0.0519596
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGTGACCG ACGACACCAT CGCCATCCCC CAGCTCCTTT ACGAGGCGGT CAGCCGCGGC 
AAGCGCGAGT GGGAACAGAC CTTCGACTCC ATCGGCGACC TGATCTTCAT CACCGATACC 
AACCACACCA TTTCGCGGGC CAACCGCGCC ATGGCCAGGC ATTGCGGCCT GCGTCCGGAG 
GAGCTCCCGG GACGAAAGTG CTACGACCTC TTCCACGACC TGGCGTCTCC CCCCCCTTAC 
TGCCCGCTCC GGAGCCTGAA AGAGGGGGGG GCGCCACAGG CGGAGGAAGT CGAGGTCGCC 
AAGTTCCGCG GCTTCTTCGA CATCTCGGTA TCACCTTTGT ACAACGATGA GGGAACACTC 
GCCGCCTGCG TCCACGTCGC CCGCGACGTC ACCGAGCGCA AGAGGGCCCA GGAGTACCGG 
CTGGAGTTGG AGCAGCAACT GCTGCAGTCC CAAAAGCTCG AGAGCCTTGG TGTTCTCACC 
GGCGGCATCG CCCACGACTT CAACAACATC CTGATGATAA TCCTCGGGCA CTGCATGCTC 
GCCAAGGAGA ACCAGGCCGT CGCCCCGGTC GTCGGCCACC TGGATCAGAT CGAGTCCGCC 
GGAAACCGTG CCGCCGACCT TTGCCGCCAG ATGCTGGCCT ACGCCGGCAA GACGCCGCTG 
GTCCAAACTC AGATCCACCT CCCCGCGCTG GTGCGCGACA TGGTGCATAT GCTTCAACCC 
GCGTTCAACA AGAAAGTGAT CATTGAATGC GACCTCGACG GGGACCTGCC CAACCTGACC 
TGCGACGAGG GGAAGATCCA GCAGATCGTG ATGAACCTGG TGGTGAACGC AGCCGAATCG 
CTTGGAGAGC GGGGGGGGAA CGTCAAGGTG ACCCTCCGGC ACAAGACGGT GCTGCAGTCG 
GAGCAGGAGG TCGACTGCTT CGGCAACTCC ATACCCCCTG GAACCTATCT ATGCCTGGAG 
GTCGCCGACA CCGGATGCGG CATGGACCAG GAGACCCGGA AGCGGATCTT CGAGCCGTTT 
TTCACCACCA AGTTCACCGG ACGGGGACTT GGGCTTTCCG CGATCAGCGG CATCATCAAG 
TCCCATGAAG GCGCGCTGCA GCTCTGCAGC GCCCCCGGCG CGGGGACCAC TTTCAGCGTC 
TATTTCCCCC TCCCCCCATG CTGCCCCGCC GGCGACCAAG TCGCGCCGCC CCTCCCCTCG 
CCCTCCAAAG CGGCCGCAAG GCTCGAAGGC ACCATCCTGC TGGTAGACGA CGAGGAGGAA 
CTTCGTGCCG TCGGCTGTGA ACTTCTCACC AGCATGGGGT TCAAGGTGAT TGCCGCCAGT 
AACGGCAGCG AGGCACTCGC GATCTGGCAG GAGCGCAAAA GCGAGATAGA CCTCGTGCTG 
ATGGACCTGA CCATGCCGGA ACTGGACGGC GTCGAGACCT ACCGCGCCCT GCGCGAGGAT 
ACTTCCACGC TCCCGGTTCT TTTTTGCAGC GGGTACGGAG ACCAGGACAT CCGCCCTTGC 
ATAGGCGAGG ACGTCCACGC CGGCTTCATC TCCAAACCGT ACCAGTTGAA CCACCTACAA 
CGAGCACTGG CGGCCCTCTG GGAAAACCGC ATGCCTCATG CCGCAGAGGG TTTCCCCGCC 
TGA

Protein sequence

MVTDDTIAIP QLLYEAVSRG KREWEQTFDS IGDLIFITDT NHTISRANRA MARHCGLRPE 
ELPGRKCYDL FHDLASPPPY CPLRSLKEGG APQAEEVEVA KFRGFFDISV SPLYNDEGTL 
AACVHVARDV TERKRAQEYR LELEQQLLQS QKLESLGVLT GGIAHDFNNI LMIILGHCML 
AKENQAVAPV VGHLDQIESA GNRAADLCRQ MLAYAGKTPL VQTQIHLPAL VRDMVHMLQP 
AFNKKVIIEC DLDGDLPNLT CDEGKIQQIV MNLVVNAAES LGERGGNVKV TLRHKTVLQS 
EQEVDCFGNS IPPGTYLCLE VADTGCGMDQ ETRKRIFEPF FTTKFTGRGL GLSAISGIIK 
SHEGALQLCS APGAGTTFSV YFPLPPCCPA GDQVAPPLPS PSKAAARLEG TILLVDDEEE 
LRAVGCELLT SMGFKVIAAS NGSEALAIWQ ERKSEIDLVL MDLTMPELDG VETYRALRED 
TSTLPVLFCS GYGDQDIRPC IGEDVHAGFI SKPYQLNHLQ RALAALWENR MPHAAEGFPA