Gene GM21_2551 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GM21_2551
Symbol
ID	8137893
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sp. M21
Kingdom	Bacteria
Replicon accession	NC_012918
Strand	-
Start bp	2980296
End bp	2981486
Gene Length	1191 bp
Protein Length	396 aa
Translation table	11
GC content	63%
IMG OID	644870160
Product	response regulator receiver sensor signal transduction histidine kinase
Protein accession	YP_003022350
Protein GI	253701161
COG category	[T] Signal transduction mechanisms
COG ID	[COG4191] Signal transduction histidine kinase regulating C4-dicarboxylate transport system
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	1.14529e-19
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGTCCCAAC AGGATAAAGA GCCGCGCGGC CGCGTGCTGA TAGTAGACGA CGAGAAGGTC 
ATCCTCGACC TTACCGCCAT AATCCTTAAA AACCGCGGCT ACCAGGTCTT CACCGCGCTT 
TCGGCGCTGG AGGGGCTGGA GACCATCGAT AAGGAACGCC CCGAGCTCGT GCTGCTCGAT 
TACATGATGC CGAACATGGA CGGCCTCACC GCGCTCAAGG AGATCAGGCG CAGCTACCCC 
GATACCTACG TGATCATGTT CACCGGCAAG GGGAGCGAGG AGATCGCCGT CGAGCTGATG 
AAGGCGGGAG CCTCCGACTA CATCCTGAAG CCGTTCAACA ACCAGGACCT GGTCGAGAGG 
ATCGAGAGCG TCCTGAAGCT TCGGGGCATC GAGCTGCAAA ACCGCGCCCT TTTGAGCGAG 
CGGGAGCGGC TTCTGGCCGA GATCGCGGAC TGGAACCGCG AGCTGGAGCG CCGGGTGCAG 
GAAAAGAGCG AGGCGCTGCG CCGGGCCCAG GCAGAGGTGG TGCAGTCCGA GAAGCTCGCT 
TCCCTCGGCT ACCTCTCCGC CGGGATGGCG CACGAGATCA GGAACCCGCT CAACTCCATA 
GCGCTTTTCG TGCAGCTCAT CAAAAGCGGG CTGGACGAGC ACGAGCGCCT GGACTACGTG 
GAAAAGATCC TCAAGGAGGT CGACCGGATC GACAACATCC TGGCGAAGCT CCTGGACGCC 
TCCAAGCGCC CGAAGTTCGA GATCAGCGAG GTGCGGGTCG ACCGGGTCCT GGAGCACACG 
CTCGACGCCT TCACGCCGCA GCTGCGGCAG AAAAGGATCC GGGCGGTCAC CGACTTCAAG 
AGCATCCCCC CGGCCATCAA GGCGGACCCG ATGGAGATAG AGCAGATCTT CACCAACCTC 
TTCCTGAACT CCATCTACGT GATGCCCGAG GAGGGGACCC TCGCGGTGGA GCTGGCAGGG 
GACGAGCAGT GGATCACGGT GAGGGTCTCC GATACCGGCC CCGGCATACC GCCCGAGAAC 
CTCCCCAACA TCTTCGATCC CTTCTTCACC ACCAACAGCC GCGGCACCGG GCTCGGGCTC 
TCCGTGGTCC TGCGCATCGT GAAGACCTAC AAGGGGAAGA TCGAGGTGGA GAAAAGCGAC 
AGCTCCGGGA CCACCTTCCT GGTCCGCCTG CCGCTTGCCC CCCCGAGGTA G

Protein sequence

MSQQDKEPRG RVLIVDDEKV ILDLTAIILK NRGYQVFTAL SALEGLETID KERPELVLLD 
YMMPNMDGLT ALKEIRRSYP DTYVIMFTGK GSEEIAVELM KAGASDYILK PFNNQDLVER 
IESVLKLRGI ELQNRALLSE RERLLAEIAD WNRELERRVQ EKSEALRRAQ AEVVQSEKLA 
SLGYLSAGMA HEIRNPLNSI ALFVQLIKSG LDEHERLDYV EKILKEVDRI DNILAKLLDA 
SKRPKFEISE VRVDRVLEHT LDAFTPQLRQ KRIRAVTDFK SIPPAIKADP MEIEQIFTNL 
FLNSIYVMPE EGTLAVELAG DEQWITVRVS DTGPGIPPEN LPNIFDPFFT TNSRGTGLGL 
SVVLRIVKTY KGKIEVEKSD SSGTTFLVRL PLAPPR