Gene GM21_1954 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GM21_1954
Symbol
ID	8137288
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sp. M21
Kingdom	Bacteria
Replicon accession	NC_012918
Strand	-
Start bp	2264289
End bp	2265656
Gene Length	1368 bp
Protein Length	455 aa
Translation table	11
GC content	61%
IMG OID	644869568
Product	two component, sigma54 specific, transcriptional regulator, Fis family
Protein accession	YP_003021765
Protein GI	253700576
COG category	[T] Signal transduction mechanisms
COG ID	[COG2204] Response regulator containing CheY-like receiver, AAA-type ATPase, and DNA-binding domains
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	130
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGACAGG AAAAGATTCT TATCTGCGAC GACGAGGAAG GGATCCTCAT CTACCTGAAG 
AAGCTGCTTA AGACCCAGGG GTACCTGGTC GAGACCTTCG ACTGCGGAGC GGCGCTCTTG 
CGCCGACTTA AAGATGGGGA CCCCTCCGAC GCGGACCTGC TTTTGCAGGA CGTAAGGATG 
CCGGACATGG ACGGCATCAC CGTGCTCAAG GAGGTGAAGG CGCTTAGGCC CCCGCTTCCC 
GTCGTCGTCA TGACCGCCTT CGGGACCATA GACGCCGCGG TGGAGACGAT CAAGATGGGT 
GCCTACGACT ACGTCACCAA ACCTTTTCCC AAGGAGAAGA TCCTGAGCGT CATCAAGAAC 
GCGCTGGAAA AGGAGCAGCT CTTGCAGGAG AACCGGGCGC TCAAGAGCGA GCTGGAAAAA 
CCGATCCTGC AGGAATCGAT CATCTTCAAA AGCGCCGCCT TCCAGGAGAT CTACGACCTC 
ACCCTGCAGG TCGCGGCCAG CGAGGCGAAC ATCCTGGTGC TGGGCGAGTC CGGGACCGGC 
AAGGAGCTCA TCGCCGGCGC CATCCACTAC AACAGCTTAA GGCGCGACCG GCGCTTTCTC 
TCCATCAACT GCGCGGCCTT GACCGACACG CTCCTGGAGA GCCAGCTCTT CGGGCACGTA 
CGGGGCGCCT TCACCGGCGC GGTCGCGGCA CAGAAGGGAC TATTGGAGGA GGCCGACGGC 
GGCACCCTCT TCATGGACGA GATCGGCGAC ATGACCCTCC CCATCCAGGC GAAGCTTCTG 
CGCGTGATCC AGGAGCGCGA CTTCATCCCG GTGGGATCGA CCCGCCCCAA AAGCGCCGAC 
ATCCGCTTCG TGGCCGCCAC CAACAAGAAC CTGGAACTGG AGGTGCGGGA GGGGCGTTTC 
CGAGAGGACC TCTTCTACCG GCTGAACGTG ATCAACATCC CGCTGCCGCC GCTTAGGGAG 
AGAAAGGACG ACGTGGAACC CCTGGCGCTG CACTTCCTGA AGAAGTACAG CCTGAAGATG 
AAAAAGCAGG TTTCCACCCT CACCCCCGAG GCGCTGCAGC TCCTTTACGG CTACGACTGG 
CCCGGCAACA TCAGGGAGCT GGAAAACGTC ATGGAGCGCG CCGTCATCCT GGCCCGGACC 
CAGACGGTGA CCGCAAAGGA GCTTCCCATC TGGCGCAAAC AGCCGCAAAA GGTGGAAGCG 
CCCCGCGAGG CTCAGTTCGT CTCGCTGGAA AACGTGGAGA AGGAGGCCAT CGTGCGGACC 
CTCTCCGGCA CCGGGTTCCA CAAGAGCAGG TCGGCCGAGA TCCTGGGCAT CTCCAGAAAA 
ACCCTGGACC GCAAGATCGT GGAATACCGC ATCACCATCC CCTCATGA

Protein sequence

MRQEKILICD DEEGILIYLK KLLKTQGYLV ETFDCGAALL RRLKDGDPSD ADLLLQDVRM 
PDMDGITVLK EVKALRPPLP VVVMTAFGTI DAAVETIKMG AYDYVTKPFP KEKILSVIKN 
ALEKEQLLQE NRALKSELEK PILQESIIFK SAAFQEIYDL TLQVAASEAN ILVLGESGTG 
KELIAGAIHY NSLRRDRRFL SINCAALTDT LLESQLFGHV RGAFTGAVAA QKGLLEEADG 
GTLFMDEIGD MTLPIQAKLL RVIQERDFIP VGSTRPKSAD IRFVAATNKN LELEVREGRF 
REDLFYRLNV INIPLPPLRE RKDDVEPLAL HFLKKYSLKM KKQVSTLTPE ALQLLYGYDW 
PGNIRELENV MERAVILART QTVTAKELPI WRKQPQKVEA PREAQFVSLE NVEKEAIVRT 
LSGTGFHKSR SAEILGISRK TLDRKIVEYR ITIPS