Gene GM21_3098 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GM21_3098
Symbol
ID	8138448
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sp. M21
Kingdom	Bacteria
Replicon accession	NC_012918
Strand	+
Start bp	3588775
End bp	3590250
Gene Length	1476 bp
Protein Length	491 aa
Translation table	11
GC content	60%
IMG OID	644870702
Product	two component, sigma54 specific, transcriptional regulator, Fis family
Protein accession	YP_003022884
Protein GI	253701695
COG category	[T] Signal transduction mechanisms
COG ID	[COG2204] Response regulator containing CheY-like receiver, AAA-type ATPase, and DNA-binding domains
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	133
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATCAACA AGAACCGCAT TTTAGTGGTC GACGACGAAA AGCTGATCTC GTGGTCTCTG 
GCAACCATGC TGAAAAAAGA GGGGTACGAC GTGGAAACCG CGGCCACCGG CAACGAGGCT 
ATCAACAGGT TCGCGGAGTT TCGCCCCCAG CTGGTGCTAT TGGACGTCTG CCTCCCCGAC 
GTGAACGGAC TCGAGCTGCT CAAGCGCTTC AAGAGCGTCA ATGAAGATCT CTACGTGATC 
ATGATCACCG CCTACGCCCA CGCCGATTCC GCGGTGCAGG CGCTGCAGGA AGGGGCGGAG 
GACTACTTCG GCAAACCGTT CAACCTGGAC GCCGTGAAGC ACGTGGTGAA CAAGGCGTTC 
GAAAAGACCC AGCTCAAGAA AGAGGTGGAC TACTTCCGCG GGGAGCTGCG CAAGAAGTCG 
GACCAGGACA AGCTGGTCGG CAACAGCCAG AAGATGATCG AGGTCTTCAA GATGATCAAG 
GTCTGCGCCG ATGCCGACGC GAAGACGGTG CTGGTAACCG GCGAGAGCGG CACCGGCAAA 
GAGCTCGTGG CGAAGGCGCT CCACATGCAC AGTGGGCGCT CCGAGGCCCC CTTCATCGAG 
GTGAACTGCG CCGCGATTCC CGAGAACCTC CTGGAGAACG AGCTGTTCGG CCACGAAAAG 
GGGGCCTACA CCGACGCCTC GAAACGCCAC AAGGGGGTCT TCGAGATGGC GGAGGGGGGG 
ACGGTCTTCC TCGACGAGAT CGGGGACATG CCGTTTCTCA TGCAGGCCAA GATCCTCAAG 
GTGATAGAGA GCAAGCGCTT CCGCCGCCTG GGAGGGCAGG AAGACGTCGA GGCGAACGTC 
AGAATCATCA CGGCGACGCA CCAAAACCTG CAGCAGATGG TGAAGGAAGG GAAGTTCCGC 
TCCGACCTCT TTTTCCGGCT CAACGTGATG AACATCGCGC TCCCGCCTTT GCGCGACAGA 
AAGGAAGACG TCCCGGCCCT GATCCAGTAC TTCATCAAGA CCCTGAACGA CGAGTACGGC 
AGAAGCGTCG AGGGGGCCTG CGAGGACACC ATGGAGTACC TGACAGGCTA CGACTGGCCC 
GGCAACGTGC GCGAACTGCG CAACTGCATA GAGCGGCTCA TGATGCTGGA AAAGGAGAAG 
ATGCTGGGGA GCGAGCACCT GAGCGCGGAG ATCACCCAGA GAAGCAGGCA GGGGAACCAG 
ATGATGAGGG CCAACAGCAA CAACGAATTC GCCGGAGAGC ATATACTGCT CCCCCCGGAG 
GGGATATCGC TGGAGGAGCT GGAAAAGCTG ATCATACAGC TTGCCCTTAA GAAATCGGGG 
GGCAACCAGA CCAAGGCGGC CAAGTATCTG AAGACCAGCA GGGACACCTT GCGCTACCGG 
ATGAAGAAGT TCGGGCTGGG TGAAAACGGC AGGGAGGAAG GGCGCGGCGA CAGCGAGGAA 
CCGGAGGGGG AGCAGATGGT CCCATACGAC GCTTGA

Protein sequence

MINKNRILVV DDEKLISWSL ATMLKKEGYD VETAATGNEA INRFAEFRPQ LVLLDVCLPD 
VNGLELLKRF KSVNEDLYVI MITAYAHADS AVQALQEGAE DYFGKPFNLD AVKHVVNKAF 
EKTQLKKEVD YFRGELRKKS DQDKLVGNSQ KMIEVFKMIK VCADADAKTV LVTGESGTGK 
ELVAKALHMH SGRSEAPFIE VNCAAIPENL LENELFGHEK GAYTDASKRH KGVFEMAEGG 
TVFLDEIGDM PFLMQAKILK VIESKRFRRL GGQEDVEANV RIITATHQNL QQMVKEGKFR 
SDLFFRLNVM NIALPPLRDR KEDVPALIQY FIKTLNDEYG RSVEGACEDT MEYLTGYDWP 
GNVRELRNCI ERLMMLEKEK MLGSEHLSAE ITQRSRQGNQ MMRANSNNEF AGEHILLPPE 
GISLEELEKL IIQLALKKSG GNQTKAAKYL KTSRDTLRYR MKKFGLGENG REEGRGDSEE 
PEGEQMVPYD A