Gene GM21_3903 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GM21_3903
Symbol
ID	8139277
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sp. M21
Kingdom	Bacteria
Replicon accession	NC_012918
Strand	+
Start bp	4489255
End bp	4490622
Gene Length	1368 bp
Protein Length	455 aa
Translation table	11
GC content	62%
IMG OID	644871520
Product	two component, sigma54 specific, transcriptional regulator, Fis family
Protein accession	YP_003023678
Protein GI	253702489
COG category	[T] Signal transduction mechanisms
COG ID	[COG2204] Response regulator containing CheY-like receiver, AAA-type ATPase, and DNA-binding domains
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	49
Fosmid unclonability p-value	0.000574971
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGATCGGCA GCATCCTGAT AGTGGACGAC GAGAAGGGGC AGCGGGACAT ACTCACTGCC 
ATACTCACCA AGATGGGGTA CAAGATTCAG ACCGCCTCGG GCGGTGAAGA GGCGCTGCAG 
CAACTGCAGC ACAAAGAATT CGACCTCCTC CTCACCGACC TCAAGATGCA GGGAATTTCA 
GGGATGGAAC TCATGGAGCG GGTGCTGGCC GACGACCCCT CCCAGTGCGT GGTGATGATG 
ACCGCCCACG GCACCATCGA CTCGGCAGTG GAGGCGATGA AGAAGGGGGC CTTCGACTAC 
CTCGAAAAGC CCCTGGAGCG CGAGGACCTG ATCCTCACCG TGCAGCGGGC CTTCGAGCGG 
ATCGGGCTTT TGAAGGAAAA CAAGGCGCTG CACAAAAAGC TCGCGGAAAC GAAAAGGCTT 
CCCAACATGA TCGGGGAGCA CCCGAAGATG CACGAGGTGG TACGGATCAT CAACAAGATA 
GCCCCCACCT CCACGACGGT CCTCATCTAC GGCGAGTCGG GGACCGGCAA GGAACTCGTG 
GCGCGCGCCA TCCACGACGG GAGCCCGCGC AGGGACAAGG CCTTCTTCGC CATCAACTGC 
GCGGCGATTC CCGACTCGCT TATGGAAAGC GAGCTCTTCG GGCACGAGAA GGGGGCCTTC 
ACCGGCGCGG GCACCCGGGA AATCGGTCTT TTCGAGGCAG CCGAGGGGGG GACCGTCTTT 
CTCGACGAGA TCGGCGAGAT GAACATCGCC ATGCAGGCGA AGCTCTTGCG CGCCATACAG 
GAGAAGGAGA TCCGCAGGGT CGGGGGGAAG GTGAACATCC CCGTCGACGT CAGGATCATC 
TCCGCCACCA ACAAGGACCT GGAACAGGAG ACCCGGCGCG GCAACTTCCG CGAGGACCTC 
TTCTACCGGC TCAACGTCAT CAGGATCGCG CTTCCCCCCC TGAGGGAGCG CGGCAACGAC 
ATCGTGACGC TGGCCGATTT CTTCCTGAAG AAGTACAGCG CCTCCTGCGG CATCCCCCTG 
AAGGGAATCG CCAAACCGGC GCTGAAGATC CTGCTCGACT ACAGCTGGCC CGGCAACGTG 
CGGCAACTGG AATCGGTCAT CGAGCGCGGC GTGCTCATGG CCGAGAGCGA ATACATCCAG 
CCCGAGGACC TGCCGGCCGA GGTGCACCAC GAGGCCTCCC CCGCCGGGAG CCTCCCCTTC 
GACTTCCCGG CAGAGGGGAT ATCCATCGAC AACCTGGAAC GGGACCTGAT CGTCAAGGCG 
ATGCAGAGAA CCGACTGGGT CATCGCCAAA GCGGCACCAC TACTCGGTAT GAGCTACAAG 
ACGCTGCAAT ACCGGTTGGA AAAGTTCGAC ATCGGCAAAC CGGAGTAG

Protein sequence

MIGSILIVDD EKGQRDILTA ILTKMGYKIQ TASGGEEALQ QLQHKEFDLL LTDLKMQGIS 
GMELMERVLA DDPSQCVVMM TAHGTIDSAV EAMKKGAFDY LEKPLEREDL ILTVQRAFER 
IGLLKENKAL HKKLAETKRL PNMIGEHPKM HEVVRIINKI APTSTTVLIY GESGTGKELV 
ARAIHDGSPR RDKAFFAINC AAIPDSLMES ELFGHEKGAF TGAGTREIGL FEAAEGGTVF 
LDEIGEMNIA MQAKLLRAIQ EKEIRRVGGK VNIPVDVRII SATNKDLEQE TRRGNFREDL 
FYRLNVIRIA LPPLRERGND IVTLADFFLK KYSASCGIPL KGIAKPALKI LLDYSWPGNV 
RQLESVIERG VLMAESEYIQ PEDLPAEVHH EASPAGSLPF DFPAEGISID NLERDLIVKA 
MQRTDWVIAK AAPLLGMSYK TLQYRLEKFD IGKPE