Gene GM21_1038 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GM21_1038
Symbol
ID	8136360
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sp. M21
Kingdom	Bacteria
Replicon accession	NC_012918
Strand	+
Start bp	1220608
End bp	1222014
Gene Length	1407 bp
Protein Length	468 aa
Translation table	11
GC content	65%
IMG OID	644868649
Product	putative two component, sigma54 specific, transcriptional regulator, Fis family
Protein accession	YP_003020857
Protein GI	253699668
COG category	[T] Signal transduction mechanisms
COG ID	[COG2204] Response regulator containing CheY-like receiver, AAA-type ATPase, and DNA-binding domains
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	79
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAGTCAA CGCCGTATCC CAGCTTCAGC ATATTGCTGG TCGACGACGA GCCGGCCTGG 
CTCAAGTCCT TCTCGCTCAC CTTGAAGAGC CGGGCGGGGA TCAACAACGT GCTCATCTGC 
CAGGACAGCC GCGAGGCGAT GGGGCTCTTG GACCGGGGGG GAGTGGGGCT CGTGCTCCTC 
GACCTGACCA TGCCGCATAT CTCCGGCGAG ACGCTTTTGC AGCAGATCGC TGAGAGCCAC 
CCGGAGATCA TGACCATCAT CGTGAGCGGG ATGAACCAGC TCGACACCGC GGTGCGCTGC 
ATGAAGCTCG GAGCCTTCGA CTACATCGTG AAGACCGACG AGGAGGACCG GCTGGTCGGG 
GGGGCGATGC GGGCGATCAG GATGCTGGAG CTGCACCAGG AGTTCCGTGC CATGAGCGAC 
CGGATGATCT CGCGCGAGCT GAAGCACCCG GAGGCGTTCG CCGACATCGT CACCAGCGAC 
CGCGGCATGC ACGACCTTTT CAACTACGTG GAGGCGGTGT CGCCCAGCCA TCAGCCGCTT 
TTGATCACCG GCGAGAGTGG CGTTGGAAAG GAGCTGATCG CCCGCGCCGT GCATGCCTTG 
AGCGGCTGCC AGGGGCCGCT GGTCGCCGTC AACGTAGCCG GGCTCGACGA TACCGTCTTT 
GCCGACACTC TTTTCGGGCA CGTGCGCGGC GCCTATACCG GCGCGGACCA GGCGCGCCCC 
GGGATGATCG AGCAGGCCGG AAACGGAACG CTTTTCCTCG ACGAGATCGG GGACCTGAGC 
ATCGCCTCGC AGGTGAAGCT ATTGCGCCTG CTGCAGGAAG GAGAGTATTT CCAGCTGGGG 
AGCGACCGGC CCAAGCGGAT GAACGCGCGC ATCGTGGTCG CGACGCACCG GGATCTGGCC 
GCCAAGGAGG CCGCCGGGAC TTTCAGGCGC GACCTTTATT ACCGTCTTTG CACGCACCGC 
ATCCAGATTC CGCCGCTCAG GGAGCGGACC TCCGACATCC CGCTTTTGCT CGACTATTTC 
CTTGAGCAGG CGGCGCAGTC GCTGGGGAAG AAGAAGCCGA CCCCCCCAAA GGAGTTGGCC 
CAGATACTCG CCACCTACAG CTTCCCCGGC AACGTGCGCG AATTGCGCGG CATGGTCTAC 
AACGCGGTCA GTCTGCACAA GGAGAGGATC CTTTCCATGG ACAGCTTCCT GAAGGCGATC 
GGCCGCTCCC GCGTGGAGCA GCCGCTTCCT GCCCTGCACG AAAACCCGTT CCAGTCCTTC 
GAGCGCCTGC CCACCTTCGC CGAGGCGGCC GAACTGCTGG TGGAGGAGGC GGTCTCGCGC 
GCCAACGGCG TCCAGGCCAT CGCCGCGAGG CTTTTGGGGA TCTCCGCCCC CGCGCTCAAC 
AAGCGCCTCA AGCTCAAGCG GAAGTAG

Protein sequence

MKSTPYPSFS ILLVDDEPAW LKSFSLTLKS RAGINNVLIC QDSREAMGLL DRGGVGLVLL 
DLTMPHISGE TLLQQIAESH PEIMTIIVSG MNQLDTAVRC MKLGAFDYIV KTDEEDRLVG 
GAMRAIRMLE LHQEFRAMSD RMISRELKHP EAFADIVTSD RGMHDLFNYV EAVSPSHQPL 
LITGESGVGK ELIARAVHAL SGCQGPLVAV NVAGLDDTVF ADTLFGHVRG AYTGADQARP 
GMIEQAGNGT LFLDEIGDLS IASQVKLLRL LQEGEYFQLG SDRPKRMNAR IVVATHRDLA 
AKEAAGTFRR DLYYRLCTHR IQIPPLRERT SDIPLLLDYF LEQAAQSLGK KKPTPPKELA 
QILATYSFPG NVRELRGMVY NAVSLHKERI LSMDSFLKAI GRSRVEQPLP ALHENPFQSF 
ERLPTFAEAA ELLVEEAVSR ANGVQAIAAR LLGISAPALN KRLKLKRK