Gene GM21_1557 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GM21_1557
Symbol
ID	8136887
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sp. M21
Kingdom	Bacteria
Replicon accession	NC_012918
Strand	+
Start bp	1815755
End bp	1816756
Gene Length	1002 bp
Protein Length	333 aa
Translation table	11
GC content	59%
IMG OID	644869170
Product	RNA polymerase, sigma 70 subunit, RpoD subfamily
Protein accession	YP_003021371
Protein GI	253700182
COG category	[K] Transcription
COG ID	[COG0568] DNA-directed RNA polymerase, sigma subunit (sigma70/sigma32)
TIGRFAM ID	[TIGR02937] RNA polymerase sigma factor, sigma-70 family

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	71
Fosmid unclonability p-value	0.389546
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGAAAACG AAGAGCATTT AGAGGAGAAG GAACCTCTAT TCCTGGACGC CGAGCAGGAC 
CCCGACTCAC TCGAACTGGA GGAAGTCGAG GCTGAAGCCG ATGAACCTGC CGAGGTAGAG 
GAAGAGGAAA TCAAGGCCGC GGTGGTGGAG CATTTCGATG ACGCCATCAA GCTCTACCTG 
CGCGAAATCC AGAAGACCAA GCTCCTCACC GCCGACGAGG AGAAGGAGTT GGCCGCGCGC 
ATTGACCTGG GCGACAAGGC CGCCCGGGAC CGGATGATCG TCTCCAACCT CCGCCTGGTG 
GTGAAGATCG CCAAGCGCTA CATAAACCGC GGGCTCCCCT TCCTGGACCT GATCGAAGAA 
GGGAACATGG GGCTCATCAA GGCGGTCGAG CGCTTCAAGC TCTCCAAGGA GTGCCGCTTC 
TCCACCTACG CCACCTGGTG GATCCGGCAG TCCATCGAGC GCGCGCTGGT GAACCAGTCG 
CGCACTATCC GTCTGCCGGT GCACGTCTCC GACGACATCA ACAAGATGCT AAGGGTGACG 
CGCGAGCTGG TGCAGAAGAT GAACCGCGAG CCGACCATCA AGGAAGTCGC CGACACCCTT 
GAAGTGAACA TCACCTACGT GCGCAGGCTC ATGGTCCTCT TGAAGAAGAC CTACTCCATC 
GAGCGTCCCA TGGGGGAGAA CAACGACTAC TTCCTCATCG ACACCATAGA GGACACCTCC 
ACCATATCGC CCGCGGTACT TCTGGAAGAC CTCAACAAGT ACGAGCTGGT CTCCAAGTGG 
TTCGAGACCC TCTCCGACGC CGAGAAAAAG ATACTCACGC TCCGTTTCGG TCTCGACGAC 
AAGGACCCCC AGACCCTCGA CACCATCGGG CGCAGCTTCG GGGTGACCCG CGAAAGGATC 
AGGCAGATCG AGGCGAAATC GCTGGAAAAG CTGAGAAAGA TAGTGGAAGC GACCGACATC 
ATGGGGCGCC CGGCCGTCCC CCCGACAACT ACAGGCACAT AA

Protein sequence

MENEEHLEEK EPLFLDAEQD PDSLELEEVE AEADEPAEVE EEEIKAAVVE HFDDAIKLYL 
REIQKTKLLT ADEEKELAAR IDLGDKAARD RMIVSNLRLV VKIAKRYINR GLPFLDLIEE 
GNMGLIKAVE RFKLSKECRF STYATWWIRQ SIERALVNQS RTIRLPVHVS DDINKMLRVT 
RELVQKMNRE PTIKEVADTL EVNITYVRRL MVLLKKTYSI ERPMGENNDY FLIDTIEDTS 
TISPAVLLED LNKYELVSKW FETLSDAEKK ILTLRFGLDD KDPQTLDTIG RSFGVTRERI 
RQIEAKSLEK LRKIVEATDI MGRPAVPPTT TGT