Gene GM21_3390 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GM21_3390
Symbol
ID	8138757
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sp. M21
Kingdom	Bacteria
Replicon accession	NC_012918
Strand	-
Start bp	3921038
End bp	3922585
Gene Length	1548 bp
Protein Length	515 aa
Translation table	11
GC content	62%
IMG OID	644871008
Product	RNA polymerase, sigma 54 subunit, RpoN
Protein accession	YP_003023173
Protein GI	253701984
COG category	[K] Transcription
COG ID	[COG1508] DNA-directed RNA polymerase specialized sigma subunit, sigma54 homolog
TIGRFAM ID	[TIGR02395] RNA polymerase sigma-54 factor

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	121
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCAATAG AGATGCGCCA GCAGATGAAA ATGAGTCAGC AACTGGTGAT GACGCCCCAG 
TTGCAGCAGG CCATCAAGCT CCTCCAGCTT TCCCGGCTGG AGTTGCAGGA CGTAGTACGT 
CAGGAGTTGG AGGAGAACCC CATACTCGAC GAGGTGATCG AGCAGGAGGA GATCCGGGAA 
CCCGAGCAGA TCGAATTGCG CGAGAAGGAA GCCGAGCCGG AGGCCGCCGC GAGCGATTTC 
CAGGAAGTGC GGGCCGGCGA GGAGACGCGC GAGGCGGACT GGGATTCCTA CATAGACGGC 
TACAACTACA GCTCCGGCGA GCAGTACTAC GACGACGAGG ACCGTCCCTC CTTCGAGAAC 
CTTCTCACCA AGAAATCCAC CCTGTTCGAC CACCTGATGT GGCAGTTGAG CCTCACCCGT 
CTCACGGAGC GCGAGATGGC GGTGGGAGCC GAGATCATCG GCAACATCGA CGAGGAGGGG 
TACCTCCGCG CCTCCCTCGA GGACGTAGCG TCGGCCTGCG TGCAGGTAAC CCCGTTCCAG 
GAAGAGATGC TCGAGTGGTC GGGGCTTACC AGCGACGCCT GCGAGGAAGA GATAGCCGAT 
GCGGCGGGCG GTTTCTCCAC TACCGTGCTG GTTCCGCTGG TCGATTCGGT GCTGAAGCGG 
ATCCAAGAGT TCGACCCGGT GGGCGTCGGG GCCCGCGACC TGCGCGAGTG CCTCCTGATC 
CAGGTGGGTA GCCTCGGCAT GGGGGGGAGC CTCGTGGAGT CGCTGTTGCG CGACCACCTG 
AAGGATCTGG AGAGCCACAA GTACAAGCAG GCCGCGAAGG TGCTGGGGGT GGATGTGAAC 
GACATCCTCG CCGCCACGAG GATCATCGCG GAACTCGATC CCAAGCCCGG CCGGGTCTTC 
GGCAGCGACG ACGTGCAGTA CATCTCGGCC GACATCTTCG TGCACAAGGT GGGTGACGAG 
TACGTGGTGA TGCTGAACGA CGAGGGGATG CCCAACTTGA GGATCAACCC CATCTACGCC 
CCCGAGGCGA AGAGCAGCCG TCCGGTCGAC AAGGTGGCCG AGGATTACAT CGGCGAGAAG 
ATGCGCTCCG CCCTGTGGCT CATCAAGAGC ATCCAGCAGC GCCAGCGCAC CATCTTCAAG 
GTGGCCAAGA GCATCGTGAA GTTCCAGCGC GACTTTCTCG ACCGCGGCAT CGAGCATCTG 
CGCCCGCTGG TGTTGAGGGA CATCGCCGAG GACATCGGCA TGCACGAGTC CACCATCAGC 
CGGGTCACCA CCAACAAATA CATGCAGACC CCGCAAGGGC TCTTCGAGCT GAAGTACTTC 
TTCAACTCCG GCATCTCGAC CGGGGAGGGG GACTTCATCG CCTCCGAGAG CGTGAAGAGC 
AAGATCAAGG AACTGGTGGA CAACGAGGAC TCCAAGCGCC CCTACAGCGA TCAGCGCCTG 
GCGGAACTCC TCTCGGACCA CAACATCGTC ATCGCCCGCC GCACCGTTAC CAAGTATCGC 
GAGATGCTTC GCATCGGCTC GTCCTCGGAG CGCAAGAAGC ATTTCTAA

Protein sequence

MAIEMRQQMK MSQQLVMTPQ LQQAIKLLQL SRLELQDVVR QELEENPILD EVIEQEEIRE 
PEQIELREKE AEPEAAASDF QEVRAGEETR EADWDSYIDG YNYSSGEQYY DDEDRPSFEN 
LLTKKSTLFD HLMWQLSLTR LTEREMAVGA EIIGNIDEEG YLRASLEDVA SACVQVTPFQ 
EEMLEWSGLT SDACEEEIAD AAGGFSTTVL VPLVDSVLKR IQEFDPVGVG ARDLRECLLI 
QVGSLGMGGS LVESLLRDHL KDLESHKYKQ AAKVLGVDVN DILAATRIIA ELDPKPGRVF 
GSDDVQYISA DIFVHKVGDE YVVMLNDEGM PNLRINPIYA PEAKSSRPVD KVAEDYIGEK 
MRSALWLIKS IQQRQRTIFK VAKSIVKFQR DFLDRGIEHL RPLVLRDIAE DIGMHESTIS 
RVTTNKYMQT PQGLFELKYF FNSGISTGEG DFIASESVKS KIKELVDNED SKRPYSDQRL 
AELLSDHNIV IARRTVTKYR EMLRIGSSSE RKKHF