Gene AnaeK_2641 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	AnaeK_2641
Symbol
ID	6786172
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anaeromyxobacter sp. K
Kingdom	Bacteria
Replicon accession	NC_011145
Strand	+
Start bp	2947000
End bp	2947968
Gene Length	969 bp
Protein Length	322 aa
Translation table	11
GC content	71%
IMG OID	642764107
Product	RNA polymerase, sigma 32 subunit, RpoH
Protein accession	YP_002134995
Protein GI	197123044
COG category	[K] Transcription
COG ID	[COG0568] DNA-directed RNA polymerase, sigma subunit (sigma70/sigma32)
TIGRFAM ID	[TIGR02392] alternative sigma factor RpoH [TIGR02937] RNA polymerase sigma factor, sigma-70 family

Plasmid Coverage information

Num covering plasmid clones	3
Plasmid unclonability p-value	0.0535725
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCGGACG AGACGCGTCA CCGCTCCACG AAGGGCCGCC CGGCACTCCC GGCCGCCGGG 
GAGGCGCGCG ACCGCTCCGA GGGCGGGCTG GTCCGCTACG ACCCGCTCCG CGCGTACATG 
GCCGAGGTGG CGCGCCACCC GGTGCTCTCG CGGGACGAGG AGCACGCGCT CGCGGTCCAG 
TACCGCGAGA CCGGCGACGT GGACGCCGCC TACCGGCTGG TCGCGTCGAA CCTGCGACTG 
GTGGTGAAGA TCGCCCACGA GTACCGCCGC ACCGCGTTCC AGCTCCTGGA TCTCGTCCAG 
GAGGGCAACC TGGGGCTCAT GCAGGCGGTG AAGAAGTACG ACCCGTGGAA GGGCGTGAAG 
CTCTCGTCCT ACGCGGCCTG GTGGATCCGC GCGTACATCA TCCGCTTCAT CATGGAGAAC 
TGGCGGCTGG TGAAGCTCGG GACCACCCAG GCGCAGCGCA AGCTGTTCTT CAACCTCTCC 
AAGGAGCGCG AGAAGCTGCT CGCGCGCGGC ATCGAGCCGA CGCCGCGGCT GCTCGCGAAG 
AACCTCCAGG TCGAGGAGAA GGACGTGGAG GAGATGAGCG CGCGCATGGC CGCGGACGAC 
CTCTCGCTGG ACGCGCCGGT CGGCACCGAG GGCGACGACG GCCGCCAGAA CCGCCTCGAC 
CGGCTGGCCG ACGACGGCGG CCCGTCCCCC GACGCCGCGC TCGGCGACGA GCAGCTCCGG 
CGGATCTTCC GCGAGAAGCT GGACGCGTTC TCCGGGACGC TCACCGACGA GAAGGAGCGG 
TACATCTTCG AGCACCGCCT CCTGCCGCCC GACGGCACGC CGCCGCTCAC GCTGCAGGAG 
GTGGGGGACC ACTTCCGGCT CACCCGCGAG CGCGCCCGCC AGATCGAGGC CAAGCTGACC 
GGGCGGCTGC GCGAGTTCCT CCGCGCCGAG ATCCCGGACT TCGAGCTGCT CGGGCCGCCC 
GAGACCTGA

Protein sequence

MSDETRHRST KGRPALPAAG EARDRSEGGL VRYDPLRAYM AEVARHPVLS RDEEHALAVQ 
YRETGDVDAA YRLVASNLRL VVKIAHEYRR TAFQLLDLVQ EGNLGLMQAV KKYDPWKGVK 
LSSYAAWWIR AYIIRFIMEN WRLVKLGTTQ AQRKLFFNLS KEREKLLARG IEPTPRLLAK 
NLQVEEKDVE EMSARMAADD LSLDAPVGTE GDDGRQNRLD RLADDGGPSP DAALGDEQLR 
RIFREKLDAF SGTLTDEKER YIFEHRLLPP DGTPPLTLQE VGDHFRLTRE RARQIEAKLT 
GRLREFLRAE IPDFELLGPP ET