Gene Msil_2307 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Msil_2307
Symbol
ID	7090291
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylocella silvestris BL2
Kingdom	Bacteria
Replicon accession	NC_011666
Strand	-
Start bp	2500914
End bp	2501825
Gene Length	912 bp
Protein Length	303 aa
Translation table	11
GC content	62%
IMG OID	643465630
Product	RNA polymerase, sigma 32 subunit, RpoH
Protein accession	YP_002362600
Protein GI	217978453
COG category	[K] Transcription
COG ID	[COG0568] DNA-directed RNA polymerase, sigma subunit (sigma70/sigma32)
TIGRFAM ID	[TIGR02392] alternative sigma factor RpoH [TIGR02937] RNA polymerase sigma factor, sigma-70 family

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	27
Fosmid unclonability p-value	0.00328793
Fosmid Hitchhiker	No
Fosmid clonability	decreased coverage

Sequence

Gene sequence

ATGGCTGCTG CGCTGCCAAT GATCTCGGGT GAGAGTGGTC TCGCCCGTTA TTTGAACGAA 
ATCAGACGGT TCCCCATGCT GGAGCCGCAA CAGGAATATA TGCTGGCCAA GCGCTGGCGC 
GAGCACGCCG ATTCCGACGC CGCGCATAAG CTTGTCACGT CCCACCTTCG CCTCGTCGCC 
AAGATCGCGA TGGGCTATCG CGGCTATGGC CTGCCGATCA GCGAAGTCGT CTCGGAAGGC 
AATGTCGGTC TTATGCAGGC CGTCAAGCGC TTTGAACCCG AGAAAGGGTT CCGCCTAGCC 
ACCTATGCCA TGTGGTGGAT CCGCGCGTCG ATTCAAGAGT ATATCCTGCG CTCGTGGTCG 
CTTGTGAAGA TGGGCACCAC CGCCAGCCAG AAGAAACTCT TCTTCAATCT TCGCAAGGTG 
AAGAGCCAGA TCTCGGCGCT GGAAGAGGGC GATCTGCGTC CCGAGCACGT CGACAAGATC 
GCGCACCGGC TTGGCGTGTC CAAGCAGGAC GTGATCGACA TGAACCGCCG CATGTCCGGC 
GACGCCTCGC TGAACGCTCC TTTGCGCGAG GAAGGCGAAG GCGAATGGCA GGATTGGCTT 
GTCGATGACA GCGCCAGTCA GGAAAAACTG CTGGTCGACC GCGAAGAGAC GGACAATCGG 
CTCGGCGCCC TGCATACGGC TCTGAACGTG CTGAACGACC GCGAGCGGCG CATTTTCGAG 
GCGCGCCGCC TTGCCGACGA TCCGATGACG CTGGAGGCTC TCTCCGACGA ATTCGACATC 
TCGCGCGAGC GCGTCCGTCA GATCGAAGTT CGCGCCTTTG AAAAGGTGCA GTCGGCCGTC 
AAGGCGGGCG TCGCCCGCGT CGAGGCGGGC GCGCGCAGAG CTCAGATCGC CGGTCCGGCC 
GCGCAAGCCT GA

Protein sequence

MAAALPMISG ESGLARYLNE IRRFPMLEPQ QEYMLAKRWR EHADSDAAHK LVTSHLRLVA 
KIAMGYRGYG LPISEVVSEG NVGLMQAVKR FEPEKGFRLA TYAMWWIRAS IQEYILRSWS 
LVKMGTTASQ KKLFFNLRKV KSQISALEEG DLRPEHVDKI AHRLGVSKQD VIDMNRRMSG 
DASLNAPLRE EGEGEWQDWL VDDSASQEKL LVDREETDNR LGALHTALNV LNDRERRIFE 
ARRLADDPMT LEALSDEFDI SRERVRQIEV RAFEKVQSAV KAGVARVEAG ARRAQIAGPA 
AQA