Gene Namu_3785 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Namu_3785
Symbol
ID	8449404
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nakamurella multipartita DSM 44233
Kingdom	Bacteria
Replicon accession	NC_013235
Strand	+
Start bp	4151142
End bp	4152146
Gene Length	1005 bp
Protein Length	334 aa
Translation table	11
GC content	69%
IMG OID	645042836
Product	RNA polymerase sigma factor SigB
Protein accession	YP_003203072
Protein GI	258653916
COG category	[K] Transcription
COG ID	[COG0568] DNA-directed RNA polymerase, sigma subunit (sigma70/sigma32)
TIGRFAM ID	[TIGR02937] RNA polymerase sigma factor, sigma-70 family

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	0.0872543
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCACGA CCGCGAGCAC CACCACCACC GCGACCACGG CGACTGCCGC GACCACGCGC 
ACCGTCAGCC ACGACGAGGA CCTGGACGCC CAGGGCCCCT CCGCCGACCT GGTCCGCGTG 
TACCTCAACG GCATCGGCAA GACCGCGCTG TTGACGGCCG AGCAGGAAGT CGAGCTGGCC 
AAGCGGATCG AGGCCGGCGT GTTCGCCGCG CACGTGCTGG AGTCCGACGT CGAGATGTCC 
CCGCAGCGCC GCAAGGATCT GCGGATGGTC GTGCGCGACG GCGGCCGGGC CCGCAACCAC 
CTGCTGGTGG CCAACCTGCG CCTGGTGGTC TCGCTGGCCA AGCGGTACAC CGGCCGCGGC 
ATGCCGCTGC TGGACCTGAT CCAGGAGGGC AACCTGGGCC TGATCCGCGC GGTCGAGAAG 
TTCGATTACA CCAAGGGTTT CAAATTCTCC ACGTACGCCA CCTGGTGGAT CCGGCAGGCG 
ATCTCGCGCG GCATGGCCGA TCAGGGTCGC ACCATCCGGC TGCCCGTCCA CCTGGTCGAG 
CAGGTCAACA AGCTCTCCCG GCTCAAGCGG GAACTGCACC AGCAGCTGGG CCGGGACGCG 
ACGCTGGCCG AGTTGGCCCA CGAGTCGGGC ATCCCCGAGG AGAAGATCGC CGATCTGCTC 
GACCACGCGC GTGACCCGGT GAGCCTGGAC ATGCCGGTCG GGTCCGACGA GGAGGCGCCG 
CTGGGCGACT TCATCGAGGA CAGCGAATCC ACCTCGGCCG AGGCCGCGGT GGTCGCCGGA 
TTCATGCACG ACGACATCAA CCGGGTCCTG CGCACGCTGG ACGACCGCGA GCAGACCGTC 
GTGCGGCTGC GGTACGGGCT CGACGACGGC CGGCCGCGCA CGCTCGACGA GATCGGCCGG 
CACTTCGGCA TCTCCCGCGA GCGGGTGCGG CAGATCGAGC GCGACTCGAT GGCCAAACTG 
CGCGTCGGTG ATCGTTCCGA GGTGCTGCGC TCGTACGCCA GCTGA

Protein sequence

MTTTASTTTT ATTATAATTR TVSHDEDLDA QGPSADLVRV YLNGIGKTAL LTAEQEVELA 
KRIEAGVFAA HVLESDVEMS PQRRKDLRMV VRDGGRARNH LLVANLRLVV SLAKRYTGRG 
MPLLDLIQEG NLGLIRAVEK FDYTKGFKFS TYATWWIRQA ISRGMADQGR TIRLPVHLVE 
QVNKLSRLKR ELHQQLGRDA TLAELAHESG IPEEKIADLL DHARDPVSLD MPVGSDEEAP 
LGDFIEDSES TSAEAAVVAG FMHDDINRVL RTLDDREQTV VRLRYGLDDG RPRTLDEIGR 
HFGISRERVR QIERDSMAKL RVGDRSEVLR SYAS