Gene Namu_4893 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Namu_4893
Symbol
ID	8450523
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nakamurella multipartita DSM 44233
Kingdom	Bacteria
Replicon accession	NC_013235
Strand	+
Start bp	5456298
End bp	5457302
Gene Length	1005 bp
Protein Length	334 aa
Translation table	11
GC content	72%
IMG OID	645043931
Product	RNA polymerase factor sigma-70
Protein accession	YP_003204156
Protein GI	258655000
COG category	[K] Transcription
COG ID	[COG1595] DNA-directed RNA polymerase specialized sigma subunit, sigma24 homolog
TIGRFAM ID	[TIGR02937] RNA polymerase sigma factor, sigma-70 family [TIGR02960] RNA polymerase sigma-70 factor, TIGR02960 family

Plasmid Coverage information

Num covering plasmid clones	52
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCGAAC TCGTCACCGA TCAGGCCCCG GGGCGGACCG CCGGACCCGG CCGGGCCGAG 
CTGGAACGCC GGCTGGAGGA CCACCGGCGC GAGCTCGGCG GGTACTGCTA CCGGATGCTG 
GGCGCCGCGT TCGAGACCGA CGACGCCGTC CAGGACACGA TGGTGCGGGC CTGGCGAGCC 
CTGGACAAGT TCGACGGGCG GTCCTCGCTG CGCACCTGGC TGTACCGCAT CGCCACCAAC 
GTGTGCCTGG ATCTGCTGAG CAGCCGCAAC CGGCGCGCCC TGCCGATGGA CTTCGGGCCG 
GCGTCGCCCC CGGTCGCCGA ATCGCTGGGT CAACCGCATC CGGAGGCCAC CTGGATCCAG 
CCGATGCCGG ACGGCGAGGT ACTGACCGGC ACCGCGGACC CGGCCGATCT GGCCGTGCAG 
AAGGACTCGG TCCGGCTGGC CTTCATTGCC GCCCTGCAGC ACCTGCCGCC CCGCCAGCGG 
GCCGTGCTCA TCCTGCGCGA GGTGCTGCGC TGGAGCGCGG CGGAGGTGGC CGACCTGCTG 
GACAGCACCG TCGCCTCGGT CAACAGCGCA CTCCAGCGGG CCCGGGCCAC CCTGGCCGCC 
GTCGACCCGG CGGCCGGGAC CCACGCCGAC CCGATGGACG AGGCGCAGAA GGGCCTGCTG 
GCCGATTACG TCAAGGCCTT CACCAGCTAC GACATCGACG CGCTGGTGCT GCTGCTGCGG 
CAGGACGCCA CCGCGTCCAT GCCGCCGTTC GCGCTCTGGC TGTCCGGGCG GGACGACATC 
GCCGCCTGGC ACCTGGGGCC GGGCGCGGCC TGCCGGCAGT CCAAGCTGAT CGCGCTGGAG 
GTCAACGGAT CGCCGGCGTT CGCGGCTTAC AAGCTCGCCG CCGACGGCAC CCACCGGCCC 
TTCTCCATCC AGGTGCTCGA CCTGGACGGG GACAAGATCG CCCGGATCAC CTACTTCCTG 
GAGACCTCGC TGTTCGCCCG GTTCGGGCTG CCCGCGTCGC TGTAG

Protein sequence

MTELVTDQAP GRTAGPGRAE LERRLEDHRR ELGGYCYRML GAAFETDDAV QDTMVRAWRA 
LDKFDGRSSL RTWLYRIATN VCLDLLSSRN RRALPMDFGP ASPPVAESLG QPHPEATWIQ 
PMPDGEVLTG TADPADLAVQ KDSVRLAFIA ALQHLPPRQR AVLILREVLR WSAAEVADLL 
DSTVASVNSA LQRARATLAA VDPAAGTHAD PMDEAQKGLL ADYVKAFTSY DIDALVLLLR 
QDATASMPPF ALWLSGRDDI AAWHLGPGAA CRQSKLIALE VNGSPAFAAY KLAADGTHRP 
FSIQVLDLDG DKIARITYFL ETSLFARFGL PASL