Gene Mmcs_3089 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mmcs_3089
Symbol
ID	4111921
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium sp. MCS
Kingdom	Bacteria
Replicon accession	NC_008146
Strand	-
Start bp	3268539
End bp	3269681
Gene Length	1143 bp
Protein Length	380 aa
Translation table	11
GC content	72%
IMG OID	638032219
Product	RNA polymerase ECF-subfamily sigma factor
Protein accession	YP_640252
Protein GI	108800055
COG category	[K] Transcription
COG ID	[COG4941] Predicted RNA polymerase sigma factor containing a TPR repeat domain
TIGRFAM ID	[TIGR02937] RNA polymerase sigma factor, sigma-70 family

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.614785
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

TTGCTGGCCG CCCTCGCGGC GCCCACCGGC GACATCGCCG CGGCCGAGGA CGCGCTCGCC 
GATGCCTTCG AACGCGCGCT CCGGAGATGG CCGGTCGACG GTATCCCGGC CGAACCCGCC 
GCCTGGGTGA TCACCGTCGC CCGCAACAGA TTGCGCGACC GCTGGCGCTC GGCCGGTCAC 
CGCAGAGCCG CTCGTCTCGA CGAGAACCTC GACGTGACAG CGGAATCCGT CGACTGGCCG 
GCCATCCCGG ACAAACGCCT GGAGCTCATG CTGGTCTGTG CGCATCCCTC GGTGGCGGTC 
AACGTCCGTA CGCCGCTGAT GCTGCAGGTG GTCATGGGTG TCGACGCGGC GGCGATCGCC 
GAGGCGTTCG CCGTCGAACC GGCGACCATG GCGCAGCGGC TCGTACGGGC CAAGCGGCGT 
ATCCGCGACA CGGGTGTGCC ATTCACCCTG CCGGAACGTG ACGATCTGGC CGAGCGGCTG 
CCCGCCGTGC TCGAATCGGT CTACGGCGTC TATGCCATCG ACTGGCAGCG CGGCCCACCC 
GACGACCCGG GGGATTCGTT GGCCGCCGAG GCGTTGCACC TGACCGCCCT GCTGACCGAG 
TTGCTGCCCG CCGATCCGGA GGTGCTCGGC CTGGCCGCGC TGGTGTGTTT CGGCGAGGCG 
CGCCGCCCCG CGCGGCGTGG GGTCGAGGGC GCGTTCGTCG GCCTCGACGA TCAGGACAGT 
GGGCGGTGGG ACCACGAGTT GATCGCCCGG GCCGAGGATC TGCTGCGGCG CGCGCACACC 
CACCGGCGGC CGGGCCGGTT CCAGTACGAG GCGGCCATCC ACTCGGCACA CTGTCACCGC 
CCGGTGGATC GGCGGGCGCT GCGCAAGCTC TATCTGGCCC TGCTGCGGGT GGCGCCGTCA 
CTCGGTGCGG CGGTGGCGCT GGCGGCCCTC GACGGCGAGA TCGACGGGCC GGACGCCGGT 
CTGCGGGCAC TCGCGGCGAT CGATGACCCT GCGCTCGACC GGTTTCAACC GGCGTGGACC 
ACCCGCGCAC ACCTTCTCGA GCGCGCGGGC CGAACGGCCG AGGCAAATAT CGCCTACCAG 
CGGGCACTCG CGATCACCAG CAACCCCGCA CTGAGAGCGC ATCTACGGCA ACGCCTGCGG 
TGA

Protein sequence

MLAALAAPTG DIAAAEDALA DAFERALRRW PVDGIPAEPA AWVITVARNR LRDRWRSAGH 
RRAARLDENL DVTAESVDWP AIPDKRLELM LVCAHPSVAV NVRTPLMLQV VMGVDAAAIA 
EAFAVEPATM AQRLVRAKRR IRDTGVPFTL PERDDLAERL PAVLESVYGV YAIDWQRGPP 
DDPGDSLAAE ALHLTALLTE LLPADPEVLG LAALVCFGEA RRPARRGVEG AFVGLDDQDS 
GRWDHELIAR AEDLLRRAHT HRRPGRFQYE AAIHSAHCHR PVDRRALRKL YLALLRVAPS 
LGAAVALAAL DGEIDGPDAG LRALAAIDDP ALDRFQPAWT TRAHLLERAG RTAEANIAYQ 
RALAITSNPA LRAHLRQRLR