Gene Mkms_3149 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mkms_3149
Symbol
ID	4610984
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium sp. KMS
Kingdom	Bacteria
Replicon accession	NC_008705
Strand	-
Start bp	3296821
End bp	3297963
Gene Length	1143 bp
Protein Length	380 aa
Translation table	11
GC content	72%
IMG OID	639792820
Product	RNA polymerase ECF-subfamily sigma factor
Protein accession	YP_939133
Protein GI	119869181
COG category	[K] Transcription
COG ID	[COG4941] Predicted RNA polymerase sigma factor containing a TPR repeat domain
TIGRFAM ID	[TIGR02937] RNA polymerase sigma factor, sigma-70 family

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	0.328513
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGCTGGCCG CCCTCGCGGC GCCCACCGGC GACATCGCCG CGGCCGAGGA CGCGCTCGCC 
GATGCCTTCG AACGCGCGCT CCGGAGATGG CCGGTCGACG GTATCCCGGC CGAACCCGCC 
GCCTGGGTGA TCACCGTCGC CCGCAACAGA TTGCGCGACC GCTGGCGCTC GGCCGGTCAC 
CGCAGAGCCG CTCGTCTCGA CGAGAACCTC GACGTGACAG CGGAATCCGT CGACTGGCCG 
GCCATCCCGG ACAAACGCCT GGAGCTCATG CTGGTCTGTG CGCATCCCTC GGTGGCGGTC 
AACGTCCGTA CGCCGCTGAT GCTGCAGGTG GTCATGGGTG TCGACGCGGC GGCGATCGCC 
GAGGCGTTCG CCGTCGAACC GGCGACCATG GCGCAGCGGC TCGTACGGGC CAAGCGGCGT 
ATCCGCGACA CGGGTGTGCC ATTCACCCTG CCGGAACGTG ACGATCTGGC CGAGCGGCTG 
CCCGCCGTGC TCGAATCGGT CTACGGCGTC TATGCCATCG ACTGGCAGCG CGGCCCACCC 
GACGACCCGG GGGATTCGTT GGCCGCCGAG GCGTTGCACC TGACCGCCCT GCTGACCGAG 
TTGCTGCCCG CCGATCCGGA GGTGCTCGGC CTGGCCGCGC TGGTGTGTTT CGGCGAGGCG 
CGCCGCCCCG CGCGGCGTGG GGTCGAGGGC GCGTTCGTCG GCCTCGACGA TCAGGACAGT 
GGGCGGTGGG ACCACGAGTT GATCGCCCGG GCCGAGGATC TGCTGCGGCG CGCGCACACC 
CACCGGCGGC CGGGCCGGTT CCAGTACGAG GCGGCCATCC ACTCGGCACA CTGTCACCGC 
CCGGTGGATC GGCGGGCGCT GCGCAAGCTC TATCTGGCCC TGCTGCGGGT GGCGCCGTCA 
CTCGGTGCGG CGGTGGCGCT GGCGGCCCTC GACGGCGAGA TCGACGGGCC GGACGCCGGT 
CTGCGGGCAC TCGCGGCGAT CGATGACCCT GCGCTCGACC GGTTTCAACC GGCGTGGACC 
ACCCGCGCAC ACCTTCTCGA GCGCGCGGGC CGAACGGCCG AGGCAAATAT CGCCTACCAG 
CGGGCACTCG CGATCACCAG CAACCCCGCA CTGAGAGCGC ATCTACGGCA ACGCCTGCGG 
TGA

Protein sequence

MLAALAAPTG DIAAAEDALA DAFERALRRW PVDGIPAEPA AWVITVARNR LRDRWRSAGH 
RRAARLDENL DVTAESVDWP AIPDKRLELM LVCAHPSVAV NVRTPLMLQV VMGVDAAAIA 
EAFAVEPATM AQRLVRAKRR IRDTGVPFTL PERDDLAERL PAVLESVYGV YAIDWQRGPP 
DDPGDSLAAE ALHLTALLTE LLPADPEVLG LAALVCFGEA RRPARRGVEG AFVGLDDQDS 
GRWDHELIAR AEDLLRRAHT HRRPGRFQYE AAIHSAHCHR PVDRRALRKL YLALLRVAPS 
LGAAVALAAL DGEIDGPDAG LRALAAIDDP ALDRFQPAWT TRAHLLERAG RTAEANIAYQ 
RALAITSNPA LRAHLRQRLR