Gene Mjls_2174 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mjls_2174
Symbol
ID	4877894
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium sp. JLS
Kingdom	Bacteria
Replicon accession	NC_009077
Strand	-
Start bp	2271209
End bp	2272651
Gene Length	1443 bp
Protein Length	480 aa
Translation table	11
GC content	69%
IMG OID	640139471
Product	RNA polymerase sigma factor
Protein accession	YP_001070451
Protein GI	126434760
COG category	[K] Transcription
COG ID	[COG0568] DNA-directed RNA polymerase, sigma subunit (sigma70/sigma32)
TIGRFAM ID	[TIGR02393] RNA polymerase sigma factor RpoD, C-terminal domain [TIGR02937] RNA polymerase sigma factor, sigma-70 family

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.512894
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.00228971
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

GTGGCAGCGA CAAAGGCAAG CCCGGCAACC GAAGAGCCGG TGAAGCGCAC CGCTACCAAG 
ACCCCCGCGA AGAAGACCGC CGCGGCGAAG GCCCCAGCCA AACGCGCGGC CAAGGGTACG 
GCGACGACCC GCGGCCCGGC CAAGAAGGAC GGCGCCGCCC CGCGCGGTCG TGGCAAGAAG 
TCCACCGCAC CCGAGGCCGG TGCCGCCGAC GCCCTCGCCG ACGACGACCT CGACACCGAC 
GACACCCTCG AGGCCGAACC GGATATCGAC GTCGACGACG CCGACCTGGA CCTCGAGGAT 
CTCGACACCG ACGACGACTC GTCCGACGAC GGCGACGACG CCGACACCCC CGACGCCAAG 
GTCAAGGCCG CCCCCAAGGG CGGCGCGGTG CCCGCCGCCC CCGCCACCGA GGACGAGGAG 
ATCGCCGAGC CCTCCGAGAA GGACAAGGCC TCCGGCGACT TCGTCTGGGA CGAGGAGGAG 
TCAGAGGCGC TGCGGCAGGC CCGCAAGGAC GCCGAGCTCA CCGCCTCCGC CGACTCGGTG 
CGCGCGTATC TCAAGCAGAT CGGCAAGGTG GCGCTGCTCA ACGCCGAGGA GGAAGTCGAG 
CTCGCCAAGC GCATCGAGGC CGGTCTGTTC GCCACCCAGA AGCTGGCCGA ACTCGCCGAA 
AAGGGTGAGA AGCTGCCGGT GCAGCAGCGC CGCGACATGC AGTGGATCTG CCGCGACGGC 
GACCGCGCCA AGAACCACCT GCTGGAGGCG AACCTCCGCC TGGTGGTGTC GCTGGCCAAG 
CGCTACACCG GCCGTGGCAT GGCGTTCCTG GACCTCATCC AGGAGGGCAA CCTCGGTCTG 
ATCCGCGCGG TCGAGAAGTT CGACTACACC AAGGGTTACA AGTTCTCCAC CTACGCCACC 
TGGTGGATCC GGCAGGCGAT CACCCGCGCG ATGGCCGACC AGGCGCGCAC CATCCGCATC 
CCGGTGCACA TGGTCGAGGT CATCAACAAG CTGGGCCGCA TCCAGCGCGA GCTGCTCCAG 
GACCTGGGTC GCGAACCCAC GCCCGAAGAG CTCGCCAAGG AGATGGACAT CACGCCGGAG 
AAGGTGCTGG AGATCCAGCA GTACGCGCGT GAGCCGATCT CGCTGGACCA GACGATCGGC 
GACGAGGGCG ACAGCCAGCT CGGCGACTTC ATCGAGGACT CCGAGGCCGT GGTGGCCGTG 
GACGCGGTCT CGTTCACGCT TCTGCAGGAT CAGCTGCAGT CGGTGCTGGA GACGCTGTCG 
GAGCGCGAGG CCGGCGTGGT ACGGCTGCGG TTCGGCCTCA CCGACGGCCA GCCGCGCACG 
CTCGACGAGA TCGGCCAGGT CTACGGCGTC ACGCGGGAAC GCATCCGCCA GATCGAGTCG 
AAGACGATGA GCAAGCTCCG GCACCCCAGC CGGTCGCAGG TGCTGCGCGA CTACCTCGAC 
TGA

Protein sequence

MAATKASPAT EEPVKRTATK TPAKKTAAAK APAKRAAKGT ATTRGPAKKD GAAPRGRGKK 
STAPEAGAAD ALADDDLDTD DTLEAEPDID VDDADLDLED LDTDDDSSDD GDDADTPDAK 
VKAAPKGGAV PAAPATEDEE IAEPSEKDKA SGDFVWDEEE SEALRQARKD AELTASADSV 
RAYLKQIGKV ALLNAEEEVE LAKRIEAGLF ATQKLAELAE KGEKLPVQQR RDMQWICRDG 
DRAKNHLLEA NLRLVVSLAK RYTGRGMAFL DLIQEGNLGL IRAVEKFDYT KGYKFSTYAT 
WWIRQAITRA MADQARTIRI PVHMVEVINK LGRIQRELLQ DLGREPTPEE LAKEMDITPE 
KVLEIQQYAR EPISLDQTIG DEGDSQLGDF IEDSEAVVAV DAVSFTLLQD QLQSVLETLS 
EREAGVVRLR FGLTDGQPRT LDEIGQVYGV TRERIRQIES KTMSKLRHPS RSQVLRDYLD