Gene Mjls_3334 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mjls_3334
Symbol
ID	4879046
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium sp. JLS
Kingdom	Bacteria
Replicon accession	NC_009077
Strand	+
Start bp	3494350
End bp	3496002
Gene Length	1653 bp
Protein Length	550 aa
Translation table	11
GC content	71%
IMG OID	640140635
Product	stage II sporulation E family protein
Protein accession	YP_001071603
Protein GI	126435912
COG category	[K] Transcription [T] Signal transduction mechanisms
COG ID	[COG2208] Serine phosphatase RsbU, regulator of sigma subunit
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	0.231097
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGCGCGG ACGGTCCCAT CGGCGTCGCC ATGGGTCTCG ACGCCGCGTG GTCGTCCATC 
CCCCACCCGG TGATCGTCGT GACCAGCGAC GGAGTGGTCC GCGCGGTCAG CACCTCGACG 
CATTCGGTGC TGCCGTCGGC GATACCCGGC TCGGATCTGG ACGACGTCGC TCCCCCGTGG 
TTGGCGCAGG CACACCGCCG GCTGGTCCAA CGACTCGGCA CACCCGACGC CGACGACGCT 
GCCGCATCCG GCAGCCTGCA CGGCAAACGT TTCGAGGCCC GCCCGACCGT GCTCGACGGT 
CAGATCGCCT GGTGGTTGGT CGAGGACGCC GGCCGCGAGC TGTGGGATAC GAAGCAGGCC 
CTGACCCGGG AACAGGCGCG CACCTCGTTC CTCGGCGAGG CCTCGGCGGT GCTGATGGCC 
ACCCTCAACG TCGACCGCTG CATGTCGGCG ACCGTCCACC TGGCGGTGCG GCACCTCGCC 
GACGCGGCGT CGGTCGTCGC CCCGGTCACC GGCAACCGGT TGCCGGTGGT GTGTGGTGAC 
CGCGGCGCGG TGGAGCAGCG CACGGTCGAG GCGGATCCCT CGGATGTGCC GGGGCTCAGT 
GAGGCGCTGC GCGGCTTCCC ACCGGTGCCG TCACGGTGGC TCGATCCGGC CGCACTGCCC 
GAGTGGCTGG TCCCGTCGAC GTTCGACGGT CCGGTGGGGT CGGTGCTGAT CACCCCGCTG 
CCCGGCCTCG GCGTGCCGGC CGGGGCGCTG GTACTGCTGC GGCGGGCATC CGAACCGGTC 
TTCGGAGAGG ACGACGAGCT GTCCGCGCGG CTGTTCGCCG CACGTGCCGG TGCGGCCCTG 
TCCACGGCGG GGCTCTACGC CGAACAGTCG GCGATCACCC GCACACTGAT GCGCGACCTC 
GTCCCGCCCC AGCTTCGCCG GCTGCACGGC TTCGAACTGG CCGGCGGGTA TCGCGCCTCG 
GAGGACCATC AGATCGTCGG CGGCGACTTC TACGACGTCC ACCCCGGCGC CACCCCCGAG 
GACGACACGT TGGTCGTACT CGGCGACGTA TGCGGCAAGG GTCTCGAGGC CGCGGTCCTG 
ACCGGCAAGA TCCGCAACAC ACTCCAGGCG CTGGCGCCGC TGGCCCAGGA CCACGGCGGT 
GTGCTCAGGT TGCTCAACAG CGCCCTGCTC TCGGCCGACC ACACACGCTT CGCCACCCTG 
GTCCTGGCAT CGGTGGCGCG CCGCGACGGT CAGGTGGTGC TGCGATTGAC CAGCGCCGGG 
CACTGTGCGC CGTTGATCGT GCGCAGCGAC GGGCGGGTCG AGGAGGCCGA CACCCGCGGT 
CAACTGGTGG GTGTGCTGGA GCAGATCCAG GCCCGCACAT TCGAGACGGT GCTGGCGCCG 
GGTGAGACGT GCGTCCTCTA CACCGATGGT GTGACCGAGG CGTGGGGCGG ACCGCTCGGT 
ACCGACATGT TCGGTGAGCA GCGCCTCGCA GCCGCCCTCG AGGAGTGCGC GGGGATGCCC 
GCCGAAGCCG TGGTCGAACG GATCATGATG CTCACGACGC AGTGGGTGCG TCGCCGCGAG 
CACGACGACA TCGCCGTCGT CGCCATCACC GCCCCACGCC GGACGCACCT CAGCGCGGTC 
GACGGCCACA CCGCCGGGAG GTACACCGCT TGA

Protein sequence

MGADGPIGVA MGLDAAWSSI PHPVIVVTSD GVVRAVSTST HSVLPSAIPG SDLDDVAPPW 
LAQAHRRLVQ RLGTPDADDA AASGSLHGKR FEARPTVLDG QIAWWLVEDA GRELWDTKQA 
LTREQARTSF LGEASAVLMA TLNVDRCMSA TVHLAVRHLA DAASVVAPVT GNRLPVVCGD 
RGAVEQRTVE ADPSDVPGLS EALRGFPPVP SRWLDPAALP EWLVPSTFDG PVGSVLITPL 
PGLGVPAGAL VLLRRASEPV FGEDDELSAR LFAARAGAAL STAGLYAEQS AITRTLMRDL 
VPPQLRRLHG FELAGGYRAS EDHQIVGGDF YDVHPGATPE DDTLVVLGDV CGKGLEAAVL 
TGKIRNTLQA LAPLAQDHGG VLRLLNSALL SADHTRFATL VLASVARRDG QVVLRLTSAG 
HCAPLIVRSD GRVEEADTRG QLVGVLEQIQ ARTFETVLAP GETCVLYTDG VTEAWGGPLG 
TDMFGEQRLA AALEECAGMP AEAVVERIMM LTTQWVRRRE HDDIAVVAIT APRRTHLSAV 
DGHTAGRYTA