Gene Mjls_2120 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mjls_2120
Symbol
ID	4877840
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium sp. JLS
Kingdom	Bacteria
Replicon accession	NC_009077
Strand	-
Start bp	2221979
End bp	2223046
Gene Length	1068 bp
Protein Length	355 aa
Translation table	11
GC content	70%
IMG OID	640139417
Product	hydrogenase expression/formation protein HypE
Protein accession	YP_001070397
Protein GI	126434706
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0309] Hydrogenase maturation factor
TIGRFAM ID	[TIGR02124] hydrogenase expression/formation protein HypE

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.0569732
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.0990172
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGTGAGA CCCGCGCGGC GATCGACATG GAGAGCTGGG TGTGCCCGGC GCCGCTGCGG 
GATTCGCCGA ACGTCGTGAT GGGTCACGGC GGTGGCGGCG CGATGTCGGG TGAGCTGATC 
GAGCATCTGT TCCTGCCCGC GTTCGGTCCG GCCGCGGACG CGGCGATGGG CGATTCGGCC 
GTCGTCGAAA TCGGCGGGAC CCGGCTGGCG TTCTCCACCG ATTCGTTCGT CGTCAAGCCG 
ATGGTGTTCC CGGGCGGCAC GATCGGCGAG CTGGCGGTCA ACGGCACGGT CAACGACCTC 
GCGATGGCCG GCGCGACGCC GATGGTGCTG TCGACGGCGT TCATCCTCGA GGAAGGCACC 
TCACTCGACG ATCTGGCGCG GGTCGCTCAT GCGGTCGGCA CCGCGGCCTT GGCCGCCGGC 
GTCAAACTCG TCACCGGCGA CACCAAGGTC GTCGATTCCG GGCACGGCGA CGGAATCTAT 
GTGAACACCA CCGGTATCGG GGTGATCGAC CGGCGGGCCG ACATCCGGCC ACAGCGCGCC 
ACCGAGGGCG ACGCGGTCAT CGTCAGCGGC GACATCGGCG TCCACGGGGT CGCCGTTATG 
AGCTGCCGCG AAGGTCTGGA GTTCGCGACC AGCATCGCCA GCGACACCGC GCCCCTGCAC 
GGTCTGGTGG CGGCGATGAT CGAGACCGGC GCCGACATCC ACGCACTTCG CGACCCCACC 
CGCGGCGGGA TGGCCGCCAC TCTGAACGAG ATCGCCAAGG CCGCCGAGGT GGGCATGGTG 
CTCGACGAAC GATCGATTCC GGTGCCACCG GAGGTGCGCG ACGCCTGCGG CCTGCTCGGC 
CTCGATCCGA TGTATGTGGC CAACGAGGGC AAGCTGGTGG CGTTCGTGCC GGCCGCCGAC 
GCCGATCGTG TGGTCGAGGC GATGCGGGCA CACCCGCTGG GCGCCCACGC CGCCGTCATC 
GGCACCTGCG TCTCCGACCA CCCCGGGATG GTCGTCGCCC GCACCGCACT GGGTGGTACG 
CGGGTGGTCG ACCTGCCGAT CGGCGAACAG CTACCCCGGA TCTGTTGA

Protein sequence

MRETRAAIDM ESWVCPAPLR DSPNVVMGHG GGGAMSGELI EHLFLPAFGP AADAAMGDSA 
VVEIGGTRLA FSTDSFVVKP MVFPGGTIGE LAVNGTVNDL AMAGATPMVL STAFILEEGT 
SLDDLARVAH AVGTAALAAG VKLVTGDTKV VDSGHGDGIY VNTTGIGVID RRADIRPQRA 
TEGDAVIVSG DIGVHGVAVM SCREGLEFAT SIASDTAPLH GLVAAMIETG ADIHALRDPT 
RGGMAATLNE IAKAAEVGMV LDERSIPVPP EVRDACGLLG LDPMYVANEG KLVAFVPAAD 
ADRVVEAMRA HPLGAHAAVI GTCVSDHPGM VVARTALGGT RVVDLPIGEQ LPRIC