Gene Mjls_2939 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mjls_2939
Symbol
ID	4881536
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium sp. JLS
Kingdom	Bacteria
Replicon accession	NC_009077
Strand	+
Start bp	3060682
End bp	3062172
Gene Length	1491 bp
Protein Length	496 aa
Translation table	11
GC content	69%
IMG OID	640140234
Product	deoxyribodipyrimidine photolyase-related protein
Protein accession	YP_001071209
Protein GI	126435518
COG category	[R] General function prediction only
COG ID	[COG3046] Uncharacterized protein related to deoxyribodipyrimidine photolyase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.119687
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGACCGGTA CGCGTGACGA CACCCCACTG TGGCTCTTCG CCGACCAACT CGGCCCGGCC 
GTCCACGGCG GCGAGCACGC CCACCGCGAC GTGCTGCTCA TCGAGGCCGA CCACGCCCTG 
CGCAAGCGCC GCTACCACCG CCAGAAACTG CACATCGTGC TGTCCGCGCT GCGCCACGCC 
GACCGCGACC TCGGCGACCG CGCCACCCTC CTCCGCTCCG AGACCTACAC CGACGCGCTC 
GAACGCTACG GCCGGCCCGT CCTCGTCCAC GAGCCGACGT CCTTCGCCGC CGAGAGGTTC 
GTCCACCGCC TCAAACAGCG TGGCCTCGTC GCCGACATCC TGCCCACCCC GACATTCGCG 
TTGCCGCGCA AGGACTTCGA ACAGTGGGCC GGGAACCGCA CCCGGTTCCG CATGGAGGAC 
TTCTACCGCG ACCAACGCCG CCGCTTCGAC GTCCTGATGA GCGGGGCCGA TCCCGTCGGC 
AACCGGTGGA ACTACGACGA GGAGAACCGC CACTCCCCAC CGAAGAAGCG GCGCACCCTC 
GACGTGCCCG CGCCGTACAA GCCCCGCGAG GACGACATCG ACGAAGAGGT CCGCCGCGAC 
CTCGACCGGA TGGACCTCGA CACCGTCGGC GCCGACGGCC CCCGCCTGTT CGCCGTCACA 
CCCGCCGAAG CCAAACGCGC CCTCACCCGC TTCATCGAGC ACCGCCTGCC GACCTTCGGC 
GACTACGAGG ACGCGATGAT GGGCGAGGAC TGGGCGATGT CGCACTCACT GTTGTCGGTG 
CCGCTCAACC TCGGCGTGCT CCACCCCCTC GACGCTGTGT ACGCCGCCGA ACAGGCCTAC 
CGCGACGGGA CCGCGCCGCT GGCTGCCGTC GAGGGGTTCA TCCGCCAGAT CCTCGGCTGG 
CGCGAGTACA TGTGGCATCT CTACTGGCAT TTCGGCGAGC GGTACGTCGA CAGCAACGAA 
CTCGACGCCA GGACACCGCT TCCGGACTGG TGGGCCGACC TCGACGCCGA CGCCGTGACC 
GCCGAATGCC TGCGCCACGC GCTGATGGGG CTTCGTGACC GGGGCTGGAC GCACCACATC 
CAGCGGCTGA TGATCCTCGG CAGCCACGCC CTGCAGCGCG GATACCACCC TCGCGAACTC 
ACCGAGTGGT ACGCCACCGC CTACGTCGAC GGCTTCCGCT GGGTCATGCC CACCAACGTC 
GTCGGGATGA GCCAGCACGC CGACGGTGGC ATGCTCGCCA CCAAGCCGTA CACCTCCGGC 
GGCGCCTACA TCAACAAGAT GAGCGACCAC TGCGGCGACT GCGCCTACGA CCCGCGTAAA 
CGCCTCGGCG AGGACGCCTG CCCGTTCACG GCCGGCTACT GGGCCTTCGT GCACCGCCAC 
CGCGACCGGC TCGAGCGCAA CATGCGCACC CGCCGGGCGG TACAGGGGTT GAACCGGCTC 
GGCGACCTCG AGGACGTCCT CGCCCAGGAG GACAAGCGCA CACGGTTCTA G

Protein sequence

MTGTRDDTPL WLFADQLGPA VHGGEHAHRD VLLIEADHAL RKRRYHRQKL HIVLSALRHA 
DRDLGDRATL LRSETYTDAL ERYGRPVLVH EPTSFAAERF VHRLKQRGLV ADILPTPTFA 
LPRKDFEQWA GNRTRFRMED FYRDQRRRFD VLMSGADPVG NRWNYDEENR HSPPKKRRTL 
DVPAPYKPRE DDIDEEVRRD LDRMDLDTVG ADGPRLFAVT PAEAKRALTR FIEHRLPTFG 
DYEDAMMGED WAMSHSLLSV PLNLGVLHPL DAVYAAEQAY RDGTAPLAAV EGFIRQILGW 
REYMWHLYWH FGERYVDSNE LDARTPLPDW WADLDADAVT AECLRHALMG LRDRGWTHHI 
QRLMILGSHA LQRGYHPREL TEWYATAYVD GFRWVMPTNV VGMSQHADGG MLATKPYTSG 
GAYINKMSDH CGDCAYDPRK RLGEDACPFT AGYWAFVHRH RDRLERNMRT RRAVQGLNRL 
GDLEDVLAQE DKRTRF