Gene Mkms_2968 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mkms_2968
Symbol
ID	4610798
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium sp. KMS
Kingdom	Bacteria
Replicon accession	NC_008705
Strand	+
Start bp	3098269
End bp	3099846
Gene Length	1578 bp
Protein Length	525 aa
Translation table	11
GC content	69%
IMG OID	639792634
Product	deoxyribodipyrimidine photolyase-related protein
Protein accession	YP_938952
Protein GI	119869000
COG category	[R] General function prediction only
COG ID	[COG3046] Uncharacterized protein related to deoxyribodipyrimidine photolyase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.278599
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGCGGATTC GTACGCGACA CGCCGAGGAC AGCGTATGGC GTCGCACACT CGAGCCCACC 
CAGCGCCCGC CTCGTAGCCT CGAAGAGGTG ACCGGTACGC GTGACGACAC CCCACTGTGG 
CTCTTCGCCG ACCAACTCGG CCCGGCCGTC CACGGCGGCG AGCACGCCCA CCGCGACGTG 
CTGCTCATCG AGGCCGACCA CGCCCTGCGC AAGCGCCGCT ACCACCGCCA GAAACTGCAC 
ATCGTGCTGT CCGCGCTGCG CCACGCCGAC CGCGACCTCG GCGACCGCGC CACCCTCCTC 
CGCTCCGAGA CCTACACCGA CGCGCTCGAA CGCTACGGCC GGCCCGTCCT CGTCCACGAG 
CCGACGTCCT TCGCCGCCGA GAGGTTCGTC CACCGCCTCA AACAGCGTGG CCTCGTCGCC 
GACATCCTGC CCACCCCGAC ATTCGCGTTG CCGCGCAAGG ACTTCGAACA GTGGGCCGGG 
AACCGCACCC GGTTCCGCAT GGAGGACTTC TACCGCGACC AACGCCGCCG CTTCGACGTC 
CTGATGAGCG GGGCCGATCC CGTCGGCAAC CGGTGGAACT ACGACGAGGA GAACCGCCAC 
TCCCCACCGA AGAAGCGGCG CACCCTCGAC GTGCCCGCGC CGTACAAGCC CCGCGAGGAC 
GACATCGACG AAGAGGTCCG CCGCGACCTC GACCGGATGG ACCTCGACAC CGTCGGCGCC 
GACGGCCCCC GCCTGTTCGC CGTCACACCC GCCGAAGCCA AACGCGCCCT CACCCGCTTC 
ATCGAGCACC GCCTGCCGAC CTTCGGCGAC TACGAGGACG CGATGATGGG CGAGGACTGG 
GCGATGTCGC ACTCACTGTT GTCGGTGCCG CTCAACCTCG GCGTGCTCCA CCCCCTCGAC 
GCCGTGTACG CCGCCGAACA GGCCTACCGC GACGGGACCG CGCCGCTGGC TGCCGTCGAG 
GGGTTCATCC GCCAGATCCT CGGCTGGCGC GAGTACATGT GGCATCTCTA CTGGCATTTC 
GGCGAGCGGT ACGTCGACAG CAACGAACTC GACGCCAGGA CACCGCTTCC GGACTGGTGG 
GCCGACCTCG ACGCCGACGC CGTGACCGCC GAATGCCTGC GCCACGCGCT GATGGGGCTT 
CGTGACCGGG GCTGGACGCA CCACATCCAG CGGCTGATGA TCCTCGGCAG CCACGCCCTG 
CAGCGCGGAT ACCACCCTCG CGAACTCACC GAGTGGTACG CCACCGCCTA CGTCGACGGC 
TTCCGCTGGG TCATGCCCAC CAACGTCGTC GGGATGAGCC AGCACGCCGA CGGTGGCATG 
CTCGCCACCA AGCCGTACAC CTCCGGCGGC GCCTACATCA ACAAGATGAG CGACCACTGC 
GGCGACTGCG CCTACGACCC GCGTAAACGC CTCGGCGAGG ACGCCTGCCC GTTCACGGCC 
GGCTACTGGG CCTTCGTGCA CCGCCACCGC GACCGGCTCG AGCGCAACAT GCGCACCCGC 
CGGGCGGTAC AGGGGTTGAA CCGGCTCGGC GACCTCGAGG ACGTCCTCGC CCAGGAGGAC 
AAGCGCACAC GGTTCTAG

Protein sequence

MRIRTRHAED SVWRRTLEPT QRPPRSLEEV TGTRDDTPLW LFADQLGPAV HGGEHAHRDV 
LLIEADHALR KRRYHRQKLH IVLSALRHAD RDLGDRATLL RSETYTDALE RYGRPVLVHE 
PTSFAAERFV HRLKQRGLVA DILPTPTFAL PRKDFEQWAG NRTRFRMEDF YRDQRRRFDV 
LMSGADPVGN RWNYDEENRH SPPKKRRTLD VPAPYKPRED DIDEEVRRDL DRMDLDTVGA 
DGPRLFAVTP AEAKRALTRF IEHRLPTFGD YEDAMMGEDW AMSHSLLSVP LNLGVLHPLD 
AVYAAEQAYR DGTAPLAAVE GFIRQILGWR EYMWHLYWHF GERYVDSNEL DARTPLPDWW 
ADLDADAVTA ECLRHALMGL RDRGWTHHIQ RLMILGSHAL QRGYHPRELT EWYATAYVDG 
FRWVMPTNVV GMSQHADGGM LATKPYTSGG AYINKMSDHC GDCAYDPRKR LGEDACPFTA 
GYWAFVHRHR DRLERNMRTR RAVQGLNRLG DLEDVLAQED KRTRF