Gene Mjls_3856 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mjls_3856
Symbol
ID	4879566
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium sp. JLS
Kingdom	Bacteria
Replicon accession	NC_009077
Strand	+
Start bp	4079065
End bp	4080555
Gene Length	1491 bp
Protein Length	496 aa
Translation table	11
GC content	72%
IMG OID	640141165
Product	DNA-3-methyladenine glycosylase II / DNA-O6-methylguanine--protein-cysteine S-methyltransferase / transcriptional regulator Ada
Protein accession	YP_001072123
Protein GI	126436432
COG category	[F] Nucleotide transport and metabolism [L] Replication, recombination and repair
COG ID	[COG0122] 3-methyladenine DNA glycosylase/8-oxoguanine DNA glycosylase [COG2169] Adenosine deaminase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.26438
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.00733732
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGTACGACG ATTTCGACCG CTGCTACCGG GCCGTGCAGT CCAAGGACGC GCGGTTCGAT 
GGTTGGTTCG TCACGGCGGT GCTGACGACG CGGATCTACT GCCGCCCAAG CTGTCCCGTC 
CGGCCGCCGT TCGCCCGCAA CGTGCGCTTC TATCCGACCG CCGCGGCCGC TCTGGCGGCG 
GGATTCCGCG CCTGTAAGCG GTGCAGGCCC GACGCGTCGC CCGGTTCTCC CGAGTGGAAC 
GTCCGCGGCG ACGTGGCCGC CAGGGCGATG CGCCTGATCG CCGACGGCAC GGTCGACCGG 
GACGGTGTCA CGGGTCTGGC CGGCCGGCTC GGCTACACCA CGCGGCAGTT GCAGCGCATC 
CTGCAGGCCG AGGTGGGGGC GAATCCGCTG GCGTTGGCCC GTGCGCAGCG GGCACAGACC 
GCACGCGTGC TGATCGAGAC CACCGACCTG CCGTTCTCCG ATGTGGCGTT CGCCGCGGGG 
TTCTCGAGCA TCCGGCAGTT CAACGACACG GTGCGCGCCA CCTCCGCGTG CACCCCGACC 
GCGATGCGGG AGCGGGCGCG ACGCCGCTTC GGGGCGGCCA CCGCCGGCGC GGGGTCGCTG 
GCACTGCGCC TGCCGGTGCG TAGGCCGTTC GCCTACGAAG GGGTGTTCGG GCACCTGGCG 
GCCAGCGCCG TACCGGGTGT CGAGGAGTTC CGTGACGGGG CCTTCCGCCG CACGCTGCGG 
CTTTCGCGGG GCCACGGCAT CGTCGGCCTC ACCCCCCGCG ACGGTCACGT CGACTGCGTG 
CTGCACCTCG AGGACCTTCG GGACCTGTCC AGCGCCATCG CGCGGTGCCG GCGCCTGCTG 
GACCTCGACG CCGACCCGGA GGCCGTCGTC GACGTACTCG GCGCCGACCC GGACCTCACC 
GCGTTGGTGA CGAAGGCGCC CGGGCAGCGC ATCCCGCGCA CTGTCGACGA GGCGGAACTG 
GCCGTGCGGG TGGTTCTGGG CCAACAGGTC TCCCTGAAGG CCGCCCGCAC GCACGCCGCG 
CGGCTCGTCA CCCACTACGG TCGCCCGATC AGCGATCCAC ACGGTGGCCT GACCCGCGTG 
TTTCCCACCG TGGAGGAACT CGCCGACATC GCTGCGCCCC ATCTGGCCGT ACCGCGCAGC 
CGGCAGTCCA CCGTGCGCTC GCTCATCGCG GCACTGGCGT CGGGCGACGT GCGACTCGAT 
CCCGGATGTG ACTGGAACGA GGCACGGGCA CAACTCACCG TACTGCCCGG CATCGGCACA 
TGGACTGCGG AGGTGATCGC GATGCGCGGA CTCGGCGATC CCGACGCCTT CCCCGTCACC 
GATCTGGGCG TGCTCACCGC CGCTCGCCAC CTCGGCCTGG CCGAGGATGC CCGGGCCCTT 
GCAGCGCACG GCGCCCGGTG GCGTCCGTGG CGGGCCTACG CGACGCAGCA CCTGTGGACG 
GCGCTCGATC ATCCGGTCAA CGACTGGCCC CCGAAGGAGA TCCGACAGTG A

Protein sequence

MYDDFDRCYR AVQSKDARFD GWFVTAVLTT RIYCRPSCPV RPPFARNVRF YPTAAAALAA 
GFRACKRCRP DASPGSPEWN VRGDVAARAM RLIADGTVDR DGVTGLAGRL GYTTRQLQRI 
LQAEVGANPL ALARAQRAQT ARVLIETTDL PFSDVAFAAG FSSIRQFNDT VRATSACTPT 
AMRERARRRF GAATAGAGSL ALRLPVRRPF AYEGVFGHLA ASAVPGVEEF RDGAFRRTLR 
LSRGHGIVGL TPRDGHVDCV LHLEDLRDLS SAIARCRRLL DLDADPEAVV DVLGADPDLT 
ALVTKAPGQR IPRTVDEAEL AVRVVLGQQV SLKAARTHAA RLVTHYGRPI SDPHGGLTRV 
FPTVEELADI AAPHLAVPRS RQSTVRSLIA ALASGDVRLD PGCDWNEARA QLTVLPGIGT 
WTAEVIAMRG LGDPDAFPVT DLGVLTAARH LGLAEDARAL AAHGARWRPW RAYATQHLWT 
ALDHPVNDWP PKEIRQ