Gene Mvan_0034 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mvan_0034
Symbol
ID	4644815
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium vanbaalenii PYR-1
Kingdom	Bacteria
Replicon accession	NC_008726
Strand	+
Start bp	41676
End bp	43310
Gene Length	1635 bp
Protein Length	544 aa
Translation table	11
GC content	64%
IMG OID	639803545
Product	N-6 DNA methylase
Protein accession	YP_950891
Protein GI	120401062
COG category	[V] Defense mechanisms
COG ID	[COG0286] Type I restriction-modification system methyltransferase subunit
TIGRFAM ID	[TIGR00497] type I restriction system adenine methylase (hsdM)

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	25
Fosmid unclonability p-value	0.966218
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCGCCGA GAAGGGGCAC GAAAAAGGCT GAGCCACTGC TTCCTTCAAC GATGAAGGAG 
CTGAAGGACA CACTGTGGAA AGCCGCCGAC AAACTGCGCG GATCGCTGTC AGCCAGCCAG 
TACAAGGATG TGATCCTGGG CCTGGTGTTC CTCAAGTACG TCTCCGACGC CTACGACGAA 
CGCCGCGAGG CGATCCGGAC GGAGCTGGAG GCAGACGGCC TCGACGCCGA ACAGATCGAA 
GACCTCATCG AGGATCCCGA GGAGTACCAG GGCTACGGCG TGTTTGTCGT CCCGCCCGGC 
GCGCGGTGGA AGTTCCTGGC GGAGAATGCG AAGGGTTTAC CGGCCGCCGG TGGCGAGCCC 
GCCAAGAACA TCGGTCAGCT GATCGACGAG GCGATGGACG CCGTGATGAA GGCCAACCCG 
ACCCTGCAGG GCACCCTGCC GCGGCTGTAC AACAAGGACA ACATCGACCA GCGCCGGTTG 
GGTGAATTGA TCGACCTGTT CAACAGCGCC CGGTTCAGCC GCCAGGGTGA CGGCCGAGCG 
CGCGACCTGA TGGGCGAGGT CTACGAGTAC TTCCTCGGCA ACTTCGCGCG GGCGGAAGGG 
AAGCGGGGTG GAGAGTTCTT CACCCCGCCG AGCGTGGTGA AGGTGATCGT CGAGGTGCTG 
GAACCGTCGC GCGGGCGGGT GTATGACCCG TGCTGCGGAT CGGGCGGCAT GTTCGTGCAG 
ACCGAGAAGT TCATCTATGA GCACGACGGC GACCCGAAGG AGATCGCCGT CTACGGTCAG 
GAGTCCATCG AGGAGACCTG GCGGATGGCC AAGATGAACC TGGCCATCCA CGGCATCGAC 
AACAAGGGCC TGGGTGCGCG CTGGGGCGAT ACCTTTGCCC GTGACCAGCA TCCCGATGTC 
CAGATGGATT ACGTGCTGGC CAATCCGCCG TTCAACATCA AGGACTGGGC CCGCAACGAG 
GAGGACGCCC GCTGGCGGTT CGGCGTACCG CCGGCCAACA ACGCCAACTA CGCCTGGATC 
CAGCACATCC TGTACAAGCT GGCGTCCGGC GGTAAGGCCG GTGTGGTGAT GGCCAATGGG 
TCGATGTCGT CGAACTCCAA CGGCGAGGGC GATATCCGGG CCCAGATCGT CGAAGCCGAT 
CTGGTGTCAT GCATGATCGC GCTGCCCACC CAGTTGTTTC GCAGCACCGG AATCCCGGTG 
TGCGTGTGGT TCTTCGCCAA GGACAAAACC GCAGGTAAGC AGGGCTCGGT CGACCGGTCG 
GGGCAGGTGC TGTTCATTGA CGCCCGCGAG ATGGGCTACA TGGTCGACCG CGCTGAGCGC 
GCCCTCTCCG ACGACGACAT CGTCAAGATC GGCGACACCT TCCATGCCTG GCGCGGATCG 
GCGTCGGCGG CAGCGAAGGG CGTTGTCTAC CAGGATGTCC CAGGCTTTTG TAAGTCGGCG 
ACCCTAGCCG AAATCAAGGC TGCCGACTAC GCACTGACAC CGGGACGGTA CGTCGGCGCT 
GCGGCCGTCG AGGACGACGG CGAACCGATC GACGAGAAAA TCGCCCGGTT GAAGACGGAA 
CTGCTTGCGG CGTTTGATGA GTCGGCGCGG CTGGAGAAGG TGGTTCGAGA GCAGTTGGAG 
CGGATCGATG CGTGA

Protein sequence

MPPRRGTKKA EPLLPSTMKE LKDTLWKAAD KLRGSLSASQ YKDVILGLVF LKYVSDAYDE 
RREAIRTELE ADGLDAEQIE DLIEDPEEYQ GYGVFVVPPG ARWKFLAENA KGLPAAGGEP 
AKNIGQLIDE AMDAVMKANP TLQGTLPRLY NKDNIDQRRL GELIDLFNSA RFSRQGDGRA 
RDLMGEVYEY FLGNFARAEG KRGGEFFTPP SVVKVIVEVL EPSRGRVYDP CCGSGGMFVQ 
TEKFIYEHDG DPKEIAVYGQ ESIEETWRMA KMNLAIHGID NKGLGARWGD TFARDQHPDV 
QMDYVLANPP FNIKDWARNE EDARWRFGVP PANNANYAWI QHILYKLASG GKAGVVMANG 
SMSSNSNGEG DIRAQIVEAD LVSCMIALPT QLFRSTGIPV CVWFFAKDKT AGKQGSVDRS 
GQVLFIDARE MGYMVDRAER ALSDDDIVKI GDTFHAWRGS ASAAAKGVVY QDVPGFCKSA 
TLAEIKAADY ALTPGRYVGA AAVEDDGEPI DEKIARLKTE LLAAFDESAR LEKVVREQLE 
RIDA