Gene Mvan_0759 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mvan_0759
Symbol
ID	4646794
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium vanbaalenii PYR-1
Kingdom	Bacteria
Replicon accession	NC_008726
Strand	-
Start bp	800100
End bp	801800
Gene Length	1701 bp
Protein Length	566 aa
Translation table	11
GC content	70%
IMG OID	639804259
Product	type III restriction enzyme, res subunit
Protein accession	YP_951603
Protein GI	120401774
COG category	[K] Transcription [L] Replication, recombination and repair
COG ID	[COG1061] DNA or RNA helicases of superfamily II
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.523445
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	0.362489
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGCGGGCTG ATGCAGCGCC CAGCACCCAG GCGTTGCGGG GCTGGCAACG ACGGGCTCTG 
GTGAAGTACC TGTCGGCCGC TCCTCGTGAT TTCCTCGCGG TGGCCACCCC TGGCGCCGGC 
AAGACCACCT TCGCGCTGCG CATCGTCGCC GAACTGCTCG CCGAAGGCAC CGTCGAGGCC 
GTCACGATCG TCGTGCCCAC CGAGCACCTG AAGATCCAGT GGGCCCAGGC CGCCGCCCGG 
CACGGCATCG CGCTGGACCC GAAATTCTCC AACTCGAACT CGCAGACCTC CTCGGACTAC 
CACGGCGTCG TCGTCACCTA CGCGCAGGTG GCCAGCCACC CGACCCGGCA CCGGGTGCGT 
ACCGAGAACC GCAAGACGCT CGTCGTCTTC GACGAGATCC ACCACGGCGG CGACGCCAAG 
AGCTGGGGCG ACGCCATCCG GGAGGCGTTC GACGACGCGA CCCGCCGGCT CGCGCTGACC 
GGGACGCCGT TCCGCAGCGA CGACAGCCCG ATCCCGTTCG TCAACTACGA GACCGGACCC 
GACGGCTTCG CCCGTTCCAA GGCCGACCAC ACGTACGGCT ACTCCGACGC GCTCGCCGAC 
GGCGTGGTCC GGCCGGTCAT GTTCATGGCG TACTCCGGAG AGGCCCGCTG GCGCGACAGC 
GCGGGCGAGG AACACGCCGC CCGCCTCGGC GAGCCGCTGA CCGCCGAGCA GACGGCGCGG 
GCGTGGAAGA CCGCGCTGGA CCCGAAGGGC GAGTGGATGC CCGCGGTGAT CGCCGCGGCG 
GACAAACGGC TGCAGGGACT GCGTCAGCAC GTGCCCGACG CCGGCGGCAT GATCATCGCC 
TCCGACCAGA CGACCGCCCG CGCGTACGCG GACCTGCTGG TGAAGATCAC CGGTGAAGCG 
CCGACGGTGG TGCTCTCCGA CGACAAGGGC GCCTCCGACC GGATCTCGGA GTATTCGGCG 
GGAACGTCGC GGTGGCTGGT GGCGGTGCGG ATGGTGTCCG AGGGCGTCGA CGTGCCGCGG 
CTGGCCGTCG GGGTGTACGC GACGAGTGCG TCCACGCCGT TGTTCTTCGC GCAGGCGATC 
GGCCGGTTCG TGCGGTCGCG GCGGCCCGGC GAGACCGCCA GCATCTTCCT GCCGTCGGTG 
CCGAATCTGC TGCTGCTGGC CAGTGAGATG GAAGCGCAGC GCAACCATGT GCTGGGCAAG 
CCGCACCGCG AACCGCTCGA GGACCCGCTC GACGCCGAAC TGCGTGAGCA GAAGCGCGAC 
GAACCGGGCG AGGAGGAGAA CAAGATCGAG TACCTCGGCG CCGACGCCGA ACTCGATCAG 
GTGATCTTCG ACGGGTCGTC GTTCGGCACC GCGACGCCGG CGGGCAGCGA CGAGGAGGCC 
GACTACCTCG GCATCCCGGG CCTGCTGGAC GCCGACTCGA TGCGAGACCT GTTGCGGCGC 
AGGCAGGAAG AGCAACTCAC CAAGCGCACC GAATCAGGCT TGGCGGTCCC GAAGACGACG 
CACGGGCAGT TGCGCGATCT GCGCAGCGAA CTCAACACCC TGGTGTCGCT GGCGCATCAC 
CGGACCGGCC GTCCGCACGG CTGGATCCAC AACGAGTTGC GCCGCCGCTG CGGTGGCCCG 
CCGGTGGCCG CCGCGACCCG CGAACAGCTT CAGGAGCGCA TCGAAGCGGT GCGGGTCCTG 
CAACGCGAGT TGTCGGCGTA G

Protein sequence

MRADAAPSTQ ALRGWQRRAL VKYLSAAPRD FLAVATPGAG KTTFALRIVA ELLAEGTVEA 
VTIVVPTEHL KIQWAQAAAR HGIALDPKFS NSNSQTSSDY HGVVVTYAQV ASHPTRHRVR 
TENRKTLVVF DEIHHGGDAK SWGDAIREAF DDATRRLALT GTPFRSDDSP IPFVNYETGP 
DGFARSKADH TYGYSDALAD GVVRPVMFMA YSGEARWRDS AGEEHAARLG EPLTAEQTAR 
AWKTALDPKG EWMPAVIAAA DKRLQGLRQH VPDAGGMIIA SDQTTARAYA DLLVKITGEA 
PTVVLSDDKG ASDRISEYSA GTSRWLVAVR MVSEGVDVPR LAVGVYATSA STPLFFAQAI 
GRFVRSRRPG ETASIFLPSV PNLLLLASEM EAQRNHVLGK PHREPLEDPL DAELREQKRD 
EPGEEENKIE YLGADAELDQ VIFDGSSFGT ATPAGSDEEA DYLGIPGLLD ADSMRDLLRR 
RQEEQLTKRT ESGLAVPKTT HGQLRDLRSE LNTLVSLAHH RTGRPHGWIH NELRRRCGGP 
PVAAATREQL QERIEAVRVL QRELSA