Gene Mvan_6020 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mvan_6020
Symbol
ID	4643946
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium vanbaalenii PYR-1
Kingdom	Bacteria
Replicon accession	NC_008726
Strand	+
Start bp	6425936
End bp	6427267
Gene Length	1332 bp
Protein Length	443 aa
Translation table	11
GC content	61%
IMG OID	639809486
Product	xenobiotic compound DszA family monooxygenase
Protein accession	YP_956780
Protein GI	120406951
COG category	[C] Energy production and conversion
COG ID	[COG2141] Coenzyme F420-dependent N5,N10-methylene tetrahydromethanopterin reductase and related flavin-dependent oxidoreductases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	24
Fosmid unclonability p-value	0.719059
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATGCACC TCATCACCTG GCTAATGGGC AACAGCTATC ACGCCGCGGG GTGGCGACAT 
CAGTTGGCCT GGGAGCGCAC GGCGATGCGT TTGGACGTGT TGATCGAGAT CGCAAAGATC 
GCCGAGGAGG CGAAACTCGA CGCGCTGTTC GTCGCCGACG GCAACGGTGT GCGGAATATG 
GACAAGGTTG GCCTCTTTGA AGCCAACACC CCCTCCGCTC GCCCCACTGT CTACGATCCC 
GTCACCCTGA TGGCGGCGAT CTCGCAGCAC ACCAAACACA TCGGACTCGT CGGTACGGCG 
TCCACGACCT ACGAGTCGCC CTGGGTGGTA GCGCGGCGTT TCGCTTCACT CGATCATCTG 
TCGAACGGTC GGGCATCATG GAACGTCGTC ACAGGGTCAA ACCCCGGAGA CTCGGAGAAC 
TTCGGATTGG CACACCACCC GGATCGTGAC AGCCGATACG CGCGCGCTGA GGAATTCGTG 
TCGGCATGCA AGGCGCTCTG GAACAGCTGG GACGAGGACG CGTTCGTCGA GCGAAAAGAC 
ACGGGACAGT ACCTGAACGC CAGAAAAGTT CGCGTCCCCG ACTACAAGGG CCGTCACCTA 
TCCGTGAAGG GCCCACTCAA CGTGTCGCGA TCCCCACAAG GCCGTCCTGT CTTGTTCCAT 
GCGGGCCAGT CCGAAGGCGG AAGACGCTTG GCCGCCCGCC ACGCGGACTG CATATTTGAG 
GCAGCGGCGA GTGTGGAGGC AGCGCGAGAG TTCTATGCCG ACCTGAAGCG CCGGAGGGTT 
GAAATCGGCG GCGAACCCGA CCATTTGCGG ATTATTGTCT CGGTAGCCGT CTACCTCGGC 
AGAACTGAAA GCGAAGCCGT CGAGCTGTAC TCCGAGCTGA ATTCGCTCAT CAGTCCCGAT 
CTCGGCGTCG ACTTCTTGGC TAAAGCTGTC TCTGAGGATC TGACCGGTTA CCCGGTCGAC 
GGTCCCATGC CGGACCTCAG CGCTCCCGTC GTCGGCGGCA ACTCCATACG GGGTCAACTC 
GATGCAATCG CCAAAGCAGA ACAGCTCACG GTCCGGCAGA TGTACGAACG TGTCGTTCCC 
ACGATGGGCA ATACGGCTCT GATCGGAACG GCCACACAGA TCGCCGACGT CATGGAGGAG 
TGGTACACCA CCGGAGCGTG CGACGGCTTC GTGCTCGGCG CTTCCATCAG CCCGTTTACC 
CTTCTTCTGA TCCGTGACGA ACTCGTTCCC GAACTGCAGC GTCGAGGACT GTTTCGACGG 
CACTACACGG GAAGCACGCT GCGCGAGAAT CTTGGGCTTC CCCCCGTCGA CAACTCACCG 
TTCGCAACCT GA

Protein sequence

MMHLITWLMG NSYHAAGWRH QLAWERTAMR LDVLIEIAKI AEEAKLDALF VADGNGVRNM 
DKVGLFEANT PSARPTVYDP VTLMAAISQH TKHIGLVGTA STTYESPWVV ARRFASLDHL 
SNGRASWNVV TGSNPGDSEN FGLAHHPDRD SRYARAEEFV SACKALWNSW DEDAFVERKD 
TGQYLNARKV RVPDYKGRHL SVKGPLNVSR SPQGRPVLFH AGQSEGGRRL AARHADCIFE 
AAASVEAARE FYADLKRRRV EIGGEPDHLR IIVSVAVYLG RTESEAVELY SELNSLISPD 
LGVDFLAKAV SEDLTGYPVD GPMPDLSAPV VGGNSIRGQL DAIAKAEQLT VRQMYERVVP 
TMGNTALIGT ATQIADVMEE WYTTGACDGF VLGASISPFT LLLIRDELVP ELQRRGLFRR 
HYTGSTLREN LGLPPVDNSP FAT