Gene Mvan_2021 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mvan_2021
Symbol
ID	4645344
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium vanbaalenii PYR-1
Kingdom	Bacteria
Replicon accession	NC_008726
Strand	+
Start bp	2160287
End bp	2161525
Gene Length	1239 bp
Protein Length	412 aa
Translation table	11
GC content	66%
IMG OID	639805506
Product	cytochrome P450
Protein accession	YP_952844
Protein GI	120403015
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG2124] Cytochrome P450
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	27
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCGTTC GAATTGCCGA CGAAGCCGCC AGGGTCTTCG CCGACCCCAG CGCCTACGCC 
GACGAGGCGC GGCTGCATGC GGCGATGACC CACCTGCGGG CCAACGCGCC GGTGTCGTGG 
GTGGAGGTTC CCGGGTACAA CCCGTTCTGG GCCATCACCA AGCACGCCGA CATCATGGCC 
GTCGAGCGGG ACAACCTCGT GTTCACCAAC TCGCCGCGGC CCGTGCTGAC CACGGCAGAG 
GGCGACGCTC AGCACGAAGC CATGGGCATC AGCACGCTGA TCCATCTCGA CGATCCGCAG 
CACCGCAAGG TCAGGGCCAT CGGCGCCGAC TGGTTCCGAC CGAAAGCCAT GCGGGCGCTG 
AAGGTTCGCG TCGACGAGCT TGCCAAGACA TTCGTCGACC AGATGTACGA GCGGGGCGGG 
GAGTGCGACT TCGTGCAGGA AGTCGCGGTT AACTTCCCGC TGTACGTCAT CATGTCGCTG 
CTCGGCATCC CGGAGTCCGA CTTCCAGCGG ATGCTCACGT ACACGCAGGA ACTGTTCGGC 
AACGACGATG CCGAACTGCA GCGCGGTGAG AGCATGGAGG AGCGCGGGCT GGCGCTGTTC 
GACATGTTCA CCTACTTCAA CGAGATCACC GCCGCCCGGC GCGCCCGCCC CACCGAGGAC 
CTGGCGTCGG CGATCGCCAA CGCGCGCATC GACGGCGCGC CGCTGTCCGA TATCGACACG 
GTGTCCTACT ACCTGATCGT GGCCACGGCG GGCCACGACA CCACCAGCGC GACGATCTCG 
GGTGGCCTGC AGGCGCTGAT CGAGAATCCC GACCAGTTGC AGCGGCTGCA GCAGAACCCC 
GGCCTGATGC CGCTGGCGGT CGAGGAGATG ATCCGGTGGG TCACCCCGGT CAAGGAGTTC 
ATGCGGACCG CCCAGCAGGA CGCCGAGGTT CGTGGCGTGA AAATCGCTGC GGGGGAGTCG 
GTTCTGCTGT CCTACCCGTC CGGGAACCGC GACGAGGACG TCTTCACCGA CCCGTTCCGG 
TTTGACGTCG GCCGTGATCC CAACAAGCAT GTGGCGTTCG GTTACGGCGT GCACTTCTGC 
CTGGGCGCGG CGCTGGCCCG CATGGAGATC AACAGCTTCT TCACCGAGTT GCTGCCCCGG 
TTGAAGTCAG TCGAGTTGGC CGGCAGGCCT GAGCACATCG CGACGATCTT CGTCGGCGGG 
CTCAAGCACC TGCCGATCCG GTATTCGCTG ACGCGCTGA

Protein sequence

MSVRIADEAA RVFADPSAYA DEARLHAAMT HLRANAPVSW VEVPGYNPFW AITKHADIMA 
VERDNLVFTN SPRPVLTTAE GDAQHEAMGI STLIHLDDPQ HRKVRAIGAD WFRPKAMRAL 
KVRVDELAKT FVDQMYERGG ECDFVQEVAV NFPLYVIMSL LGIPESDFQR MLTYTQELFG 
NDDAELQRGE SMEERGLALF DMFTYFNEIT AARRARPTED LASAIANARI DGAPLSDIDT 
VSYYLIVATA GHDTTSATIS GGLQALIENP DQLQRLQQNP GLMPLAVEEM IRWVTPVKEF 
MRTAQQDAEV RGVKIAAGES VLLSYPSGNR DEDVFTDPFR FDVGRDPNKH VAFGYGVHFC 
LGAALARMEI NSFFTELLPR LKSVELAGRP EHIATIFVGG LKHLPIRYSL TR