Gene Mvan_3100 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mvan_3100
Symbol
ID	4646856
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium vanbaalenii PYR-1
Kingdom	Bacteria
Replicon accession	NC_008726
Strand	+
Start bp	3270943
End bp	3272133
Gene Length	1191 bp
Protein Length	396 aa
Translation table	11
GC content	68%
IMG OID	639806577
Product	alkane 1-monooxygenase
Protein accession	YP_953908
Protein GI	120404079
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	0.445628
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	0.18825
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCGATTC AGCAGCGCTC ACCGCAGCGG CACAGCCGGG CACCGGTAGT TGCTCAGGCC 
TGGCGTGACC AGAAGCGTTA CGGCTGGCTG CTGGGCCTGG TCATCCCCAC GCTCGTGCCC 
ATGTCGTGGG CAGCGGCAGC CTTGACGGGT GCGGGGGTGT TCTGGTGGTC CGGCCCCGCC 
CTGATGTTCC TCGTGATCCC GACTCTGGAT TATCTGGTCG GTCCCGACGC CGACAATCCG 
CCCGACAGCG CGCTCACGTG GCTGGAGAAC GACCGGTTCT ATCGCTGGGC CACCTACCTG 
TACCTGCCTG CCCAGTACGT GTCCCTGATG CTGGCGTGCT GGTTGTGGAG CGGTGGCGGC 
GGAGTGGCGA TGAGCGACGT CGACAAGGTC GGGCTGATGC TCACGATCGG TGGTATCGGG 
GGTGTGGCGA TCAACATCGC CCACGAGCTC GGCCACCAGC GGGCGCGGTC GGAGCGCCGG 
CTCAGCAAGA TCGCGCTGGC GCAGACCGGA TACGGTCACT TCTTCGTCGA ACACAACCGC 
GGCCATCACG CCCGCGTCGC CACACCCGAG GATCCGGCCA GCTCACGCCT GGGTGAGAGC 
ATTTACACGT TCCAGTTCCG GTCCGTCCTG GGCTCCCTGC GCTCGGCATG GAGGCTCGAG 
CGCCGACGGC TGTCCCGGCA CGGGAAGTCG CCCTGGACAC TTCGCAACGA CGTGCTGAAC 
TCCTGGCTCA TGACCGCGGC GCTGTTCGCG GTGCTGGTCG CCGGGTTCGG CGTGGAGGTG 
CTGCCCTGGC TGCTGGGCCA GGCGGTCGTC GGGATCTGCT TGTTGGAGTC GATCAACTAT 
CTCGAGCACT ACGGGCTGCG GCGGCAGCGC CGCGCCGACG GCACCTACGA GCAGGTCCGG 
CCCTCGCACA GCTGGAACAG CAACTCGGTG ATCTCCAACG TCTTCCTGTT CCACCTGCAG 
CGCCACTCCG ACCACCACGC CAACCCGCAT CGGCGCTACC AGGCTCTGTG CCACGCGGAC 
GAGGCGCCCC AGCTGCCGTC GGGCTACGCG ACGATGGTGC TGTTGGCGCT GTTCCCGCCG 
CTGTGGCGGC GCGTCATGGA CGGGCGGGTC CTCGCCCACT ACGGCGGCGA CATCCGGCTG 
GCGGCGCTGA GTCCGCGCAA AGAACGTCGG CTATTGCGGC GGTACGGCTG A

Protein sequence

MPIQQRSPQR HSRAPVVAQA WRDQKRYGWL LGLVIPTLVP MSWAAAALTG AGVFWWSGPA 
LMFLVIPTLD YLVGPDADNP PDSALTWLEN DRFYRWATYL YLPAQYVSLM LACWLWSGGG 
GVAMSDVDKV GLMLTIGGIG GVAINIAHEL GHQRARSERR LSKIALAQTG YGHFFVEHNR 
GHHARVATPE DPASSRLGES IYTFQFRSVL GSLRSAWRLE RRRLSRHGKS PWTLRNDVLN 
SWLMTAALFA VLVAGFGVEV LPWLLGQAVV GICLLESINY LEHYGLRRQR RADGTYEQVR 
PSHSWNSNSV ISNVFLFHLQ RHSDHHANPH RRYQALCHAD EAPQLPSGYA TMVLLALFPP 
LWRRVMDGRV LAHYGGDIRL AALSPRKERR LLRRYG