Gene Mvan_1001 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mvan_1001
Symbol
ID	4645786
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium vanbaalenii PYR-1
Kingdom	Bacteria
Replicon accession	NC_008726
Strand	+
Start bp	1037042
End bp	1038184
Gene Length	1143 bp
Protein Length	380 aa
Translation table	11
GC content	67%
IMG OID	639804502
Product	Rieske (2Fe-2S) domain-containing protein
Protein accession	YP_951845
Protein GI	120402016
COG category	[P] Inorganic ion transport and metabolism [R] General function prediction only
COG ID	[COG4638] Phenylpropionate dioxygenase and related ring-hydroxylating dioxygenases, large terminal subunit
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	32
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAACAGTC TCAAGGACCC GGACTTCGAG CACACCGGCC CTGGGCGCCC GGCCGGACAC 
CTGTTGCGGC AGCGGTGGCA GCCGGTCTAC GCCTCCGAGG AGCTGGAAGC GGGACGCGCC 
GTGCCGCTGA AGATCCTGCA CGAGGAGCTG ACCCTGTACC GGGGTGAGGA CGGCGTCGCC 
CACATCGTCG CGGGCCGCTG CGCACATCGC GGGGTGCTGC TGGCGGTCGG CACCGTGGAA 
GGCGACTGCG TGCGTTGCCG ATACCACGGC TGGCGGTACG ACGGCGCCGG TCAGTGCGTG 
GACCAGCCGG CAGAGCGGCG AAGCTTCGCG GACAAGGTGC GCATCGCGAG CTATCCCGTC 
GAGGAGTACT TCGGCTTCAT CTGGACCTAT CTGGGTGAGT CGCCGGTGCC GGAGCTGCCG 
CGCTGGCCGG AACTGGAGGA GTACGGCCGC TTCCACGTCA TCGAACACCG GAAGTGGAAC 
TACTTCCACG ATCTGGAGAA CACCGTCGAC GACGTACACC AGTACTGGGT GCACAAGACC 
GGCATCTATC AGGACGACGG CAACGCCGGC CAGATCCCGG AGATGAGCGC TGAACTCGCC 
GATTTCGGCC TCACCCAGAC CAGCACATTC AGCAACGGGT TCGTCCGCCG GCTCGCGCTG 
CTGATGCCGA ACACCCTGTA CTTCAACTCG GGCGCCGGAG TGCTGCGCGG TTTCAAGAGC 
TTCCTGTGGA ATGTGCCGAT CGACGACGAG AACCACATGA TGTTCTTTCT GTTCATCGCG 
GCTCATCTGC CGCCCGACGT CGGCGCCCGG CTGGCGGCGG GCGTGCGGGA GGGCCGAAAA 
TACCTGTCCC AGCTGCGGCC GGTCGACGAC ATCATCCGCG CCGTGCTCAG CGGCCGGGAA 
CGCTGGGAGG ACATCGAGGA CCGCCCGGAC CAGGTGCTGA TCGAGGACGG TGTCGTCCTG 
CTCGGCCAGG GGGTCCTGCC CGACCGCTCG CTCAACCGGC TCGGTAGCTC CGACGCCGCA 
ATCATCCTGC TGCGCAGACT CTATGCGCGC GAACTGGCCG CGATCGAGGC CGGCCACCCC 
CTGACGAAAT TCCCGACACC CGACGCCGCG GCGCTCACCC GGCTCGACAG CTCGACACCC 
TGA

Protein sequence

MNSLKDPDFE HTGPGRPAGH LLRQRWQPVY ASEELEAGRA VPLKILHEEL TLYRGEDGVA 
HIVAGRCAHR GVLLAVGTVE GDCVRCRYHG WRYDGAGQCV DQPAERRSFA DKVRIASYPV 
EEYFGFIWTY LGESPVPELP RWPELEEYGR FHVIEHRKWN YFHDLENTVD DVHQYWVHKT 
GIYQDDGNAG QIPEMSAELA DFGLTQTSTF SNGFVRRLAL LMPNTLYFNS GAGVLRGFKS 
FLWNVPIDDE NHMMFFLFIA AHLPPDVGAR LAAGVREGRK YLSQLRPVDD IIRAVLSGRE 
RWEDIEDRPD QVLIEDGVVL LGQGVLPDRS LNRLGSSDAA IILLRRLYAR ELAAIEAGHP 
LTKFPTPDAA ALTRLDSSTP