Gene Mflv_1533 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mflv_1533
Symbol
ID	4972859
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium gilvum PYR-GCK
Kingdom	Bacteria
Replicon accession	NC_009338
Strand	-
Start bp	1600236
End bp	1601387
Gene Length	1152 bp
Protein Length	383 aa
Translation table	11
GC content	64%
IMG OID	640455737
Product	Rieske (2Fe-2S) domain-containing protein
Protein accession	YP_001132803
Protein GI	145222125
COG category	[P] Inorganic ion transport and metabolism [R] General function prediction only
COG ID	[COG4638] Phenylpropionate dioxygenase and related ring-hydroxylating dioxygenases, large terminal subunit
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	30
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAGCACCG ACACGGCTGG CATTCGCGAG ATCGACACCG GAGCGCTGCC CGACCGGTAC 
GCCAGAGGCT GGCACTGCCT CGGTCCGGTC AAGAACTTCA CCGACGGCGA ACCACACGGC 
ATCGAGATCT TCGGGACCAT GCTGGTGGTC TTCGCCGACT CGCAGGGCGA ATTGAAGGTC 
CTCGACGGCT ACTGCCGCCA CATGGGCGGC AACCTCGCCC AGGGCACCAT CAAGGGCGAC 
GAGGTCGCCT GCCCGTTCCA CGACTGGCGC TGGGGCGGCG ACGGCAAATG CAAGCTCGTC 
CCCTATGCCA AACGCACCCC CCGCCTGGCC CGCACGCGCG CCTGGCACAC CGACGTCCGC 
GGCGGGTTGC TCTTCGTCTG GCACGACCAC GAGGGCAATC CTCCGCAGCC GGAGGTCCGC 
ATCCCGGAGA TCCCGCAGTG GTCGAGCGGC GAGTGGACCG ACTGGAAGTG GAACACGATG 
CTGATCGAGG GCTCCAACTG CCGCGAGATC ATCGACAACG TCACCGACAT GGCGCACTTC 
TTCTACATCC ATTTCGGCTT GCCGACGTAT TTCAAGAACG TCTTCGAAGG GCATGTCGCC 
AGCCAGTACC TGCACAACGT CGGCCGCCCC GACATCAACG ACATGGGCAC CGCCTACGGT 
GACGCGTCCC TGGACTCCGA GGCCAGCTAC TTCGGCCCGT CGTTCATGAT CAACTGGCTG 
CACAACACCT ACGGCGACTT CAAGGCCGAG TCGATCCTGA TCAACTGTCA CTATCCGGTG 
TCGCAGGACT CGTTCGTCCT GCAGTGGGGT GTGATCGTGG AGAAGCCCCA GGGCCTCGAC 
GACAAGACCA CCGAGAAACT CGCCGATGCG TTCACCGACG GTGTCAGCAA GGGCTTCCTG 
CAGGACGTCG AGATCTGGAA GCACAAGACG CGTATCGACA ACCCCCTGCT GGTCGAAGAA 
GACGGCGCCG TCTACCAGAT GCGCCGTTGG TACCAGCAGT TCTACGTCGA CGTCGCCGAC 
GTGACGCCGG AGATGACCGA CCGCTTCGAG ATGGAAGTCG ACACCACGGT GGCGAACCAG 
AAGTGGAACG TCGAGGTCGA GGAGAATCTC AAGGCGCGCG AGGCCGAGAA GACGGAGCAG 
CCGGCGACAT GA

Protein sequence

MSTDTAGIRE IDTGALPDRY ARGWHCLGPV KNFTDGEPHG IEIFGTMLVV FADSQGELKV 
LDGYCRHMGG NLAQGTIKGD EVACPFHDWR WGGDGKCKLV PYAKRTPRLA RTRAWHTDVR 
GGLLFVWHDH EGNPPQPEVR IPEIPQWSSG EWTDWKWNTM LIEGSNCREI IDNVTDMAHF 
FYIHFGLPTY FKNVFEGHVA SQYLHNVGRP DINDMGTAYG DASLDSEASY FGPSFMINWL 
HNTYGDFKAE SILINCHYPV SQDSFVLQWG VIVEKPQGLD DKTTEKLADA FTDGVSKGFL 
QDVEIWKHKT RIDNPLLVEE DGAVYQMRRW YQQFYVDVAD VTPEMTDRFE MEVDTTVANQ 
KWNVEVEENL KAREAEKTEQ PAT