Gene Mvan_5211 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mvan_5211
Symbol
ID	4644312
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium vanbaalenii PYR-1
Kingdom	Bacteria
Replicon accession	NC_008726
Strand	+
Start bp	5579551
End bp	5580681
Gene Length	1131 bp
Protein Length	376 aa
Translation table	11
GC content	66%
IMG OID	639808686
Product	Rieske (2Fe-2S) domain-containing protein
Protein accession	YP_955988
Protein GI	120406159
COG category	[P] Inorganic ion transport and metabolism [R] General function prediction only
COG ID	[COG4638] Phenylpropionate dioxygenase and related ring-hydroxylating dioxygenases, large terminal subunit
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	0.220934
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCGACG TCCGCGAGAT CGACACCGGA AGCGTGATGA CGCGGTTCGC CCGCGGGTGG 
CACTGCCTCG GGCTGGCGGA CGCCTTCCGG GACGGGCGGC CGCACGGCGT CGACGCGTTC 
GGCACCATGC TGGTGGTGTT CGCCGACACG GGCGGGTCGC TGCGAGTCCT CGACGGCTAC 
TGCAGGCACA TGGGCGGCAA CCTGGCCCAG GGCGAGATCA AGGGCGACGA GGTCGCCTGC 
CCGTTCCACG ACTGGCGCTG GGGCGGCGAC GGCAGATGCA AGCTGGTCCC CTACGCCAAA 
CGCACCCCAC GCATGGCCCG AACCAGGGCC TGGCCCACCA CCGAGGTCAA CGGACAGCTG 
CTGGTCTGGC ACGACCCTGA ACGGTCCAGC CCGCCGACCG AACTGATCCC GCCGACCATC 
GCGGGTTACG ACGAGGGCCG CTGGTCGCCC TGGCAGTGGA GTTCGATCCT CATCGAGGGC 
GCCCACTGCC GCGAGATCGT CGACAACAAC GTCGACATGG CGCACTTCTT CTATATCCAC 
CACGCGTACC CGACGTACTT CAAGAACGTC ATCGAGGGAC ACACGGCCAG CCAGTTCATG 
GAGTCCAAGC CGCGTCCCGA TTTCACCGCG AACCCCGAGA AGCTCTGGGA CGGAACGTAT 
CTGCGATCCG AGGCGACGTA CTTCGGGCCG GCGTACATGA TCAACTGGCT GCACAACGAC 
CTCGCACCGG ACTTCACCGT CGAGGTGGCG CTGATCAACT GCCACTACCC CGTCAGCCAC 
AACTCGTTCA TGCTGCAATG GGGCGTGGCG GTGCAGGAGA TGCCGGGCCT GCCCGCCGAC 
AAGGCGGCCA AGCTGGCCGC GGCGATGAAC CGGTCCTTCG GCGAGGGCTT CCTCGAGGAC 
GTCGAGATCT GGAAGAACAA GTCCCCTATC GAGAATCCGC TGCTGACCGA GGAGGACGGA 
CCGGTCTACC AGCACCGCCG GTGGTACCAG CAGTTCTACG TCGACGCAGC CGACGTGACC 
GCCGACATGA CCGGCCGGTA CGAGCAGGAA GTCGACACCA CCCACGCGAA CGACCTGTGG 
CAGCAGGAGG TCGAGCGCAA CATGGCGGCC CGGAAGCCGG GTTCGGTTTG A

Protein sequence

MTDVREIDTG SVMTRFARGW HCLGLADAFR DGRPHGVDAF GTMLVVFADT GGSLRVLDGY 
CRHMGGNLAQ GEIKGDEVAC PFHDWRWGGD GRCKLVPYAK RTPRMARTRA WPTTEVNGQL 
LVWHDPERSS PPTELIPPTI AGYDEGRWSP WQWSSILIEG AHCREIVDNN VDMAHFFYIH 
HAYPTYFKNV IEGHTASQFM ESKPRPDFTA NPEKLWDGTY LRSEATYFGP AYMINWLHND 
LAPDFTVEVA LINCHYPVSH NSFMLQWGVA VQEMPGLPAD KAAKLAAAMN RSFGEGFLED 
VEIWKNKSPI ENPLLTEEDG PVYQHRRWYQ QFYVDAADVT ADMTGRYEQE VDTTHANDLW 
QQEVERNMAA RKPGSV