Gene Mvan_5225 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mvan_5225
Symbol
ID	4644326
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium vanbaalenii PYR-1
Kingdom	Bacteria
Replicon accession	NC_008726
Strand	+
Start bp	5595250
End bp	5596404
Gene Length	1155 bp
Protein Length	384 aa
Translation table	11
GC content	64%
IMG OID	639808700
Product	Rieske (2Fe-2S) domain-containing protein
Protein accession	YP_956002
Protein GI	120406173
COG category	[P] Inorganic ion transport and metabolism [R] General function prediction only
COG ID	[COG4638] Phenylpropionate dioxygenase and related ring-hydroxylating dioxygenases, large terminal subunit
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	0.532387
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	0.253584
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAGCACCG AGGCATCTGC GGGAACCGCA CATATTCGCG AGATCGACAC CGGAGCGCTG 
CCCGACCGGT ACGCCAGGGG TTGGCACTGC CTGGGTCCGG TGAAGAACTT CCTGGACGGG 
AAACCGCACG GCATCGAGAT CTTCGGCACC ATGCTGGTGG TCTTCGCCGA CTCGCAGGGT 
GAGCTCAACG TTCTCGACGG CTACTGCAGG CACATGGGCG GCAACCTGGC CCAGGGCGAG 
ATCAAGGGCG ACGAGGTCGC CTGCCCGTTC CACGACTGGC GCTGGGGCGG CGACGGCAAG 
TGCAAGCTGG TCCCCTACGC AAAGCGCACT CCGCGCCTGG CCCGCACACG GGCCTGGCAC 
ACCGACGTGC GCGGCGGCCT GCTGTTCGTG TGGCACGACC ACGAGGGCAA TCCACCCCAG 
CCGGAAGTCC GCATCCCGGA GATCCCGGAG TGGTCCAGCG GTGAGTGGAC CGACTGGAAG 
TGGAACACGC TGCTCATCGA GGGCTCCAAC TGCCGCGAGA TCATCGACAA CGTCACCGAC 
ATGGCGCACT TCTTCTACAT CCACTTCGGG CTGCCGACCT ACTTCAAGAA CGTCTTCGAA 
GGTCACATCG CCAGCCAGTA CCTGCACAAC GTGGGCCGGC CCGACGTCAA CGACATGGGC 
ACCGCCTACG GGGAAGCCTC CCTGGACTCC GAGGCCAGCT ACTTCGGGCC GTCGTTCATG 
ATCAACTGGC TGCACAACAA GTACGGCGAC TTCAAGGCCG AATCGATCCT GATCAACTGC 
CACTACCCGG TGACCCAGGA TTCCTTCGTG CTGCAGTGGG GCGTCATCGT GGAGAAGCCC 
AAGGGCCTCG ACGACGGCAC CACCCAGAAG CTGGCCGACG CGTTCACCGA CGGCGTGAGC 
AAAGGCTTCA TGCAGGACGT CGAGATCTGG AAGCACAAGA CCCGCATCGA CAATCCGCTG 
CTGGTGGAGG AAGACGGCGC GGTCTACCAG ATGCGGCGCT GGTATCAGCA GTTCTACGTC 
GATGTCGCCG ACGTGACGCC CGAGATGACC GACCGGTTCG AGATGGAAGT CGACACCACG 
GCTGCGGTGC AGAAGTGGAA CGTCGAGGTC GAGGAGAACC TGAAGGCCAG GGAAACCGAG 
ACGCAGTCGA CATGA

Protein sequence

MSTEASAGTA HIREIDTGAL PDRYARGWHC LGPVKNFLDG KPHGIEIFGT MLVVFADSQG 
ELNVLDGYCR HMGGNLAQGE IKGDEVACPF HDWRWGGDGK CKLVPYAKRT PRLARTRAWH 
TDVRGGLLFV WHDHEGNPPQ PEVRIPEIPE WSSGEWTDWK WNTLLIEGSN CREIIDNVTD 
MAHFFYIHFG LPTYFKNVFE GHIASQYLHN VGRPDVNDMG TAYGEASLDS EASYFGPSFM 
INWLHNKYGD FKAESILINC HYPVTQDSFV LQWGVIVEKP KGLDDGTTQK LADAFTDGVS 
KGFMQDVEIW KHKTRIDNPL LVEEDGAVYQ MRRWYQQFYV DVADVTPEMT DRFEMEVDTT 
AAVQKWNVEV EENLKARETE TQST