Gene Mflv_4463 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mflv_4463
Symbol
ID	4975776
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium gilvum PYR-GCK
Kingdom	Bacteria
Replicon accession	NC_009338
Strand	+
Start bp	4750425
End bp	4751528
Gene Length	1104 bp
Protein Length	367 aa
Translation table	11
GC content	65%
IMG OID	640458692
Product	homogentisate 1,2-dioxygenase
Protein accession	YP_001135720
Protein GI	145225042
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG3508] Homogentisate 1,2-dioxygenase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.100375
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGAATCCT TCGTCCACCT GCGAAAGGGT AAGACGCCCA AGCGGATTCA TGCCGATCTG 
GACGGGCTCA AGGACGACGA GCTCGGACGC GGCGGATTCG TCGGACGCAC CGCGAACATG 
TACCGCCGCA ATGACCCGAC GGCGTACCGC ACCGTCGGGC CACTGCGACC CACCGACGTC 
CTGAGCTCCG AACTCAAGCC GAGCGACGCG ACCGACCCTC GCGGCGGCCC CCTACTCATG 
TTCTCCAACG CGGACTGTCA GGTGCTGCTG TCCCGGCGCA CCGAGGAGAT GCCCTTCTTC 
GTGCGGTACG TCGACGGCGA CCTGCTCTCG TTCGTCCACC GCGGATCCGG CTCGCTGGAA 
ACAGAATTCG GGCCGCTGAC CTACCGCCAG GGCGACTGGA TCTACATCCC GAAGGCCTGC 
ACATGGCGCC AAATTCCTGA TCCTGGTCCC ACCGGGACTA CCACGCTGCT GATGGTCCAG 
GCCACCGAGG AGTTCCGTGT CCCACCCGCA GGCACTCTGG GGCGGCATTT CCCGTTCGAC 
CCGGCGCAGG CGGTCATCCC GGAACCGCAG CCGATCGACG ACGACGGCAG GGACGAATAC 
GAGGTGCGGC TGATCCATGA GGGCGGCCCC ACATCGCTGT TCTACAAGCA CCATCCGCTC 
GATGTCGAAG GCTGGCGCGG CGACAACTTC CCGTTCACCT TCAACATCGA CGACTACACG 
GTGATCACCT CCGACAGCGT CCACCTGCCG CCGACCGTGC ACCTGTTCAT GCAGGCGACC 
GGCGTCTACA TCATGAACTT CCTGCCCAAG CCCGCGGAAT CGGTTCCCGG GACCGAGCGC 
ACACCGTGGT ACCACCGCAA CGTCGACTTC GATGAGATCG CGTTCTTCCA CGACGGCTCG 
CTGTACGGAA TCCCGATGCC GCCCGGCCTG GTCTCTCACG CCCCCCAGGG CGTCCATCAC 
GGCGCGCCGG AGAAGGCGCG CGAGCGTGCA CGACGCAAGT TCGACGACTA CGACCGCGTG 
GACTGGTCCG TCATCGCCGT CGACACCCGC AGGCGGTTGA TCCCGTCTCC GGAGATTCTC 
GCCAACGATC TGGGGCAGCA CTAA

Protein sequence

MESFVHLRKG KTPKRIHADL DGLKDDELGR GGFVGRTANM YRRNDPTAYR TVGPLRPTDV 
LSSELKPSDA TDPRGGPLLM FSNADCQVLL SRRTEEMPFF VRYVDGDLLS FVHRGSGSLE 
TEFGPLTYRQ GDWIYIPKAC TWRQIPDPGP TGTTTLLMVQ ATEEFRVPPA GTLGRHFPFD 
PAQAVIPEPQ PIDDDGRDEY EVRLIHEGGP TSLFYKHHPL DVEGWRGDNF PFTFNIDDYT 
VITSDSVHLP PTVHLFMQAT GVYIMNFLPK PAESVPGTER TPWYHRNVDF DEIAFFHDGS 
LYGIPMPPGL VSHAPQGVHH GAPEKARERA RRKFDDYDRV DWSVIAVDTR RRLIPSPEIL 
ANDLGQH