Gene Mvan_1897 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mvan_1897
Symbol
ID	4645767
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium vanbaalenii PYR-1
Kingdom	Bacteria
Replicon accession	NC_008726
Strand	-
Start bp	2021892
End bp	2022983
Gene Length	1092 bp
Protein Length	363 aa
Translation table	11
GC content	65%
IMG OID	639805385
Product	homogentisate 1,2-dioxygenase
Protein accession	YP_952724
Protein GI	120402895
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG3508] Homogentisate 1,2-dioxygenase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	27
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGAATCCT TTGTCCACCT TCGAAAAGGC AAGACTCCCA AGAGAATTCA TGCCGACCTA 
GACGGCCTCA AGGACGACGA ACTCGGCCGC GGAGGTTTTG TCGGCCGCAC CGCCAATATG 
TACCGGCGCA ACGACCCGAC CGCCTACCGC ACCGTCGGCC CCCTGCGCCC CACCGACGTG 
CTGAGCAGCG AGCTCAAACC CAGCGACGCC ACCGACGCGA ACGGCGGCCC GTTGTTGATG 
TTCTCCAACG CCGACTGCCT GGTGCTGTTG TCGCGGCGAT CCGAGCCGAT GCCGTTCTTC 
GTCCGCTACG TCGACGGCGA CCTGCTCTCG TTCGTGCACC GCGGATCGGG ATCCCTCGAG 
ACGGAGTTCG GGCCGCTGGA TTACCGCCAG GGCGACTGGA TCTACATCCC CAAGGCCTGC 
ACGTGGCGGC AGGTGCCGTC GGAGGAGACG ACGCTGCTGA TGATCCAGGC GACCGACGAG 
TTCCGCGTGC CACCCGCCGG CACCCTGGGT CGCCACTTCC CGTTCGACCC AGCGCAGGTC 
GTCATCCCGG AGCCACAACC CATTGACGAT GACGGCCGTG ACGAGTACGA AGTGCGGCTG 
ATCCATGAAG GTGGACCGAC AAGCCTGTTC TACCAACACC ATCCGCTCGA CGTCGAGGGC 
TGGCGGGGGG ACAACTTCCC CTTCACGTTC AACATCGACG ACTACACGGT CGTCACCTCT 
GAGAGCGTGC ACCTGCCGCC CACCGTGCAC CTGTTCATGC AGGCCACCGG CGTCTACGTG 
ATGAACTTCC TGCCCAAACC CGCAGAGTCG GTGCCGGGAA CCGAACGCAC GCCGTGGTAC 
CACCGCAACG TGGACTACGA CGAGATCGCG TTCTTCCACG GCGGATCCCT GTACGGGATC 
CCGATGCCGC CCGGGCTGGT GTCGCACGCC CCGCAGGGGG TGCACCACGG CGCGCCGGAG 
AAGGCGCGCG AACGTGCGCG ACGAAAGTTC GACGACTATG ACCGGGTGGA CTGGTCGGTG 
ATCGCCATCG ACACCCGGCG CCGACTGATG CCGTCCGCCG AAATCCTCGC CAACGACCTG 
GGGCAGCACT AG

Protein sequence

MESFVHLRKG KTPKRIHADL DGLKDDELGR GGFVGRTANM YRRNDPTAYR TVGPLRPTDV 
LSSELKPSDA TDANGGPLLM FSNADCLVLL SRRSEPMPFF VRYVDGDLLS FVHRGSGSLE 
TEFGPLDYRQ GDWIYIPKAC TWRQVPSEET TLLMIQATDE FRVPPAGTLG RHFPFDPAQV 
VIPEPQPIDD DGRDEYEVRL IHEGGPTSLF YQHHPLDVEG WRGDNFPFTF NIDDYTVVTS 
ESVHLPPTVH LFMQATGVYV MNFLPKPAES VPGTERTPWY HRNVDYDEIA FFHGGSLYGI 
PMPPGLVSHA PQGVHHGAPE KARERARRKF DDYDRVDWSV IAIDTRRRLM PSAEILANDL 
GQH