Gene Svir_07000 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Svir_07000
Symbol
ID	8386038
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Saccharomonospora viridis DSM 43017
Kingdom	Bacteria
Replicon accession	NC_013159
Strand	+
Start bp	714238
End bp	715437
Gene Length	1200 bp
Protein Length	399 aa
Translation table	11
GC content	67%
IMG OID	644974797
Product	homogentisate 1,2-dioxygenase
Protein accession	YP_003132598
Protein GI	257054766
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG3508] Homogentisate 1,2-dioxygenase
TIGRFAM ID	[TIGR01015] homogentisate 1,2-dioxygenase

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	0.126563
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCGTACT ACCGTCGAGT GGGTTACGTC CCACCGAAGC GGCACACGCA GCACCGCGAC 
GAGAACGGCA ATCTCTACTA CGAGGAGCTC ATGGGCGAGG AGGGCTTCTC GTCCGACTCC 
TCGCTGCTCT ATCACCGCCA CCTTCCCTCG GCGATCGTCG ACTCCCAGGT GTGGGAGTTG 
CCGGACCAGA CGACCACGCC AAACCATCCG TTGCGGCCCC GTCATTTGAG GCTGCACGAC 
CTGTTCCCCG GCGACAGCTG GAAGGACGTC GACGTGGTGA CCGGACGTCG GCTGATCCTC 
GGCAACGCCG ACGTGCGCAT CTCGTACGTG GTGGCGGGCA AGGAGTCGCC GCTGTACCGC 
AACGGGCTCG GCGACGAGAT CGTCTACGTC GAGTCGGGTG ACGCGGTGGT GGAGACCGTG 
TTCGGTGCCT TGAAGGCGAC CGCCGGCGAC TACGTGATCC TCCCGATGTC CACGACGCAC 
CGCTGGGTGC CGCAGGGCGA AGAGCCGTTG CGGGCGTACG CGATCGAGGC GAACAGCCAC 
GTCGCGCCGC CGAAGCGCTA CCTGTCCCGG TACGGGCAGT TGCTGGAGCA CGCGCCTTAC 
TGCGAGCGCG ACCTGCACGG GCCGACGGAG GTGCTGATCC GGGAGGGGAC GGACGTCGAG 
GTGCTGCTCA AGCACCGTGG CCCCGGCGGG GTCGTGGGCA CCCGCCTGGT GTACCCGTAC 
CACCCGTTCG ACGTCGTCGG CTGGGACGGC TGCCTGTATC CGTACACGTT CAGCATCCAC 
GACTTCGAAC CCATCACCGG TCGCGTGCAC CAGCCGCCAC CCGTGCACCA GGTGTTCGAG 
GGGCACAACT TCGTGGTGTG CAACTTCGTG CCGCGCAAGG TGGACTACCA CCCACAGGCC 
ATCCCGGTGC CCTACTACCA CTCCAATGTG GACTCCGACG AGATCATGTT CTACTGCGGC 
GGTGACTACG AGGCCCGGAA GGGCTCGGGC ATCGGCCAGG GCTCGGTCTC GATCCACCCG 
GGTGGCCACG CGCACGGTCC GCAGCCCGGC GCGTACGAGC GCAGCATCGG GGTGGAGTTC 
TTCGACGAGC TGGCCGTGAT GGTCGACACC TTCCGCCCGC TCGAACTCGG TGAGGGGGCG 
TTGGCCTGCG AGGACCCGAA CTACGCGTGG ACCTGGGCCG GGCGGGGGCC GAAGCAATGA

Protein sequence

MAYYRRVGYV PPKRHTQHRD ENGNLYYEEL MGEEGFSSDS SLLYHRHLPS AIVDSQVWEL 
PDQTTTPNHP LRPRHLRLHD LFPGDSWKDV DVVTGRRLIL GNADVRISYV VAGKESPLYR 
NGLGDEIVYV ESGDAVVETV FGALKATAGD YVILPMSTTH RWVPQGEEPL RAYAIEANSH 
VAPPKRYLSR YGQLLEHAPY CERDLHGPTE VLIREGTDVE VLLKHRGPGG VVGTRLVYPY 
HPFDVVGWDG CLYPYTFSIH DFEPITGRVH QPPPVHQVFE GHNFVVCNFV PRKVDYHPQA 
IPVPYYHSNV DSDEIMFYCG GDYEARKGSG IGQGSVSIHP GGHAHGPQPG AYERSIGVEF 
FDELAVMVDT FRPLELGEGA LACEDPNYAW TWAGRGPKQ