Gene Strop_2490 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Strop_2490
Symbol
ID	5058953
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora tropica CNB-440
Kingdom	Bacteria
Replicon accession	NC_009380
Strand	-
Start bp	2800060
End bp	2801229
Gene Length	1170 bp
Protein Length	389 aa
Translation table	11
GC content	69%
IMG OID	640474748
Product	4-hydroxyphenylpyruvate dioxygenase
Protein accession	YP_001159314
Protein GI	145595017
COG category	[E] Amino acid transport and metabolism [R] General function prediction only
COG ID	[COG3185] 4-hydroxyphenylpyruvate dioxygenase and related hemolysins
TIGRFAM ID	[TIGR01263] 4-hydroxyphenylpyruvate dioxygenase

Plasmid Coverage information

Num covering plasmid clones	31
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGCAACCTT TCGCGGGCGG GGTGCCCGCA CGACCGGCAC GGGGGATCTG TGGGAAAGGG 
TGGGAGATGG ACATCCGTGG CATAGACCAC ATCGAATTCT ATGTGGGTGA CGCCAGTCAG 
GCTGCCTTCT ACTTCGGCAA CGGGGTGGGG ATGCGGCTCT GTGGTCAGGG CGGCCCGGAG 
ACCGGGCTGA CCGGGCAGCG GTCGCTGCTG CTACGGCACG CCGACATCCG GTTGCTGCTC 
ACCTCCGGGC TGACCGTCGA TCATCCGGCG GCGGAATATG TGCGGCGGCA CGGGGATGGC 
ATCGCTGTGG TCGCCTTGGC GGTTGACGAC GCCACCAAGG CGTACGCCGA ACTGCTGGAC 
AGGGGCGCGG TCGGTGCGCT GCCACCCACC ACCGTCACCA GCGCGGACGC GGAGGTCGTC 
ATCGCCGAGG TGGAAGGTTT CGCCGACGTG CGGCACCGGT TGGTCGAGCG CCGTCGGGGC 
GGTCGTGACT TCCTGCCGGG CCTGGCGGAG CTGCCGCCGG TAGCGGAGAC CGCCGAGGAC 
CTGCTCGTCG AGATCGACCA TCTGGCGGTG TGCGTGCCGC CCGGGCAGCT CGCCGAGACG 
GTATGCGGCT ACCGGGAGGT CTTCGGCTTC GACGAGATCT TCCACGAGTA CGTGGAGGTC 
GGCGGCCAGG CGATGAACTC CACCGTGGTG CAGTGCCCGT CCGGGCGGGT GACACTGGTG 
CTCCTCGAGC CGGACACCAA CCGGCGGGCT GGGCAGATCG ATGCATTCCT TGCCCAGCAC 
TCGGGCGCGG GAGTGCAGCA CCTGGGGTTG CGTACCAACG ACATCATCGA GGCGATCGGC 
GCGATGCGTC AGCGAGGGCT TCGGTTCGCG CGCACGCCGG CGGCCTACTA CGACGACCTT 
GAGACCCGGG TCGGCCGGGT CGACGGGTCT GTGGACCAGT TGCGGGAGTT CGGTGTGCTG 
GTCGACCGGG ACCACGACGG TCAACTGCTG CAGATCTTCA CGGAGTCGAT GCACGTGCGC 
CGCACGCTCT TCCTGGAGCT GATCGAGCGG CGTGGGGCAC AGACCTTCGG CAGCGGCAAT 
ATCAAGGCGC TCTACGAGGC CAAGGAGCGG GAACTGGCGG TGGCGGCCTC GGCCGGCGGT 
GTCGCCGCTA CCCAGGAGGT GACGGGATGA

Protein sequence

MQPFAGGVPA RPARGICGKG WEMDIRGIDH IEFYVGDASQ AAFYFGNGVG MRLCGQGGPE 
TGLTGQRSLL LRHADIRLLL TSGLTVDHPA AEYVRRHGDG IAVVALAVDD ATKAYAELLD 
RGAVGALPPT TVTSADAEVV IAEVEGFADV RHRLVERRRG GRDFLPGLAE LPPVAETAED 
LLVEIDHLAV CVPPGQLAET VCGYREVFGF DEIFHEYVEV GGQAMNSTVV QCPSGRVTLV 
LLEPDTNRRA GQIDAFLAQH SGAGVQHLGL RTNDIIEAIG AMRQRGLRFA RTPAAYYDDL 
ETRVGRVDGS VDQLREFGVL VDRDHDGQLL QIFTESMHVR RTLFLELIER RGAQTFGSGN 
IKALYEAKER ELAVAASAGG VAATQEVTG