Gene PP_2554 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PP_2554
Symbol
ID	1045859
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Pseudomonas putida KT2440
Kingdom	Bacteria
Replicon accession	NC_002947
Strand	+
Start bp	2900916
End bp	2902823
Gene Length	1908 bp
Protein Length	635 aa
Translation table	11
GC content	64%
IMG OID	637145977
Product	4-hydroxyphenylpyruvate dioxygenase
Protein accession	NP_744699
Protein GI	26989274
COG category	[E] Amino acid transport and metabolism [G] Carbohydrate transport and metabolism [R] General function prediction only
COG ID	[COG1082] Sugar phosphate isomerases/epimerases [COG3185] 4-hydroxyphenylpyruvate dioxygenase and related hemolysins
TIGRFAM ID	[TIGR01263] 4-hydroxyphenylpyruvate dioxygenase

Plasmid Coverage information

Num covering plasmid clones	4
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	6
Fosmid unclonability p-value	0.00914053
Fosmid Hitchhiker	No
Fosmid clonability	decreased coverage

Sequence

Gene sequence

ATGCAGCGTT CGATCGCTAC CGTGTCCTTG AGCGGCACTC TGCCGGAAAA GCTCGAAGCC 
ATCGCCGCCG CCGGTTTTGA CGGCGTCGAG ATCTTCGAGA ACGATCTGCT CTATTACGCT 
GGCAGCCCGC GCCAGGTGCG CCAGATGTGC GCCGACCTGG GCATTGCCAT CACCTTGTTC 
CAGCCTTTCC GCGACTTTGA AGGCTGCCGC CGTGACCGCC TGCAGAAAAA CCTCGACCGC 
GCCGAACGCA AGTTCGACCT GATGCAGGAG CTGGGTACCG ACCTGGTGCT GGTGTGCAGC 
AACGTCCAGG CCGATGCCCT GGGTGACGAG CAACTGTTGG TCGACGACCT GCGCCTGCTG 
GGCGAACATG CCGGCAAGCG TGGCCTGCGC ATTGGTTACG AAGCGCTGGC CTGGGGCCGC 
CACGTCAACA CTTACCAGCA AGTGTGGAAC CTGGTGCGCC AGGCCGACCA CCCGGCACTC 
GGGGTGATCC TCGACAGCTT CCACACCTTG TCGCTCAAAG GTGACCCCAG CGCGATCCGC 
GACATCCCCG GCGACAAGAT CTTCTTCGTG CAAATGGCCG ATGCGCCGAT CCTGGCCATG 
GATGTGCTGG AGTGGAGCCG CCACTTTCGC TGCTTCCCGG GGCAGGGCGA AATGGACATG 
GCCGGTTTCC TGGCGCCGAT CCTCGCCACG GGTTACCGTG GCCCGCTGTC GCTGGAAATC 
TTCAACGACG GCTTCCGCGC CGCACCGACC CGGCAGAATG CCGCCGACGG CTTGCGTTCG 
CTGCTGTACC TCGAAGAACA GACCCGCTTG CGCCTGGAGC AGGAGAACAC GCCGATCGAA 
CCTGGCGTGC TGTTCTCCCC GCCGCCGGCC AGCGCTTATG ACGGCGTGGA GTTCCTGGAG 
TTCGCGGTCG ACGAAGCCGT CGGCGCGCGC CTGGGCAACT GGCTGAAGCG CCTGGGCTTT 
GCCGAAGCCG GCAAGCACCG CAGCAAAGAA GTGCAACTGC TGCGCCAGGG TGATATCAAC 
ATTGTGCTGA ACGCCGAACC GTATTCCTTC GGCCACAACT TCTTCGAGGC CCATGGCCCA 
TCGCTGTGCG CCACTGCGCT GCGGGTCAAG GACCAGCAAG CGGCCTTGAA GCGGGCCACC 
GCCTTCCGTG GCCAGCCGTT CCGCGGCCTG GTCGGCCCCA ACGAATGCGA AGTGCCGGCG 
GTGCGTGCGC CCGATGGCAG CCTGCTGTAT CTGGTGGAGC AGGGCACTGC CGGCCACACC 
CTGTACGATA CCGACTTCAG CCTGGACAAC AACGCAACCG CTACCGGCGG CCTGCGCCGC 
ATCGACCACA TGGCCCTAGC CTTGCCGGCC GAGTCGCTGG ACAGCTGGGT GCTGTTCTAC 
AAGAGCTTGT TCGACTTCGC CGCCGACGAC GAGGTGGTGC TGCCCGACCC GTATGGCCTG 
GTCAAGAGCC GCGCCTTGCG CAGCCAGTGC GGCACTTTGC GCCTGCCGCT GAACATCTCG 
GAAAACCGCA ACACCGCCAT CGCCCATGCG CTGTCAAGCT ACCGTGGTTC GGGCGTGCAT 
CACATCGCTT TCGATTGTGA CGACATCTTC CGCGAAGTGG CGCGGGCCAA GCTGGCAGGG 
GTACCGCTGC TGGAAATCCC GCTGAACTAC TACGACGACC TGGCGGCGCG TTTCGATTTC 
GACGACGAGT TCCTCAGTGA GCTGGCGTAC TACAACGTGC TGTATGACCG CGACGCTCAA 
GGTGGCGAGC TGTTCCACGT CTATACCGAG CCGTTCGAGG AGCGTTTCTT CTTCGAGATC 
ATCCAGCGCA AGGCGGGGTA CGCTGGTTAC GGCGCTGCCA ACGTTGCGGT GCGCCTGGCA 
GCCATGGCCA AGGCCCGTAG CGGGGCGGCG CGCAAGCCGG TGCTGTAG

Protein sequence

MQRSIATVSL SGTLPEKLEA IAAAGFDGVE IFENDLLYYA GSPRQVRQMC ADLGIAITLF 
QPFRDFEGCR RDRLQKNLDR AERKFDLMQE LGTDLVLVCS NVQADALGDE QLLVDDLRLL 
GEHAGKRGLR IGYEALAWGR HVNTYQQVWN LVRQADHPAL GVILDSFHTL SLKGDPSAIR 
DIPGDKIFFV QMADAPILAM DVLEWSRHFR CFPGQGEMDM AGFLAPILAT GYRGPLSLEI 
FNDGFRAAPT RQNAADGLRS LLYLEEQTRL RLEQENTPIE PGVLFSPPPA SAYDGVEFLE 
FAVDEAVGAR LGNWLKRLGF AEAGKHRSKE VQLLRQGDIN IVLNAEPYSF GHNFFEAHGP 
SLCATALRVK DQQAALKRAT AFRGQPFRGL VGPNECEVPA VRAPDGSLLY LVEQGTAGHT 
LYDTDFSLDN NATATGGLRR IDHMALALPA ESLDSWVLFY KSLFDFAADD EVVLPDPYGL 
VKSRALRSQC GTLRLPLNIS ENRNTAIAHA LSSYRGSGVH HIAFDCDDIF REVARAKLAG 
VPLLEIPLNY YDDLAARFDF DDEFLSELAY YNVLYDRDAQ GGELFHVYTE PFEERFFFEI 
IQRKAGYAGY GAANVAVRLA AMAKARSGAA RKPVL