Gene Rpic12D_3041 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rpic12D_3041
Symbol
ID	8020724
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ralstonia pickettii 12D
Kingdom	Bacteria
Replicon accession	NC_012856
Strand	+
Start bp	3209849
End bp	3210955
Gene Length	1107 bp
Protein Length	368 aa
Translation table	11
GC content	62%
IMG OID	644831838
Product	4-hydroxyphenylpyruvate dioxygenase
Protein accession	YP_002982982
Protein GI	241664622
COG category	[E] Amino acid transport and metabolism [R] General function prediction only
COG ID	[COG3185] 4-hydroxyphenylpyruvate dioxygenase and related hemolysins
TIGRFAM ID	[TIGR01263] 4-hydroxyphenylpyruvate dioxygenase

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	30
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCAATTCA CGCCTTGGGA AAACCCGATG GGCACCGCCG GCTTCGAGTT CATCGAATAC 
GCCGCGCCGG ACCCCGTTGC CATGGGCAAG CTGTTCGAGA ACATGGGCTT TACCGCCATC 
GCGAAACACC GTCACAAGAA CGTGACGCTG TACCGCCAGG GCGAGATCAA CTTCATCATC 
AACGCCGAGC CCGATTCGTT CGCGCAGCGC TTTGCGCGCC TGCACGGCCC GTCGATCTGC 
GCGATCGCGT TTCGCGTGCG AGACGCCGCG TTCGCCTACA AGCGTGCGCT GGAGCTGGGC 
GCCTGGGGCT TCGACACCCA CAGCGGCCCG ATGGAGCTGA ACATTCCGGC CATCAAGGGC 
ATCGGCGATT CGCTGATCTA CCTGGTCGAC CGCTGGACCG GCAAGAACGA CGCCAAGGCC 
GGCGACATCG GCAACATCAG CATCTACGAC GTCGATTTCG TGCCCATCGC GGGCGCCAAC 
CCGAACCCCA CCGGGCACGG CCTGACCTAC ATCGACCACC TGACGCACAA CGTCTACCGT 
GGCCGGATGA AGGAATGGGC CGAGTTTTAC GAACGCTTCT TCAACTTCCG TGAGGTCCGC 
TACTTCGACA TCGAAGGCCA GGTCACGGGC GTGAAGAGCA AGGCGATGAC GAGCCCGTGC 
GGCAATATCC GCATCCCCAT CAACGAGGAA GGGACGGAGA AGGCCGGTCA GATCCAGGAG 
TATCTGGACA TGTACCACGG CGAGGGCATC CAGCACATCG CGCTCGGTTC GACCAACCTG 
TTCAACACGG TGGACGCGCT GCGCAGCAAG GGCATCAAGC TGCTGGACAC GATCGACACG 
TATTACGAAC TGGTCGACAA GCGCATCCCC GGCCATGGCG AAGACGTGGC GGAACTGAAG 
AAGCGCAAGA TCCTGATCGA CGGCGCACCG GGCGACCTTC TGCTGCAGAT CTTCTCGGAA 
AACCAGCTCG GTCCGATCTT CTTCGAGTTC ATCCAGCGCA AGGGCAACCA AGGTTTTGGC 
GAGGGCAACT TCAAGGCGCT CTTCGAGTCG ATCGAACTCG ACCAGATGCG CCGCGGCGTG 
CTCAAGGCCG ACGACCAGCC GGCCTGA

Protein sequence

MQFTPWENPM GTAGFEFIEY AAPDPVAMGK LFENMGFTAI AKHRHKNVTL YRQGEINFII 
NAEPDSFAQR FARLHGPSIC AIAFRVRDAA FAYKRALELG AWGFDTHSGP MELNIPAIKG 
IGDSLIYLVD RWTGKNDAKA GDIGNISIYD VDFVPIAGAN PNPTGHGLTY IDHLTHNVYR 
GRMKEWAEFY ERFFNFREVR YFDIEGQVTG VKSKAMTSPC GNIRIPINEE GTEKAGQIQE 
YLDMYHGEGI QHIALGSTNL FNTVDALRSK GIKLLDTIDT YYELVDKRIP GHGEDVAELK 
KRKILIDGAP GDLLLQIFSE NQLGPIFFEF IQRKGNQGFG EGNFKALFES IELDQMRRGV 
LKADDQPA