Gene Avi_5449 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Avi_5449
Symbol	hppD
ID	7381544
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Agrobacterium vitis S4
Kingdom	Bacteria
Replicon accession	NC_011988
Strand	-
Start bp	450460
End bp	452307
Gene Length	1848 bp
Protein Length	615 aa
Translation table	11
GC content	60%
IMG OID	643649051
Product	4-hydroxyphenylpyruvate dioxygenase
Protein accession	YP_002547288
Protein GI	222106497
COG category	[E] Amino acid transport and metabolism [G] Carbohydrate transport and metabolism [R] General function prediction only
COG ID	[COG1082] Sugar phosphate isomerases/epimerases [COG3185] 4-hydroxyphenylpyruvate dioxygenase and related hemolysins
TIGRFAM ID	[TIGR01263] 4-hydroxyphenylpyruvate dioxygenase

Plasmid Coverage information

Num covering plasmid clones	5
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

CTGGCGGCCA TTGCCAAGGC TGGCTTCAGC GGCGTTGAAA TTTTCGAGAA CGACTTCCTG 
ACCTATGACG CCTCCCCCCG GGATGTGGCG AAAATGGTTG CCGACCACGG TCTCGACATC 
ACCCTGTTCC AGCCCTTCCG CGATTTCGAA GGCATGCCGG AACTGCACCG CGCCCGCGCT 
TTTGAGCGGG CCGAGCGCAA ATTCGAGATC ATGGATGAGC TTGGCACCGA CCTGATGCTG 
ATCTGCTCAA ATGTCTCTCC CATCTCGCTG GGCGGCATCG ACCGGGCCGC CGCCGATTTC 
CAGGAGCTGG GCGAACGCGC CGCAAAGCAT GGCGTCCGCG TCGGCTACGA GGCACTTGCC 
TGGGGCCGCC ACGTCAACGA CCACAGGGAT GCCTGGGAAG TCGTCCGCCG GGCAAACCAT 
GCCAATGTCG GCCTGATCCT TGATAGTTTT CACACCCTGT CGCGCAAGAT CGATCCAAAC 
TCGATCCGTT CCATTCCCGG CGACAAGATC TTCATCGTCC AACTGGCCGA TGCGCCGCTT 
TTCGACATGG ATCTGCTCTA CTGGAGCCGC CATTTCCGCA ACATGCCCTG CGAAGGCGAC 
TTGCCGGTGG TCGATTTCAT GCGCGCTGTG GCCGCCACAG GCTATACCGG GCCGCTATCC 
CTGGAGATTT TCAACGACCA GTTCCGGGGA GGCTCACCGC GGGCCATTGC CGAGGACGGC 
CACCGCTCGC TGGTCTACCT CATGGACCAA GTCCAACGCC TCGAACCCGA TATCCGGCTC 
AGCGCCCCGG CCATGCCAGC CCCTGTCGAA ACCCAGGGCG TCGAATTCGT GGAATTTGCG 
ACGTCGGTCG AGGAAAAACA GGATCTGGCA GCATTTTTAG CGACGCTCGG CTTTTCGAAA 
ACCGCGACCC ATCGCAACAG GGATCTTGAC CTTTACACCC AGGGCGACAT CCGCATTCTC 
ATCAATACCG ATACGACAAA CAACAGTTTT GCCGGCGCCT CCTATGCAAT CCACGGCACA 
AGTGCCTACG CCTTCGGCAT GAAGGTGGGG CACGCCGAAG ACGCCTTGAA GCGCGCCACG 
GCGCTGGGGG CAACGAGCTT CTCAGAACCG CGCAAACCGG GCGAAGTACC CGTGCCCGCC 
ATTCAAGGCG TGAGCAATGG CGTCATTTAT TTCCTTGATG ACACGCCTGC CCTGTCCGGC 
ATCTGGAAAC AGGAATTCAA AGACGTAGAC GCCGATCAGG CTCCGGCAAA TACCCGCCTG 
ACCCGTATCG ACCATCTCGC CCAGACAACC CGCTATGACG AGATGCTGAC ATGCCTGCTG 
TTTTACGGCT CGATCTTCGC CACGCGGCGC ACGCCCATGG TCGATGTGGT CGATCCGGGC 
GGGCTGGTGC GCAGCCAAGC GATCGAAAGC AAACCAGATC CTCGTTTCAG GGTGACGTTG 
AACGGCGCCG ATAACCGGAA AACCGTCGCC GGAAAGTTTC TCGAAGAAGG CTTCGGCACC 
AGCATCCAGC ATATCGCCCT GGCGACCGAC GATATCTTCG CGACGGCGCA GGCGCTATCG 
GCCTGCGGCT TCCAGGCGCT GACTATCTCG CGCAACTATT ATGACGATTT GGAAGCCCGC 
TTCGGTCTGG AACCGGATTT TGCCGATGCA CTGCGTTCGG CCAGTATCCT TTACGACCGC 
GACGATAATG GCGAGTATTT CCAAATCTAC AGCCGGACCT TCGGTGAGGG CTTTTTCTTC 
GAAATCGTCG AGAGGCGCGG CGCCTATGGT GGTTATGGTG CGATGAACGC CCCGTTCCGT 
ATAGCAGCAC AAAGACGGCA ACTGCGCCCG GATGGCGTTC CGAGATAA

Protein sequence

MAAIAKAGFS GVEIFENDFL TYDASPRDVA KMVADHGLDI TLFQPFRDFE GMPELHRARA 
FERAERKFEI MDELGTDLML ICSNVSPISL GGIDRAAADF QELGERAAKH GVRVGYEALA 
WGRHVNDHRD AWEVVRRANH ANVGLILDSF HTLSRKIDPN SIRSIPGDKI FIVQLADAPL 
FDMDLLYWSR HFRNMPCEGD LPVVDFMRAV AATGYTGPLS LEIFNDQFRG GSPRAIAEDG 
HRSLVYLMDQ VQRLEPDIRL SAPAMPAPVE TQGVEFVEFA TSVEEKQDLA AFLATLGFSK 
TATHRNRDLD LYTQGDIRIL INTDTTNNSF AGASYAIHGT SAYAFGMKVG HAEDALKRAT 
ALGATSFSEP RKPGEVPVPA IQGVSNGVIY FLDDTPALSG IWKQEFKDVD ADQAPANTRL 
TRIDHLAQTT RYDEMLTCLL FYGSIFATRR TPMVDVVDPG GLVRSQAIES KPDPRFRVTL 
NGADNRKTVA GKFLEEGFGT SIQHIALATD DIFATAQALS ACGFQALTIS RNYYDDLEAR 
FGLEPDFADA LRSASILYDR DDNGEYFQIY SRTFGEGFFF EIVERRGAYG GYGAMNAPFR 
IAAQRRQLRP DGVPR