Gene Aave_4191 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Aave_4191
Symbol
ID	4666826
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Acidovorax citrulli AAC00-1
Kingdom	Bacteria
Replicon accession	NC_008752
Strand	+
Start bp	4642813
End bp	4643949
Gene Length	1137 bp
Protein Length	378 aa
Translation table	11
GC content	65%
IMG OID	639825377
Product	4-hydroxyphenylpyruvate dioxygenase
Protein accession	YP_972505
Protein GI	120612827
COG category	[E] Amino acid transport and metabolism [R] General function prediction only
COG ID	[COG3185] 4-hydroxyphenylpyruvate dioxygenase and related hemolysins
TIGRFAM ID	[TIGR01263] 4-hydroxyphenylpyruvate dioxygenase

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAACACCC CGCTGCCCCA CCCCGCCGTC CAGGACACCG CCGCCTGGGA GAACCCGATG 
GGTACCGACG GCTTCGAATT CATCGAATAC GCCGCTCCCG ATCCGCAGGC CATGGGCCGG 
GTGTTCGAGG GCATGGGCTT CAAGCCCGTG GCGCGCCACC GCCACAAGAA CGTGACGCTC 
TACCGCCAGG GCGAAATCAA CTTCATCATC AACGCCGAGC CCGACAGTTT CGCGCAGCGT 
TTCGCGCGGC TGCACGGCCC CAGCGTCTGC GCCATCGCCT TCCGCGTGCA CGACGCCAAG 
GCCGCCTACG AGCGCGCGCT GAACCTGGGT GCCTGGGGCT ACGCCGGCCA GGCCGGCCCG 
GGCGAGCTGA ACATTCCCGC CATCAAGGGC ATCGGCGACA GCCTGATCTA CCTGGTGGAC 
CGCTGGCGCG GCAAGAACGG CGCGCAACCG GGCGACATCG GCAACATCGG CTTCTTCGAC 
GTCGATTTCG AGCCGCTGCC GGGCGTGACC GCCGAGGAGG CGCTGAATCC CAAGGGCCAC 
GGCCTGACCT ACATCGACCA CCTGACGCAC AACGTGCACC GCGGCCGGAT GATCGAATGG 
GCGAACTTCT ACGAGCGCCT GTTCAACTTC CGCGAGATCC GCTACTTCGA CATCGAAGGC 
CAGGTCACCG GCGTGAAGAG CAAGGCCATG ACCAGCCCCT GCGGCAAGAT CCGCATCCCG 
ATCAACGAAG AGGGCAAGGA AAAGGCCGGC CAGATCCAGG AATACCTGGA CATGTACAAC 
GGCGAGGGCA TCCAGCACAT CGCCATGGGC TCGGACGACC TCTACGCCAC GGTGGACGCC 
CTGCGCGGCT CCGGCGTGCG CCTGCTGGAC ACGATCGACA CCTACTACGA GCTGGTGGAC 
AAGCGCATTC CCGGCCACGG CGAGAGCGTG GAAGAGCTGC ACAAGCGCAA GATCCTGATC 
GACGGCAAGA AGGACGCGAT CCTGCTGCAG ATCTTCAGCG AAAACCAGCT CGGCCCGATC 
TTCTTCGAGT TCATCCAGCG CAAGGGGGAC GACGGCTTCG GCAACGGCAA CTTCAAGGCG 
CTGTTCGAGA GCATCGAGCT CGACCAGATG CGCCGCGGGG TGCTGCAGGG CGCCTGA

Protein sequence

MNTPLPHPAV QDTAAWENPM GTDGFEFIEY AAPDPQAMGR VFEGMGFKPV ARHRHKNVTL 
YRQGEINFII NAEPDSFAQR FARLHGPSVC AIAFRVHDAK AAYERALNLG AWGYAGQAGP 
GELNIPAIKG IGDSLIYLVD RWRGKNGAQP GDIGNIGFFD VDFEPLPGVT AEEALNPKGH 
GLTYIDHLTH NVHRGRMIEW ANFYERLFNF REIRYFDIEG QVTGVKSKAM TSPCGKIRIP 
INEEGKEKAG QIQEYLDMYN GEGIQHIAMG SDDLYATVDA LRGSGVRLLD TIDTYYELVD 
KRIPGHGESV EELHKRKILI DGKKDAILLQ IFSENQLGPI FFEFIQRKGD DGFGNGNFKA 
LFESIELDQM RRGVLQGA