Gene PP_4621 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PP_4621
Symbol	hmgA
ID	1041590
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Pseudomonas putida KT2440
Kingdom	Bacteria
Replicon accession	NC_002947
Strand	-
Start bp	5243178
End bp	5244479
Gene Length	1302 bp
Protein Length	433 aa
Translation table	11
GC content	64%
IMG OID	637148019
Product	homogentisate 1,2-dioxygenase
Protein accession	NP_746730
Protein GI	26991305
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG3508] Homogentisate 1,2-dioxygenase
TIGRFAM ID	[TIGR01015] homogentisate 1,2-dioxygenase

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.356023
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAACCGCG ACACGTCGCC CGACCTTCAC TACCTGAGTG GCTTCGGCAA CGAATTCGCC 
AGCGAAGCAT TGCCCGGGGC GCTGCCTGTT GGGCAGAACT CCCCGCAGAA GGCCCCGTAT 
GGCCTGTATG CCGAGCTGCT GTCGGGCACG GCGTTCACCA TGGCCCGCAG CGAGCTGCGC 
CGTACCTGGC TGTACCGCAT TCGCCCTTCT GCCTTGCACC CACGCTTCGA GCGCCTGGCG 
CGCCAGCCGC TCGGCGGGCC ACTGGGTGGC ATCAACCCCA ACCGCCTGCG CTGGAGCCCG 
CAGCCGATTC CTGCTGAACC GACCGATTTC ATCGAAGGTT GGCTGCCCAT GGCTGCCAAC 
GCCGGAGCGG AAAAACCGGC TGGCGTGAGC ATCTACATCT ACCGCGCCAA CCGGTCCATG 
GAACGGGTGT TCTTCAACGC AGACGGTGAG CTGCTACTGG TGCCGGAACA GGGCCGCCTG 
CGTATCGCCA CCGAGCTGGG CGTGATGGAG GTCGAACCGT TGGAAATTGC GGTGATCCCA 
CGTGGCATGA AGTTCCGCGT CGAACTGCTC GACGGCCAGG CCCGTGGCTA CATCGCGGAA 
AACCACGGTG CGCCGCTGCG TCTGCCGGAC CTGGGCCCGA TCGGCAGCAA CGGCCTGGCC 
AACCCCCGCG ACTTCCTCAC GCCTGTGGCC CACTACGAAG AAGCCGAAGG CCCGGTGCAA 
CTGGTACAGA AGTTCCTGGG TGAGCACTGG GCCTGCGAGC TGCAGCACTC GCCACTGGAC 
GTTGTGGCCT GGCATGGCAG CAACGTGCCG TACAAGTATG ACCTGCGCCG CTTCAACACC 
ATCGGCACGG TCAGCTTCGA CCACCCGGAC CCCTCGATCT TCACCGTGCT CACCTCGCCA 
ACCAGCGTGC ATGGCATGGC CAACATGGAC TTCGTGATTT TCCCGCCACG CTGGATGGTG 
GCCGAGAACA CCTTCCGTCC GCCATGGTTC CACCGCAACC TGATGAACGA GTTCATGGGC 
CTGATCAATG GCGCCTACGA CGCCAAGGCC GAGGGCTTCC TGCCGGGTGG TGCCTCGTTG 
CACGGGGTGA TGAGTGCCCA TGGCCCCGAC GCCGAAACCT GTGAAAAGGC CATTGCCGCT 
GACCTGGCGC CACACAAGAT CGACAACACC ATGGCCTTCA TGTTCGAGAC CAGCCAAGTG 
TTGCGCCCGA GCCTGCAAGC CCTTGAATGC CCGCAATTGC AGGCCGACTA CGATAGTTGC 
TGGGCGACTT TGCCGAGCAC CTTCAACCCG AACCGGAGAT AA

Protein sequence

MNRDTSPDLH YLSGFGNEFA SEALPGALPV GQNSPQKAPY GLYAELLSGT AFTMARSELR 
RTWLYRIRPS ALHPRFERLA RQPLGGPLGG INPNRLRWSP QPIPAEPTDF IEGWLPMAAN 
AGAEKPAGVS IYIYRANRSM ERVFFNADGE LLLVPEQGRL RIATELGVME VEPLEIAVIP 
RGMKFRVELL DGQARGYIAE NHGAPLRLPD LGPIGSNGLA NPRDFLTPVA HYEEAEGPVQ 
LVQKFLGEHW ACELQHSPLD VVAWHGSNVP YKYDLRRFNT IGTVSFDHPD PSIFTVLTSP 
TSVHGMANMD FVIFPPRWMV AENTFRPPWF HRNLMNEFMG LINGAYDAKA EGFLPGGASL 
HGVMSAHGPD AETCEKAIAA DLAPHKIDNT MAFMFETSQV LRPSLQALEC PQLQADYDSC 
WATLPSTFNP NRR