Gene A2cp1_3571 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	A2cp1_3571
Symbol
ID	7299621
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anaeromyxobacter dehalogenans 2CP-1
Kingdom	Bacteria
Replicon accession	NC_011891
Strand	+
Start bp	3990977
End bp	3992164
Gene Length	1188 bp
Protein Length	395 aa
Translation table	11
GC content	71%
IMG OID	643596384
Product	4-hydroxyphenylpyruvate dioxygenase
Protein accession	YP_002493967
Protein GI	220918663
COG category	[E] Amino acid transport and metabolism [R] General function prediction only
COG ID	[COG3185] 4-hydroxyphenylpyruvate dioxygenase and related hemolysins
TIGRFAM ID	[TIGR01263] 4-hydroxyphenylpyruvate dioxygenase

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.665033
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACCTCGC ACTCGCAGAA GACGCAGCTC GAGCCGCTCG GCATCGTCCG CATCGAGGGG 
CTGCATTACT ACGTGCACGA CCTCGAGCGC AGCCGCCGCT TCTACACGCA GAAGATGGAC 
TTCGCGGAGG TGGCCCGCAG CGCGCCCGCG CTGGAGCGGG AGGGCCGGCA GCGCTCGGCG 
GTGTTCGAGG CGGGCGACGT CCGGGTGGTG TGCTCGGAGC CGGTGGGCGA GGGCGGCCGC 
GCCTGGCGCT GGCTGCGCAA GCACCCCGAC GGCGTGGGCA CGGTGGTGTT CCAGGTGGAG 
GACGCGGACC GCTGCTTCCG GCTGCTGGAG GAGCGCGGGG CGACGCCCAT CACCGACGTG 
CAGGAGCACC GCGACGACGG AGGGACGCTG CGCACGTTCA ACATCACCAC CCCGCTCGGC 
GACACCACCT TCCGCTTCGT GGAGCGCCGC GGCTACCGCG CCGTCTACCC GGGCATCGAG 
CCGCTCGCCG CGCCGGAGGG CGGGCGCAAC GCGTTCGGCT TCGGCCACGT GGACCACCTC 
ACCAACAACT TCCAGACCAT GAAGCCGGCG CTCCTGTGGA TGGAGCACGT CATGGGGATG 
GAGGAGTTCT GGGAGGTGGA GTTCCACACC AAGGACGCGG CCGGCGCGCG CCGGGCCGCG 
CTCGAGGCGC AGAAGGGCTC GGGCCTGCGC TCGGTGGTGA TGCGCGAGCC GCGCTCCGGC 
GTGAAGTTCG CGAACAACGA GCCGTGGCGC CCCGCGTTCA AGTCCTCGCA GATCAACGTC 
TTCAACGAGG ACCACCGCGG CGACGGCGTG CAGCACGCCG CGCTGACGGT GCAGGACATC 
CTCTCCTCGG TGCGCGGCAT GCGCGCCCGC GGGGTGGAGT TCATGCCCAC GCCGGCGACG 
TACTACGAGG CGCTGCCGGA GCGGATCCGC AGCACCGGCA TCGGCCGGAT CGACGAGGAC 
CCGCGCGTGC TGCAGGAGCT CGAGATCCTG GTGGACGGCG CCGGCGACCA CTCCTACCTG 
CTGCAGATCT TCCTGCGCGA CGCGGCCGGC CTGTACCACG AGCCCGACGC CGGGCCGTTC 
TTCTTCGAGA TCATCCAGCG CAAGGGCGAC CAGGGCTTCG GCGCGGGCAA CTTCCGCGCG 
CTGTTCGAGT CCATCGAGCG CGAGCAGGTG AAGGAAGGGC GGGCCTGA

Protein sequence

MTSHSQKTQL EPLGIVRIEG LHYYVHDLER SRRFYTQKMD FAEVARSAPA LEREGRQRSA 
VFEAGDVRVV CSEPVGEGGR AWRWLRKHPD GVGTVVFQVE DADRCFRLLE ERGATPITDV 
QEHRDDGGTL RTFNITTPLG DTTFRFVERR GYRAVYPGIE PLAAPEGGRN AFGFGHVDHL 
TNNFQTMKPA LLWMEHVMGM EEFWEVEFHT KDAAGARRAA LEAQKGSGLR SVVMREPRSG 
VKFANNEPWR PAFKSSQINV FNEDHRGDGV QHAALTVQDI LSSVRGMRAR GVEFMPTPAT 
YYEALPERIR STGIGRIDED PRVLQELEIL VDGAGDHSYL LQIFLRDAAG LYHEPDAGPF 
FFEIIQRKGD QGFGAGNFRA LFESIEREQV KEGRA