Gene EcHS_A1479 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcHS_A1479
Symbol	paaK
ID	5591587
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli HS
Kingdom	Bacteria
Replicon accession	NC_009800
Strand	+
Start bp	1479623
End bp	1480693
Gene Length	1071 bp
Protein Length	356 aa
Translation table	11
GC content	53%
IMG OID	640920636
Product	phenylacetate-CoA oxygenase/reductase, PaaK subunit
Protein accession	YP_001458192
Protein GI	157160874
COG category	[C] Energy production and conversion
COG ID	[COG1018] Flavodoxin reductases (ferredoxin-NADPH reductases) family 1
TIGRFAM ID	[TIGR02160] phenylacetate-CoA oxygenase/reductase, PaaK subunit

Plasmid Coverage information

Num covering plasmid clones	57
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACAACGT TTCATTCCTT AACGGTGGCA AAAGTGGAGC CGGAAACCCG TGATGCGGTG 
ACCATTACCT TTGCGGTGCC CCAGCCTTTG CAGGAGGCGT ATCGCTTTCG CCCCGGTCAA 
CATTTGACCT TAAAAGCCAG CTTTGATGGT GAAGAATTAC GCCGTTGTTA CTCCATTTGC 
CGCAGCTATC TGCCTGGCGA AATTAGTGTG GCGGTGAAAG CCATTGAAGG CGGACGTTTC 
TCCCGCTATG CCCGCGAACA CATCCGCCAG GGTATGACGC TGGAGGTCAT GGTGCCGCAG 
GGGCATTTCG GCTATCAGCC GCAGGCCGAA CGCCAGGGGC GCTATCTGGC AATTGCAGCA 
GGATCAGGTA TTACGCCAAT GCTGGCGATT ATCGCCACCA CTTTACAAAC CGAGCCTGAA 
AGTCAGTTCA CCCTGATCTA CGGTAACCGT ACCAGCCAGA GCATGATGTT TCGCCAGGCA 
CTGGCAGACC TGAAAGACAA ATATCCTCAG CGTTTACAGT TGTTGTGCAT TTTCAGTCAG 
GAAACCCTCG ACAGCGATCT GCTTAACGGG CGTATTGACG GTGAAAAATT ACAGTCACTT 
GGGGCCTCGC TCATTAATTT TCGTCTTTAT GATGAGGCAT TTATTTGTGG TCCGGCGGCG 
ATGATGGATG ACGCGGAAAC CGCCTTAAAA GCACTGGGAA TGCCAGATAA AACCATTCAT 
CTGGAGCGGT TTAATACGCC TGGCACGCGC GTCAAACGTA GCGTTAACGT GCAAAGTGAC 
GGACAAAAAG TGACTGTACG TCAGGATGGG CGGGATCGGG AAATCGTGCT TAATGCCGAC 
GATGAAAGCA TTCTCGATGC GGCATTGCGC CAGGGGGCGG ATCTGCCCTA TGCCTGCAAA 
GGCGGCGTCT GTGCGACCTG CAAATGCAAA GTGCTGCGTG GCAAAGTGGC GATGGAAACC 
AATTACAGTC TGGAACCGGA TGAACTGGCC GCAGGTTATG TGTTGAGTTG CCAGGCACTG 
CCGCTGACCA GCGATGTGGT GGTTGACTTT GACGCGAAGG GGATGGCATG A

Protein sequence

MTTFHSLTVA KVEPETRDAV TITFAVPQPL QEAYRFRPGQ HLTLKASFDG EELRRCYSIC 
RSYLPGEISV AVKAIEGGRF SRYAREHIRQ GMTLEVMVPQ GHFGYQPQAE RQGRYLAIAA 
GSGITPMLAI IATTLQTEPE SQFTLIYGNR TSQSMMFRQA LADLKDKYPQ RLQLLCIFSQ 
ETLDSDLLNG RIDGEKLQSL GASLINFRLY DEAFICGPAA MMDDAETALK ALGMPDKTIH 
LERFNTPGTR VKRSVNVQSD GQKVTVRQDG RDREIVLNAD DESILDAALR QGADLPYACK 
GGVCATCKCK VLRGKVAMET NYSLEPDELA AGYVLSCQAL PLTSDVVVDF DAKGMA