Gene RPB_3641 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPB_3641
Symbol	paaA
ID	3911443
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris HaA2
Kingdom	Bacteria
Replicon accession	NC_007778
Strand	-
Start bp	4177662
End bp	4178729
Gene Length	1068 bp
Protein Length	355 aa
Translation table	11
GC content	66%
IMG OID	637885543
Product	phenylacetate-CoA oxygenase subunit PaaA
Protein accession	YP_487247
Protein GI	86750751
COG category	[S] Function unknown
COG ID	[COG3396] Uncharacterized conserved protein
TIGRFAM ID	[TIGR02156] phenylacetate-CoA oxygenase, PaaG subunit

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.805195
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGACCGTCC AATTGGTCAA TTATATTTCC AACAAGGCCG GGCCGCGCGC CCGAGCCTGC 
GAGGAAACTG CCGAGGACGC CGCCATGTAC ACACAGGCGC TCAACACCAC CGAGGCCGAG 
GATCGCAACC TCGAGGACGC CGGCCGCGCC GCGCTGTTCC AGGCGCGGAT CGATGCCGAA 
GAGCGGATCG AGCCCAACGA CTGGATGCCG GCGGCGTATC GCAAGACGCT GACGCGGCAG 
ATCTCGCAGC ACGCCCATTC CGAGATCGTC GGCATGTTGC CGGAAGGCAA TTGGATCACC 
CGCGCGCCGA CGCTGCGCCG CAAGGCCGCC TTGCTCGCCA AGGTGCAGGA CGAATGCGGC 
CACGGGCTGT ATCTCTACGC CGCCGCAGAG ACGCTCGGCT CGTCGCGCGA AGAGCTGGTC 
GATCAGATGC TGAGCGGCAA GGCGAAGTAC TCCTCGATCT TCAACTACCC GACGCTGACC 
TGGGCGGATA TCGGCGCGAT CGGCTGGCTG GTCGACGGCG CCGCGATCAT GAACCAGATT 
CCGCTGTGCC GCTGCTCCTA CGGCCCCTAT GCGCGGGCGA TGATCCGCGT CTGCAAGGAG 
GAGTCGTTCC ACCAGCGCCA GGGCTACGAG ATCATGCTGA CGCTGTGCCG CGGTTCGGCC 
GAGCAGAAGG CGATGGCGCA GGATGCGCTC GACCGCTGGT GGTGGCCATG CCTGATGATG 
TTCGGCCCGC CGGATCAGGC CAGCCAGCAC AGCGACACCT CGACCAGATG GAAGATCAAG 
CGCTTCTCCA ACGACGAATT GCGCCAGAAA TTCGTCGATG CGACCGTGCC GCAGGCGCAC 
TATCTCGGGC TCACGATTCC CGATCCGGCG TTGACCAGGA ACGAGTCCAC CGGGCACTGG 
GACTACGGCA CGATCGACTG GGACGAATTC AAGCAGGTGC TGGCCGGCAA CGGCCCGTGC 
AACCGCGACC GGCTGGCGGC GCGGCGCAAG GCGCATGACG ACGGCGCCTG GGTTCGCGAA 
GCCGCGATGG CCTTCGCCGA AAAGCGCAAG AAGAAGATCG CGGCCTAG

Protein sequence

MTVQLVNYIS NKAGPRARAC EETAEDAAMY TQALNTTEAE DRNLEDAGRA ALFQARIDAE 
ERIEPNDWMP AAYRKTLTRQ ISQHAHSEIV GMLPEGNWIT RAPTLRRKAA LLAKVQDECG 
HGLYLYAAAE TLGSSREELV DQMLSGKAKY SSIFNYPTLT WADIGAIGWL VDGAAIMNQI 
PLCRCSYGPY ARAMIRVCKE ESFHQRQGYE IMLTLCRGSA EQKAMAQDAL DRWWWPCLMM 
FGPPDQASQH SDTSTRWKIK RFSNDELRQK FVDATVPQAH YLGLTIPDPA LTRNESTGHW 
DYGTIDWDEF KQVLAGNGPC NRDRLAARRK AHDDGAWVRE AAMAFAEKRK KKIAA