Gene Rpal_4289 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rpal_4289
Symbol	paaA
ID	6411973
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris TIE-1
Kingdom	Bacteria
Replicon accession	NC_011004
Strand	-
Start bp	4616321
End bp	4617307
Gene Length	987 bp
Protein Length	328 aa
Translation table	11
GC content	66%
IMG OID	642714171
Product	phenylacetate-CoA oxygenase subunit PaaA
Protein accession	YP_001993260
Protein GI	192292655
COG category	[S] Function unknown
COG ID	[COG3396] Uncharacterized conserved protein
TIGRFAM ID	[TIGR02156] phenylacetate-CoA oxygenase, PaaG subunit

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.00273791
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTACACCC AGGCACTGAA TGTGTCGGAC GGTGACGAGC GGACCATCGA GGACGCCGAG 
CGCGCCGCGC GTTTCCAGGC GCGGATCGAT GCCGAGGAGC GGATCGAGCC GAACGATTGG 
ATGCCGGCGG CGTATCGCAA GACGTTGGTC CGACAGATCT CCCAGCACGC GCATTCCGAA 
GTCGTCGGCA TGCTGCCGGA GGGCAACTGG ATCACCCGCG CGCCGACGCT GCGGCGCAAG 
GCGGCGCTGC TCGCCAAGGT CCAGGACGAA TGCGGCCACG GCCTGTACCT TTACGCCGCC 
GCCGAAACGC TCGGCGCCTC GCGCGAGGAG CTGGTCGATC AGCTGCTCAG CGGCAAGGCG 
AAGTACTCGT CGATCTTCAA CTATCCGACC CTGACCTGGG CCGATATCGG CGCGATCGGC 
TGGCTGGTCG ACGGCGCCGC GATCATGAAC CAGATCCCGC TGTGCCGCTG CTCCTACGGG 
CCGTATGCGC GCGCGATGAT CCGCGTCTGC AAGGAGGAAT CCTTCCACCA GCGACAGGGC 
TACGAGATCA TGCTGACGCT AGCCAAGGGC TCGGCCGAGC AGAAAGCGTT GGCGCAGGAC 
GCGCTGAACC GCTGGTGGTG GCCGTGCCTG ATGATGTTCG GCCCGCCCGA TCAGGCCAGC 
CAGCACAGCG ACACCTCCAC CAAGTGGAAG ATCAAGCGGT TCTCCAACGA CGAGTTACGG 
CAGAAATTCG TCGATGCCAC GGTGCCGCAG GCGCACTATC TCGGCCTGAC GCTTCCCGAT 
CCCGATCTGA AGCAGAACGA CGCGACCGGG CATTGGGAGT ACGGCGAAAT TCCTTGGGAC 
GAGTTCAAGC AGGTGCTCGC CGGCAACGGC CCTTGCAACC GCGACCGCAT GGCGGCGCGG 
CGCAAGGCCC ACGACGACGG CGCCTGGGTG CGCGAGGCGG CCGCTGCCTA CGCCGAGAAA 
CGCAAGAAGA AACTGGCGGC GGCGTAA

Protein sequence

MYTQALNVSD GDERTIEDAE RAARFQARID AEERIEPNDW MPAAYRKTLV RQISQHAHSE 
VVGMLPEGNW ITRAPTLRRK AALLAKVQDE CGHGLYLYAA AETLGASREE LVDQLLSGKA 
KYSSIFNYPT LTWADIGAIG WLVDGAAIMN QIPLCRCSYG PYARAMIRVC KEESFHQRQG 
YEIMLTLAKG SAEQKALAQD ALNRWWWPCL MMFGPPDQAS QHSDTSTKWK IKRFSNDELR 
QKFVDATVPQ AHYLGLTLPD PDLKQNDATG HWEYGEIPWD EFKQVLAGNG PCNRDRMAAR 
RKAHDDGAWV REAAAAYAEK RKKKLAAA