Gene RPD_1824 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPD_1824
Symbol	paaA
ID	4022306
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB5
Kingdom	Bacteria
Replicon accession	NC_007958
Strand	+
Start bp	2042952
End bp	2043935
Gene Length	984 bp
Protein Length	327 aa
Translation table	11
GC content	66%
IMG OID	637962018
Product	phenylacetate-CoA oxygenase subunit PaaA
Protein accession	YP_568961
Protein GI	91976302
COG category	[S] Function unknown
COG ID	[COG3396] Uncharacterized conserved protein
TIGRFAM ID	[TIGR02156] phenylacetate-CoA oxygenase, PaaG subunit

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.123429
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTACACCC AGGCGCTCAA TGTCTCCGAC GGCGACGACC GAAATCTGGA GGATGCCGGC 
CGCGCCGCGC AGTTTCAGGC GCGGATCGAC GCCGAGGAGC GGATCGAGCC GAACGACTGG 
ATGCCGGCGG CCTATCGCAA GACGCTGACG CGGCAGATTT CCCAGCACGC CCATTCCGAA 
ATTGTCGGGA TGCTGCCGGA AGGCAACTGG ATCACCCGGG CGCCGACGCT GCGCCGCAAG 
GCGGCCTTGC TCGCCAAGGT GCAGGACGAG TGCGGCCACG GGCTGTATCT CTACGCCGCC 
GCCGAGACGC TCGGCTCCTC GCGCGAGGAG CTGGTCGATC AGATGCTGAG CGGCAAGGCG 
AAGTACTCCT CGATCTTCAA CTACCCGACG TTGACCTGGG CGGATATCGG CGCGATCGGC 
TGGCTGGTCG ACGGCGCTGC GATCATGAAC CAGATCCCGC TGTGCCGCTG TTCCTACGGT 
CCCTATGCCC GCGCGATGAT CCGCGTCTGC AAGGAGGAGT CGTTCCACCA GCGTCAGGGT 
TACGAGATCA TGTTGACGCT GTGCCGCGGC TCCGCCGAGC AGAAGGCGAT GGCGCAGGAC 
GCGCTGAACC GCTGGTGGTG GCCGTGCCTG ATGATGTTCG GCCCGCCGGA TCAGGCGAGC 
CAGCACAGCG ACACCTCGAC CAAATGGAAG ATCAAGCGCT TCTCCAACGA CGAGCTGCGC 
CAGAAATTCG TCGATGCCAC CGTGCCGCAG GCGCATTACC TCGGCCTGAC GCTTCCCGAT 
CCGGCGCTGA CCAAGAACGA GGCGACCGGG CATTGGGACT ACGGCGCGAT CGACTGGGAT 
GAATTCAAGC AGGTGCTGGC CGGCAACGGC CCGTGCAACC GCGATCGCCT CGCGGCGCGG 
CGCAAGGCCC ATGACGACGG CGCCTGGGTT CGCGACGCCG CGGTCGCCTA TGCCGAAAAG 
CGCAAGAACA GACTGGCGGC GTAA

Protein sequence

MYTQALNVSD GDDRNLEDAG RAAQFQARID AEERIEPNDW MPAAYRKTLT RQISQHAHSE 
IVGMLPEGNW ITRAPTLRRK AALLAKVQDE CGHGLYLYAA AETLGSSREE LVDQMLSGKA 
KYSSIFNYPT LTWADIGAIG WLVDGAAIMN QIPLCRCSYG PYARAMIRVC KEESFHQRQG 
YEIMLTLCRG SAEQKAMAQD ALNRWWWPCL MMFGPPDQAS QHSDTSTKWK IKRFSNDELR 
QKFVDATVPQ AHYLGLTLPD PALTKNEATG HWDYGAIDWD EFKQVLAGNG PCNRDRLAAR 
RKAHDDGAWV RDAAVAYAEK RKNRLAA