Gene RPD_3222 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPD_3222
Symbol
ID	4023729
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB5
Kingdom	Bacteria
Replicon accession	NC_007958
Strand	+
Start bp	3576118
End bp	3577455
Gene Length	1338 bp
Protein Length	445 aa
Translation table	11
GC content	66%
IMG OID	637963424
Product	phenylacetate--CoA ligase
Protein accession	YP_570348
Protein GI	91977689
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG1541] Coenzyme F390 synthetase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGTGATC TTTCCGACGA CAGGCCGTAT TGGGACGCGC GGCTCGAAAC CCAATCGCGC 
GAACAGTGGG ACGCGCTCAA ACTCTCGCTG CTGCAGCAGC ATGTCGCACA CGCCTATCAC 
GGCTCGCCGG CCTATCGCGC CGCGTTCGAC GCCGCCAAGG TGTCGCCCGA CCAGATCCGG 
ACACTCGACG ACATCCGCCG CTTCCCGTTC ATCGACAAGC GGACGCTGCG CGATCGCCAA 
CAGGCGGCGC CGCCGTTCGG CGATCTGGTC GCCGTGCCGG AACGCGACAT CGTCTACATC 
TCCGCCTCCT CCGGCTCGAC CGGCGTGCCG ACCGCGTCGC CGTTCACCGC GCAGGATTTC 
GACGCCTGGA TCGACTATGA GGCGCGGCAA TTCTGGTCGT CCGGGATGCG GCCGACCGAT 
CGCTACGTGC ATTCGCTGAA CTTCTCGCTG TTCATCGGCG GCCCCTGCGT GCTCGGCGCG 
CAGAAGCTCG GCGCGCTGAG CATTCATGCC GGCACCCTGC CCTCCGACCG GCTGTTGCAG 
ATCATCAAGC AGTTCCAGGC CACCGTGATC TGGACCACGC CGTCTTACGC CTGGTACCTC 
GGCGAGACCG CGATCAAGGA GGGCTATGAT TTGCGCAAGG ATCTCGCCGT GCGCCGGATC 
TTCGTCGCCG GCGAGCCGGG CGGTTCGATT CCGGAGACGC GCGATCGAAT CGAACAATTA 
TGGGGCGCGT CGGTCTACGA CTATTACGGG CTGTCGGACA TTTTCGGCTC CTGCGCCGGC 
ATGTGCGAGG AAAAGAACGG ACTGCATTGG GCCGAGGATC ACATCCTGGT CGAGGTGATC 
GATCCCGACA CCGGCCAGCC GGTGAAGCCC GGCGACCGCG GCGAGATGGT GCTGACCACG 
CTGCAGAAGG CGGCGCGGCC GATGATCCGC TTCCGCACCG GCGACATCGT CAGCTTCAAC 
CCCGAGCCGT GCCGCTGCGG CCGCACCGCG ATCCGCCTCA ACGGCGTGCA CGGACGGCTC 
GACGACATGC TGATCATCAA GGGCGTCAAC CTGTTCCCGA GCGACGTCGA GGCGGTGGCG 
CGTCAGGATC ACGAACTGAC CGGCGAATAC CGATTGGTGG TGGAGCGCGT CAATCATCTC 
GACCGTCTCA CCGTCGAGGT CGAACACATC CACGGCTACA ACGGTGAACT CGACCACCTC 
GCCGACCGGT TCGAACGCCG GCTCCGTGCA GTGACGGGCG TTTCGGCGGC GGTGTCGGTG 
CTCAAACCCG AAACGCTGCC GCGAGCGACC CACAAGGCGA AGCGCGTCGA GGACCGCCGC 
AGCGGCGTGT GGAGCTAA

Protein sequence

MSDLSDDRPY WDARLETQSR EQWDALKLSL LQQHVAHAYH GSPAYRAAFD AAKVSPDQIR 
TLDDIRRFPF IDKRTLRDRQ QAAPPFGDLV AVPERDIVYI SASSGSTGVP TASPFTAQDF 
DAWIDYEARQ FWSSGMRPTD RYVHSLNFSL FIGGPCVLGA QKLGALSIHA GTLPSDRLLQ 
IIKQFQATVI WTTPSYAWYL GETAIKEGYD LRKDLAVRRI FVAGEPGGSI PETRDRIEQL 
WGASVYDYYG LSDIFGSCAG MCEEKNGLHW AEDHILVEVI DPDTGQPVKP GDRGEMVLTT 
LQKAARPMIR FRTGDIVSFN PEPCRCGRTA IRLNGVHGRL DDMLIIKGVN LFPSDVEAVA 
RQDHELTGEY RLVVERVNHL DRLTVEVEHI HGYNGELDHL ADRFERRLRA VTGVSAAVSV 
LKPETLPRAT HKAKRVEDRR SGVWS