Gene RPD_1317 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPD_1317
Symbol
ID	4021794
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB5
Kingdom	Bacteria
Replicon accession	NC_007958
Strand	-
Start bp	1479825
End bp	1481228
Gene Length	1404 bp
Protein Length	467 aa
Translation table	11
GC content	66%
IMG OID	637961510
Product	carotenoid oxygenase
Protein accession	YP_568456
Protein GI	91975797
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG3670] Lignostilbene-alpha,beta-dioxygenase and related enzymes
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTGCAGG TAACGGGGAT TCCGGATGCG TGCGATAATC TTGCACCGAT CCCGATGGAA 
TGCGACGCGC CGTCTCTGCC GATCAAAGGC GAGCTGCCGC GCGAGCTGAA CGGCACGCTG 
TATCGCAACG GCGCCAACCC GCAATTCGCC TCGCCGAACG CGCACTGGTT CTTCGGCGAC 
GGGATGCTCC ATGCTTTCAG GCTGGAGAAC GGCCGCGCCA GCTATCGCAA CCGCTGGGTT 
CGCACGCCGA AATGGCTGGC CGAACATGCC GCCGGTCGGC CGCTCTACGG CGAGTTCAAC 
CTCAAGCTGC CAGACGCGCC GCGCTCGGCG CCCGATGACG GCAACGTCGC CAACACCAAC 
ATCGTGTTTC ACGCCGGCCG GCTGCTCGCG CTGGAAGAGG CGCATCTGCC GATCGAAATC 
GAGCGCGACA CGCTGGCGAC CCGCGGCTAT TGCGACTATG GCGGCGCGCT GAAAGGGCCG 
TTCACCGCGC ATCCGAAGAT CGACCCGGTG ACCGGCGAGA TGCTGTTCTT CGGCTACAAC 
GCCGCCGGGC CGTTGAAACG GACGATGTCC TTCGGCGCGA TCGATGCGTC GGGTCATGTG 
ACGCGATTCG AGTACTTCAA GGCGCCTTAC GCGGCGATGG TGCACGACTT CATCGTCACC 
GAGAACTACG TGCTGTTTCC GATCCTGCCG CTGACCGGCA GCATCTGGCG GGCGATGCGC 
GGTCGGCCGC CTTATGCCTG GGACCCCGGT AAGGGCTCCT ATGTCGGCGT GATGAAGCGC 
ACCGGCACGA CGCGCGACAT CCGCTGGTTT CGCGGCGACG CATGCTTCGT GTTCCACGTC 
ATGAATGCGT GGGAGGACGG GACAAAGATC GTCGCCGACG TGATGCAATC CGAGGAAGCG 
CCGCTGTTCA CCCATCCCGA CGGCCGCCGC ACCGATCCCG AGAAGGGCCG CGCGCGGTTG 
TGCCGCTGGA GCTTCGACCT CGCCGGCAAC ACCAATGCCT TCAAGCGCAG CTATCTCGAC 
GACATCAGCG GCGAATTCCC GCGGATCGAC GAGCGCCGCG CCGGCCTGCG CAGCGGCCAC 
GGCTGGTACG CCTGCGCCAG CCCGGAGACG CCGATGCTCG GGATGCTCAC CGGACTCGTG 
CATGTCGACG GCAACGGCCA TCGTCGCGCG CGCTATCTGC TGCCAACCGG CGACACCATC 
GGCGAGCCGG TGTTCGTGCC GCGCAAGCCG GATTCAGCCG AAGCCGATGG CTGGCTGCTG 
ACCGTGATCT GGCGCAGCTG CGAAAACCGC AGCGACCTCG CGGTGTTCAA CGCCGCCGAC 
ATCGCCGGCG GCCCGATCGC CTTGGTGCAA CTCGGCCACC GCGTCCCGGA CGGCTTTCAC 
GGCAATTGGG TGGCGGCGGG GTGA

Protein sequence

MLQVTGIPDA CDNLAPIPME CDAPSLPIKG ELPRELNGTL YRNGANPQFA SPNAHWFFGD 
GMLHAFRLEN GRASYRNRWV RTPKWLAEHA AGRPLYGEFN LKLPDAPRSA PDDGNVANTN 
IVFHAGRLLA LEEAHLPIEI ERDTLATRGY CDYGGALKGP FTAHPKIDPV TGEMLFFGYN 
AAGPLKRTMS FGAIDASGHV TRFEYFKAPY AAMVHDFIVT ENYVLFPILP LTGSIWRAMR 
GRPPYAWDPG KGSYVGVMKR TGTTRDIRWF RGDACFVFHV MNAWEDGTKI VADVMQSEEA 
PLFTHPDGRR TDPEKGRARL CRWSFDLAGN TNAFKRSYLD DISGEFPRID ERRAGLRSGH 
GWYACASPET PMLGMLTGLV HVDGNGHRRA RYLLPTGDTI GEPVFVPRKP DSAEADGWLL 
TVIWRSCENR SDLAVFNAAD IAGGPIALVQ LGHRVPDGFH GNWVAAG