Gene RPD_3314 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPD_3314
Symbol
ID	4023824
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB5
Kingdom	Bacteria
Replicon accession	NC_007958
Strand	-
Start bp	3670884
End bp	3672098
Gene Length	1215 bp
Protein Length	404 aa
Translation table	11
GC content	68%
IMG OID	637963518
Product	thiolase
Protein accession	YP_570439
Protein GI	91977780
COG category	[I] Lipid transport and metabolism
COG ID	[COG0183] Acetyl-CoA acetyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGATTCCG GGCCCGCGCC AAGGGGCGCG TCCCGGAATG ACGGACGATG GGGTGATGCT 
AAGCGCCGGG CGCGCTTCAT GAGTTACATC TCCGGCACAG GCCTCACCCC GTTCGGCAAG 
ATCGAAGGCT CGACCACGCT GTCGCTGATG CGCGAGGCGG CCGAGCTGGC CGTCGCCGAC 
GCCGGGCTCG CGCGGAGCGA TATCGACGGG CTGCTGTGCG GCTATTCGAC GACGATGCCG 
CACATCATGC TGGCTACGGT GTTCGCCGAG CATTTCGGCA TCCGGCCGAG TTACTGCCAC 
GCGATACAGG TCGGCGGCGC CACCGGGATG GCAATGACGA TGCTGGCGCA TCAGCTCGTC 
GAAAGCGGCG CGGCGAAGAA CATCCTGGTT GTCGGCGGCG AGAACCGGCT GACCGGCCAG 
AGCCGCGACG CTTCCGTGCA GGCGCTGGCG CAGGTCGGCC ATCCGACTTA CGAAGTGCCG 
CTGGGGCCGA CCATTCCTGC GTATTACGGC CTGGTCGCGT CGCGCTACAT GCACGATCAC 
GGCGTCACCG AAGAGGACCT CGCCGAATTC GCGGTGCTGA TGCGCGCACA TGCGGCGACC 
CATCCCGGCG CGCAGTTTCG CGATTCCATC AGCGTCGCCG AGGTGATGGC GTCGAAGCCG 
ATTGCCTCGC CGCTGAAGCT GCTCGATTGC TGCCCGGTGT CGGACGGCGG CGCGGCGCTG 
GTGATCAGCG CCGAGCCGAC CACGGCGCAT CGCGTCAAGG TGCGCGGCTG CGCCCAGGCG 
CATACTCATC AGCACGTCAC CGCGATGCCG GCCGCGGGGC CATCGGGAGC GGAGCTTGCA 
GTGGAGCGGG CGAAAGCGGC GAGCGGTGTG GCGATCGGCG ATGTCCGCTA CGCCGCGGTC 
TATGACAGCT TCACCATCAC GCTGTTGATG CTACTCGAAG ACCTCGGCCT CGCCAAACGC 
GGCGAAGCCG CCGCGCAAGC GCGCAGTGGG AATTTCTCGC GCGCTGGCGT GATGCCCCTG 
AATACCCATG GCGGGCTGCT GAGCTACGGC CATTGCGGCG TCGGCGGCGC GATGGCGCAT 
CTGGTCGAGA CCCATCTGCA GATGACCGGT CGCGCCGGCG ATCGTCAGGT CCGCGACGCC 
TCGGTGGCGC TGCTGCACGG CGACGGCGGC GTGCTGTCGT CGCATGTCAG CATGTTTCTG 
GAGCGGGTGC GATGA

Protein sequence

MDSGPAPRGA SRNDGRWGDA KRRARFMSYI SGTGLTPFGK IEGSTTLSLM REAAELAVAD 
AGLARSDIDG LLCGYSTTMP HIMLATVFAE HFGIRPSYCH AIQVGGATGM AMTMLAHQLV 
ESGAAKNILV VGGENRLTGQ SRDASVQALA QVGHPTYEVP LGPTIPAYYG LVASRYMHDH 
GVTEEDLAEF AVLMRAHAAT HPGAQFRDSI SVAEVMASKP IASPLKLLDC CPVSDGGAAL 
VISAEPTTAH RVKVRGCAQA HTHQHVTAMP AAGPSGAELA VERAKAASGV AIGDVRYAAV 
YDSFTITLLM LLEDLGLAKR GEAAAQARSG NFSRAGVMPL NTHGGLLSYG HCGVGGAMAH 
LVETHLQMTG RAGDRQVRDA SVALLHGDGG VLSSHVSMFL ERVR