Gene Rpal_3952 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rpal_3952
Symbol
ID	6411633
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris TIE-1
Kingdom	Bacteria
Replicon accession	NC_011004
Strand	-
Start bp	4239801
End bp	4240937
Gene Length	1137 bp
Protein Length	378 aa
Translation table	11
GC content	68%
IMG OID	642713833
Product	putative thiolase
Protein accession	YP_001992923
Protein GI	192292318
COG category	[I] Lipid transport and metabolism
COG ID	[COG0183] Acetyl-CoA acetyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.130005
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCTACA TCACCGGCGT GGGTCTCACG CCGTTCGGCA AGATCGATGG TTCGACCACG 
CTCGGCCTGA TGCGGGAGGC GGCGGAGGCG GCGATCGCGG ATGCGGGGCT GAAGCGCGGC 
GACATCGACG GGCTGCTGTG CGGCTATTCG ACCACGATGC CGCACATCAT GCTGGCGACG 
GTGTTCGCCG AGCATTTCGG CATCCGGCCG AGCTATTGCC ACGCGGTGCA GGTCGGCGGC 
GCCACCGGCA TGGCGATGGC GATGCTGGCG CATCAGCTGG TCGAGAGCGG GGCGGCCAAG 
AACATCCTGG TGGTGGGCGG CGAGAACCGG CTGACCGGGC AGAGCCGCGA CGCCTCGGTG 
CAGGCCCTGG CGCAGGTTGG TCACCCGATC TACGAGGTGC CGCTGGGGCC GACCATCCCG 
GCCTATTACG GCCTGGTGGC GTCGCGCTAC ATGCACGACC ACGGCGTCAC CGAGGAAGAC 
CTCGCCGCGT TCGCGGTGCT GATGCGCAGC CACGCGATCA CCCATCCCGG CGCGCAGTTT 
CACGAGCCGA TCAGCGTCGC CGAGGTGATG GCGTCGAAGC CGATTGCCTC GCCTCTGAAG 
CTGCTCGATT GCTGCCCGGT GTCCGATGGC GGCGCCGCGC TGGTGATCAG CCGCGAGCCG 
ACTACCGCGC ATCAGATCAA GGTGCGCGGC TGCGGCCAGG CTCATACCCA TCAGCACGTC 
ACAGCAATGC CGGCGGATGG GCCGTCTGGA GCGGAGCTGT CGATCGCGCG CGCCTGGGCC 
ACAAGCGGTG TCGGAATTGC CGACGTGAAA TATGCTGCCG TGTACGACAG CTTCACCATC 
ACGCTGCTGA TGCTGCTCGA AGACCTCGGG CTCGCAGGCC GAGGCGAGGC GGCGGCGCGG 
GCGCGGGACG GCCACTTCTC GCGAACCGGC GCGATGCCGC TGAACACCCA TGGCGGCCTA 
TTGTCCTACG GCCATTGCGG CGTCGGCGGC GCGATGGCGC ATCTGGTCGA GACGCATCTG 
CAGATGACCG GCCGGGCCGG CGACCGTCAG GTGCGTGATG CGTCGCTGGC GCTGCTGCAC 
GGCGATGGCG GCGTGTTGTC GTCGCATGTC AGCATGATCC TGGAGCGGGT GCGATGA

Protein sequence

MSYITGVGLT PFGKIDGSTT LGLMREAAEA AIADAGLKRG DIDGLLCGYS TTMPHIMLAT 
VFAEHFGIRP SYCHAVQVGG ATGMAMAMLA HQLVESGAAK NILVVGGENR LTGQSRDASV 
QALAQVGHPI YEVPLGPTIP AYYGLVASRY MHDHGVTEED LAAFAVLMRS HAITHPGAQF 
HEPISVAEVM ASKPIASPLK LLDCCPVSDG GAALVISREP TTAHQIKVRG CGQAHTHQHV 
TAMPADGPSG AELSIARAWA TSGVGIADVK YAAVYDSFTI TLLMLLEDLG LAGRGEAAAR 
ARDGHFSRTG AMPLNTHGGL LSYGHCGVGG AMAHLVETHL QMTGRAGDRQ VRDASLALLH 
GDGGVLSSHV SMILERVR