Gene RPD_1021 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPD_1021
Symbol
ID	4021496
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB5
Kingdom	Bacteria
Replicon accession	NC_007958
Strand	-
Start bp	1160103
End bp	1161218
Gene Length	1116 bp
Protein Length	371 aa
Translation table	11
GC content	68%
IMG OID	637961212
Product	L-carnitine dehydratase/bile acid-inducible protein F
Protein accession	YP_568160
Protein GI	91975501
COG category	[C] Energy production and conversion
COG ID	[COG1804] Predicted acyl-CoA transferases/carnitine dehydratase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.751913
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.624995
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGCAAGACA CAACGACCGC TTCCGCCACG CCGCAAACCG CCAGCCGCCC CAGCGGACCG 
CTGTCCGGCA TCCGCATCGT CGAATTCGCC GGCATCGGAC CCGGACCGTT CGGCTCGATG 
CTGCTGGCCG ACATGGGCGC CGAAGTCATC ACGCTGGTGC GCGCCGGACA GACGCCGCGT 
GGCGCCGCTG CGCGCGGACG CAAGATCGTT ACGGTCGACC TCAAGGACAA GGATTCGGTC 
GCCGGCGTGC TGACGCTGCT CGACAATGCC GATGCGCTGA TCGAAGGCTA TCGCCCGGGC 
GTGATGGAAC GGCTCGGCCT TGGTCCCGAC GTCGTGCTCG GCCGCAACCC GCGGCTCGTT 
TACGGCCGGA TGACCGGCTG GGGCCAGAGC GGCCCGCTCG CCCAGGCCGC CGGGCACGAC 
ATCAACTACA TCTCGATCAC CGGCGCACTC GCGGCGATCG GCCCGGCGGA GAGGCCGGTG 
CCGCCGCTCA ATCTGGTCGG CGATTTCGGC GGCGGTTCGC TGTACCTCGT GGTCGGCCTG 
CTCGCGGCGC TGCTCGAGGC GAAAACGTCC GGCAAGGGCC AGGTGGTCGA CGCCGCGATG 
TGCGACGGCG CCGCCTCGCT GATCACCATG TTCTTCGACA TGGTGGCGGC CGGCCGCTGG 
AAAGAGAGCC GCGAAAGCAA CATGCTCGAC GGCGGCGCGC ATTTCTACGG CGTCTACGAA 
TGCGCGGACG GGCACTTCAT CTCGATCGGC TCGATCGAGC CGCAGTTCTA CGCGCTGCTG 
CGCGAACTCG CGGGGCTGAC CGATCCGCAA TATGACGGCC AGATGGACCC GAAGAACTGG 
CCGGCGCTGA AACAGAAGCT GACCGCCTTG TTCAAGACCA AGACGCGGGA CGAATGGTGC 
AAGCTGATGG AAGGCACAGA CGTCTGCTTC GCACCGGTGC TGACGATGTC GGAAGCCACA 
CAGCATCCGC ACATGGTCGC GCGCGAGGTG TTCATCAAGC AGGGCGGCCA CACCCAGCCC 
GCGCCCGCGC CGCGTTTCTC GCGCACGCCA TCGTCGGCGC GTCTGCCGAT CGAAGCCGAT 
CTCGCCGGCG TCGCGAAGGA ATGGAGCGGG CGATAG

Protein sequence

MQDTTTASAT PQTASRPSGP LSGIRIVEFA GIGPGPFGSM LLADMGAEVI TLVRAGQTPR 
GAAARGRKIV TVDLKDKDSV AGVLTLLDNA DALIEGYRPG VMERLGLGPD VVLGRNPRLV 
YGRMTGWGQS GPLAQAAGHD INYISITGAL AAIGPAERPV PPLNLVGDFG GGSLYLVVGL 
LAALLEAKTS GKGQVVDAAM CDGAASLITM FFDMVAAGRW KESRESNMLD GGAHFYGVYE 
CADGHFISIG SIEPQFYALL RELAGLTDPQ YDGQMDPKNW PALKQKLTAL FKTKTRDEWC 
KLMEGTDVCF APVLTMSEAT QHPHMVAREV FIKQGGHTQP APAPRFSRTP SSARLPIEAD 
LAGVAKEWSG R