Gene RPB_2104 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPB_2104
Symbol
ID	3908518
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris HaA2
Kingdom	Bacteria
Replicon accession	NC_007778
Strand	+
Start bp	2392867
End bp	2394081
Gene Length	1215 bp
Protein Length	404 aa
Translation table	11
GC content	69%
IMG OID	637883997
Product	L-carnitine dehydratase/bile acid-inducible protein F
Protein accession	YP_485721
Protein GI	86749225
COG category	[C] Energy production and conversion
COG ID	[COG1804] Predicted acyl-CoA transferases/carnitine dehydratase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.0421788
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	6
Fosmid unclonability p-value	0.0185484
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGGCCAC TCGCAGGCGT GACGATCGTC GACATGACGT CGGTGCTGAT GGGGCCTTAC 
GCGACCCAGA TGCTGGGCGA TTACGGCGCG GATGTCGTCA AGATCGAGTC CCCCGACGGC 
GACGTCACGC GGCAGATCGG CCCGGCGCGG AATCCCGGCA TGGGACCGGT GTTCCTCAAT 
GCCAACCGCA ACAAGCGCAG CATCTGCCTC GATCTCAAAC ACGCCGCCGG CCGCGACGCC 
GCGCTGCGGC TGATTGCGGG CGCCGACGTG CTGGTGTACA ACGTGCGTCC GCAGGCGATG 
GCGCGGCTGC GGCTCGGCTA TGACGAGGTC GCGGCGATCA ATCCGCGGCT GATCTATGCC 
GGGCTGTTCG GCTTCGGCCA GGACGGACCC TATGCGGCCA AACCCGCTTA TGACGATCTA 
ATCCAGGGCG CGACAGCGCT GCCGGCGCTG AACGCGCGTA TCGGTGACGG CACGCCGCGC 
TACGTGCCTA ACGCGCTGGT CGACCGCATC GTCGGGCTCA CCGCGGTCGG CGCGATCTGC 
GCCGCGCTGG TGCATCGCGA CCGCACTGGA CAGGGGCAGC GCGTCGGCGT CCCGATGTTC 
GAGACGATGG CGGGCTTCGT GATGGGTGAT CATCTCGGCG GGCTCACCTA CGAGCCGCCG 
CTCGATCGCG GCGGCTATGC CCGGCACCTG TCGCCGGACC GCCGGCCGTA CCAGACCGCC 
GACGGCTACA TCTGCGCGAT GGTGTACAAC GACAAGCAGT GGGGCAGCTT CCTGCGCGCG 
ATCGGCCGCG ACGATCTGCT GAGCGACGAG CGTTACACGT CGTTCGCCAA GCGCGCCGTG 
AACATCGACG TGGTCTATGC CGAGCTGGCG CGGATCTTCC TGACGCGCAG CACGGCGGAG 
TGGACGGAAC TGCTCGATGC CGCCGACGTG CCGGCGATGC GGATGCACGA TCTCGAAAGC 
CTGCTCGACG ATCCGCATCT GGTCGCGACC GATTTCTTCC CCGTCGTCGA TCATCCGAGC 
GAAGGCCCGA TCCGCGACAT GAGAGTCTCG GCGACCTTTG CGGCGACGCC CGTCGCGCGC 
CAGCGCCTCG CGCCGCGCTT GGGCGAGCAG GGGGCGGAGG TGCTGCGCGA GGCCGGCTAC 
AGCGACGACG AGATCGAGGC GCTGGCTGGA TGCGGCGCGT TGAAGCTGCC GGCGGCGGGC 
AAGGTGGCGA GTTGA

Protein sequence

MGPLAGVTIV DMTSVLMGPY ATQMLGDYGA DVVKIESPDG DVTRQIGPAR NPGMGPVFLN 
ANRNKRSICL DLKHAAGRDA ALRLIAGADV LVYNVRPQAM ARLRLGYDEV AAINPRLIYA 
GLFGFGQDGP YAAKPAYDDL IQGATALPAL NARIGDGTPR YVPNALVDRI VGLTAVGAIC 
AALVHRDRTG QGQRVGVPMF ETMAGFVMGD HLGGLTYEPP LDRGGYARHL SPDRRPYQTA 
DGYICAMVYN DKQWGSFLRA IGRDDLLSDE RYTSFAKRAV NIDVVYAELA RIFLTRSTAE 
WTELLDAADV PAMRMHDLES LLDDPHLVAT DFFPVVDHPS EGPIRDMRVS ATFAATPVAR 
QRLAPRLGEQ GAEVLREAGY SDDEIEALAG CGALKLPAAG KVAS