Gene RPB_4078 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPB_4078
Symbol
ID	3911885
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris HaA2
Kingdom	Bacteria
Replicon accession	NC_007778
Strand	-
Start bp	4649272
End bp	4650456
Gene Length	1185 bp
Protein Length	394 aa
Translation table	11
GC content	68%
IMG OID	637885982
Product	lipid-transfer protein
Protein accession	YP_487682
Protein GI	86751186
COG category	[I] Lipid transport and metabolism
COG ID	[COG0183] Acetyl-CoA acetyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.254094
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCGTCAT CCGTCTACGT CGCCGGTGTC GGCATGATTC CTTTCGTCAA GCCGGGCGCC 
AACGAGCCCT ATCACCTGAT GGGCGCCGAA GCGGCGCGGC GCGCGCTCAG CGACGCGGGT 
GTCGGCTACG ACGCCATCCA GCAGGCCTTC GTCGGCTACG TTTACGGCGA CTCCACCTGC 
GGGCAGCGCG CGCTGTATCA GGTCGGCATG ACCGGCGTGC CGATCGTCAA CGTCAACAAC 
AACTGCTCGA CCGGCTCGAC CGCGCTGTTT CTGGCGCGGC AGGCGATCGC CTCGGGTGCG 
GCCGATTGCG TGCTGGCGCT CGGCTTCGAG CAGATGAAGC CCGGTGCGCT CGGCTCGGTG 
TTCGTCGATC GCCCCAGCGC GTTCGAGGAT TTCGATGCCG CCGCCGACAA GTTGATCGAT 
GCGCCCGGCA TTCCGCTGGC GCTGCGCTAT TTCGGCGGCG CCGGCCTCAG CCACATGCAG 
AAGCACGGCA CGCCGCTGTC GTCCTTCGCC AAGGTCCGCG CCAAAGCGAG CCGCCACGCC 
GCGAAAAATC CGCTGGCGTT GTTCCGCAAG GAAGTCACCG CGGAGGACGT GCTGAACGAC 
CAGGTGATCT GGCCCGGCGT GATGACGCGG CTGATGGCGT GCCCGCCGAC CTGCGGCGGT 
GCCGCGGCTG TGCTGGTGTC GGAAGCCTTC GCCAAGAAGC ACGGCCTCAA CATCAACGTC 
CGCATCGCTG CGCAAGCAAT GACAACCGAC ACGCCCTCGA CATTCGACGC GGGCGACATG 
ATGCGGGTGG TCGGCTACGA CATGGCGCGT GCCGCGGCCG ACAAGGTCTA CGAGCAGGCC 
GGCGTGGGCC CGAAGGACAT CGACGTCGTC GAGCTGCACG ACTGCTTCGC CCACAACGAG 
TTGATCACCT ACGAGGCGCT CGGCCTGTGC CCCGAAGGCG GCGCCGAGAA GTTCATCGAC 
GACGGCGACA ACACCTATGG CGGCCAATTC GTCACCAATC CGTCCGGCGG GTTGCTGTCG 
AAAGGCCATC CGCTCGGCGC CACCGGGCTC GCGCAGTGCT ACGAACTGAC CCGGCAGTTG 
CGCGGCTCCG CGGAGGCGAC GCAGGTGGAC GGCGCGAAGC GCGCGCTGCA GCACAATCTC 
GGCCTCGGCG GGGCTTGCGT CGTCACCCTT TACGAACGCG CCTGA

Protein sequence

MASSVYVAGV GMIPFVKPGA NEPYHLMGAE AARRALSDAG VGYDAIQQAF VGYVYGDSTC 
GQRALYQVGM TGVPIVNVNN NCSTGSTALF LARQAIASGA ADCVLALGFE QMKPGALGSV 
FVDRPSAFED FDAAADKLID APGIPLALRY FGGAGLSHMQ KHGTPLSSFA KVRAKASRHA 
AKNPLALFRK EVTAEDVLND QVIWPGVMTR LMACPPTCGG AAAVLVSEAF AKKHGLNINV 
RIAAQAMTTD TPSTFDAGDM MRVVGYDMAR AAADKVYEQA GVGPKDIDVV ELHDCFAHNE 
LITYEALGLC PEGGAEKFID DGDNTYGGQF VTNPSGGLLS KGHPLGATGL AQCYELTRQL 
RGSAEATQVD GAKRALQHNL GLGGACVVTL YERA