Gene RPB_0544 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPB_0544
Symbol
ID	3909583
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris HaA2
Kingdom	Bacteria
Replicon accession	NC_007778
Strand	+
Start bp	609374
End bp	610528
Gene Length	1155 bp
Protein Length	384 aa
Translation table	11
GC content	68%
IMG OID	637882432
Product	hypothetical protein
Protein accession	YP_484166
Protein GI	86747670
COG category	[S] Function unknown
COG ID	[COG4246] Uncharacterized protein conserved in bacteria
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.200606
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACACGAC CGACCGCGCA CTCGGCTGAG CTGAAAGTGC ACAGCGCGAG CAAGGGAGCC 
GGCGCGCTCC CTCTCCCCTC TCCGCAAGCG GGAGGGGAGA CGACGCGGCG GCGCTTTCTT 
GCCGGGAGTT TGGCGATCGG CGCTCTGGCC TGCTTTCCGG CGCTCGGTCC GCGGCCCGCG 
CTGGCGCAGG CCACCAAGGC CGAGCTCGAC GCCTATTCGA TCCCCGCCGC GGAGCGCATC 
GCGGTGCGGG CGCGTCCGAT CGACCAGTTC GACCTGCGCG ACCGCGGCGG CCGACGCTTC 
GGCGCGCTGC AGTTTCGCAG CGGGCTGATT CTGACCTCGC CGTTTCGCGG CTTCGGCGGG 
TTGTCGGCGC TGCGGCTCGA TCCGAAAGGC GAGCGCTTCG TGGCGATCAG CGATCGCGGC 
GTCTGGTTCA CCGGCCGCAT CGTCTATGAC GGCGCCGCCA TGGCGGGCGT CGCCGACGTC 
GAGGCGGCGC CGCTGCTCGG GCCCGACCGC CAGCCGCTGA CGAAGAGCAA ATGGTACGAC 
AGCGAAGCGC TGGCGTTCGA CGGCGGCACC GCCTATGTCG GCTATGAGCG CGTCAATCAG 
ATCGTCAAAT TCGATTTCGG CCGCGACGGC GTTCGCGCTT CGGGGCAGCC GATCGCCGTG 
CCGCCGGGCT TGCGCAAGCT GCCGAACAAC AAGGGCATCG AGTCGCTGGT CGTGGTGCCG 
AAGGGGCTGC CGCTCGCCGG CACGCTGATC GCGATCTCCG AGCGCGGCCT CGACGCCGGC 
GGCAATGTCG TCGGCTTCCT GATTGGCGGC AAGACGCCGG GTCCATTCGC CGTTCGCCGC 
TCCGATAATT TCGACGTCAG CGACGCGGTG CTGCTGCCGT CGGGCCAACT CCTGATTCTC 
GAGCGCAAAT TTTCGTGGAT CGAGGGCGTG CATATCCGGA TCCGGCGGAT CGCATTGGCG 
ACGCTGGTGC CCGGTGCGAC CGTGGATGGC CCGGTGTTGT TCAACGCCGA TCTCGGCCAC 
GAGATCGACA ACATGGAAGG CCTCGACGCC CATCAGGACG CCGCCGGCGA CACCGTGCTG 
ACGATGGTGT CGGACGACAA TTTCTCGATG CTGCAGCGGA CGCTGCTGCT GCAGTTCACC 
CTCGTGGACG ACTGA

Protein sequence

MTRPTAHSAE LKVHSASKGA GALPLPSPQA GGETTRRRFL AGSLAIGALA CFPALGPRPA 
LAQATKAELD AYSIPAAERI AVRARPIDQF DLRDRGGRRF GALQFRSGLI LTSPFRGFGG 
LSALRLDPKG ERFVAISDRG VWFTGRIVYD GAAMAGVADV EAAPLLGPDR QPLTKSKWYD 
SEALAFDGGT AYVGYERVNQ IVKFDFGRDG VRASGQPIAV PPGLRKLPNN KGIESLVVVP 
KGLPLAGTLI AISERGLDAG GNVVGFLIGG KTPGPFAVRR SDNFDVSDAV LLPSGQLLIL 
ERKFSWIEGV HIRIRRIALA TLVPGATVDG PVLFNADLGH EIDNMEGLDA HQDAAGDTVL 
TMVSDDNFSM LQRTLLLQFT LVDD