Gene RPB_2044 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPB_2044
Symbol
ID	3909859
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris HaA2
Kingdom	Bacteria
Replicon accession	NC_007778
Strand	-
Start bp	2323025
End bp	2324176
Gene Length	1152 bp
Protein Length	383 aa
Translation table	11
GC content	71%
IMG OID	637883937
Product	hypothetical protein
Protein accession	YP_485662
Protein GI	86749166
COG category	[R] General function prediction only
COG ID	[COG1568] Predicted methyltransferases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCTGACC CCGAAATCCT GAAAACCATC GCCGAGGCGA CCCGGCTGCG CGAAGGCCCG 
GCCGGCGTCG AGGCGATCCT GCGTGCGGTG TATCGCTCGG GCTCGCTGCG GCTGCAGGAC 
GTCGCCCGCG AGGCCCGGCT GCCGATGCCG ATTGCCACCG CCGTCCGCCG CGAACTGGAG 
AAGGCCGGGC TGCTGGAGCG CAAGCAGGGC CTGGCGCTGA GCCCCGAGGG CCGCGACTTC 
GTCGAGCGCG AACTCGGGCT CGGCATCACC ATCGACGTCA CCTGCCCGGC CTGCGCCGGC 
CATGGCGTGG TGATCCCCGC GGATTTCCAG GCGCAGGTCG GCCGGCTCGC CGCCATCATC 
GCGCAGGCGC CATCGGTCGA TGTCACGCTG GATCAGGCGC CGTGCACCCC GGAGACGTCG 
CTGCTGCGTG CGCTTCTGAT GCTGCAGGCC GGCGCGCTGG AAGGCCGCCG GGTGCTGCTG 
CTCGGCGACG ACGATTCGGT GTCACTGGCG ATCGGCCTCG TCGGCCAGGC GCTGGGCAAG 
GCCGACCTCA CCCGCGGCGT GGTGGTGGTC GACGCGGACG AGCGCCGGCT CGCCTTCCTG 
CGCGAGAATG CTGCCCGCGA AGGCATCGCG CTGCGCACGC TGCATCACGA TCTGCGCCAG 
CCGCTGCCGG CCGAGTTGCA GGGCGCGTTC GACACCATCG AGACCGACCC GCCCTACACG 
CTCGAAGGCG CGAAGCTGTT TCTGACGCGC GGCCGCGAGG CGCTGGCCGG CGACGGGCTG 
TGCTACTTTT CGTTCGCGCA ATGGCCGCCG CGGCAGATGC TGGCATTGCA GCGGGTGTTT 
CTCGATCTCG GCCTCGCGGT GCAGACGATC CGGCCGGGCT TCAACGCCTA TGCGGGCGCC 
ACCGTGCTTG GCAATGTCGG GCAACTGATC GAACTCGCCG CCGCGGGCCC GGCCGCCGCC 
GCATTGCCGG CGTGGCAGGG ACCGCTGTAC ACCGCCGAGA TCAATCCGCG GATCCGCGCC 
TATGTCTGCA CGTCATGCGG CCGCGAGGCC GTCCTGGGGC GCGGCTCGAC GCCGGAGACG 
ATCGAGGCGT TGAAGGATCA GGGATGCGCG AATTGCGGCG GGCACAGCTT CCGCCGCAAG 
ACCGGCGGCT GA

Protein sequence

MADPEILKTI AEATRLREGP AGVEAILRAV YRSGSLRLQD VAREARLPMP IATAVRRELE 
KAGLLERKQG LALSPEGRDF VERELGLGIT IDVTCPACAG HGVVIPADFQ AQVGRLAAII 
AQAPSVDVTL DQAPCTPETS LLRALLMLQA GALEGRRVLL LGDDDSVSLA IGLVGQALGK 
ADLTRGVVVV DADERRLAFL RENAAREGIA LRTLHHDLRQ PLPAELQGAF DTIETDPPYT 
LEGAKLFLTR GREALAGDGL CYFSFAQWPP RQMLALQRVF LDLGLAVQTI RPGFNAYAGA 
TVLGNVGQLI ELAAAGPAAA ALPAWQGPLY TAEINPRIRA YVCTSCGREA VLGRGSTPET 
IEALKDQGCA NCGGHSFRRK TGG