Gene RPB_3472 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPB_3472
Symbol
ID	3911274
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris HaA2
Kingdom	Bacteria
Replicon accession	NC_007778
Strand	-
Start bp	3976757
End bp	3978052
Gene Length	1296 bp
Protein Length	431 aa
Translation table	11
GC content	72%
IMG OID	637885375
Product	hypothetical protein
Protein accession	YP_487079
Protein GI	86750583
COG category	[S] Function unknown
COG ID	[COG5323] Uncharacterized conserved protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGGAGG CGTTTCTGCG GCAGGCGGGG ACGCGGACGC TGGCCCGGCT GCAGCATGAT 
TTCGCGACCT TCGCGCATCC GCATCAGGAG CATGGCGAGG CCGGCAACAA TGGCGGGCCG 
TGGACGACCT GGCTGCTGCT CGGCGGCCGC GGCGCCGGCA AGACGCGGAC CGGGGCCGAA 
TGGGTGCGGG CGCTGGCGCA TGGCACGCCG CCTTATGCCG AGCGGCCGCA TCGCCGGATC 
GCGCTGATCG GGGAGAGCTG GCAGGACGCC CGCGAGGTGA TGGTGGAGGG CGAGTCCGGC 
CTGCTGCGCT GTTCGCCGCG CGCCGAGCGG CCGGAATGGA TCGCGTCGCG GCGGCGGCTG 
GAATGGCGCA ATGGCGCGGT CGGGCAGGTG TTCTCCGCCG ACGATCCGGA AAGCCTGCGC 
GGGCCGCAAT TCGACGCCGC GTGGTGCGAC GAGCTGGCGA AATGGCGCTA TGCCGAGGCC 
TGCTTCGACA CGCTGCAATT CGGGCTGCGG CTGGGCCTGC AGCCGCGCCA ACTGGTCACC 
ACCACGCCGC GGCCGCTGCC GCTGATCAAG CGGCTGCTGG CCGATCCGCG CACGCGGGTG 
ACGCGCGCGC CGACGAAGGC GAATGCCGAT CATCTGTCGC CGGCGTTTCT CGATGCCGTG 
GTCGGCCGCT ATGCCGGCAC GCGGATGGGG CGGCAGGAAC TCGACGGCGA AATGATCGAG 
GACCGCGCCG ATGCGCTGTG GTCGCGGGCG CTGATCGAAT CCTGCCGCGT CGCGCAGCCG 
CCGGGGCTGG CGCGCGTGGT GGTGGCGATC GACCCGCCGG GGACCTCGAA GGTCGGCGCG 
GATGCCTGCG GCATCGTCGC CGTCGGCCGC AGCGACAGCG GCGCCTACTA CGTGCTGGAA 
GACGCCTCCG CCGCCGGGCT GTCGCCGGCC GCCTGGGCGG CCAAGGCGGT GGCGCTGTAT 
CACCGGCTCG ACGCCGATAC GCTGATCGCC GAAGTCAACA TGGGCGGCGA GATGGTGCGC 
GCCGTGCTGC GCGAGACCGA CGGGGCGGTG CCGCTGAAGG AAGTCCGCGC CAGCCGCGGC 
AAATATCTGC GCGCCGAGCC GGTCGCGGCG CTGTACGAGC AAGGCAAGGT CAAGCATGTC 
GGCTGCTTCC CGCTGCTCGA AGACGAAATG TGCGACTTCG GCATCGACGG CCTCTCGTCG 
GGCCGCTCGC CCGACCGGCT CGACGCCCTG GTGTGGGCGA TCACCGGGCT GATGAACGGC 
CGCAATGCCG GCGGGCCGCG GATCAGGCAG TTGTGA

Protein sequence

MTEAFLRQAG TRTLARLQHD FATFAHPHQE HGEAGNNGGP WTTWLLLGGR GAGKTRTGAE 
WVRALAHGTP PYAERPHRRI ALIGESWQDA REVMVEGESG LLRCSPRAER PEWIASRRRL 
EWRNGAVGQV FSADDPESLR GPQFDAAWCD ELAKWRYAEA CFDTLQFGLR LGLQPRQLVT 
TTPRPLPLIK RLLADPRTRV TRAPTKANAD HLSPAFLDAV VGRYAGTRMG RQELDGEMIE 
DRADALWSRA LIESCRVAQP PGLARVVVAI DPPGTSKVGA DACGIVAVGR SDSGAYYVLE 
DASAAGLSPA AWAAKAVALY HRLDADTLIA EVNMGGEMVR AVLRETDGAV PLKEVRASRG 
KYLRAEPVAA LYEQGKVKHV GCFPLLEDEM CDFGIDGLSS GRSPDRLDAL VWAITGLMNG 
RNAGGPRIRQ L