Gene RPB_1112 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPB_1112
Symbol
ID	3910198
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris HaA2
Kingdom	Bacteria
Replicon accession	NC_007778
Strand	-
Start bp	1282739
End bp	1283746
Gene Length	1008 bp
Protein Length	335 aa
Translation table	11
GC content	69%
IMG OID	637883005
Product	hypothetical protein
Protein accession	YP_484733
Protein GI	86748237
COG category	[R] General function prediction only
COG ID	[COG4111] Uncharacterized conserved protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.0529668
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.319534
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCGACA AGGCTTTGAG TGGCAACAAG GCTTGGAGCG GCGACAAGCC CCCGATTCCA 
ATCGAGATCG GACTGACCGC GGCGATCGTC GCGATCGAGA ACAACGAGCC GCTGATCCTG 
ACGTCGTCGG GCGGCAACGA CCTGATCGGC CTGCCCTACG GGCCATTCGA CGCGATCTCG 
CATCGCACGC TCGACATCGG GCTGCGCGCC TGGGTGGAAG AGCAGACCGG ACTGCGTCTC 
GGCTATGTCG AACAGCTCTA CACGTTCGGC GATCGCGGCC GCCATGCGCG GGTCGGCGAC 
ACCGACGTCC ACGTCGCCTC GATCGGCTAT CTGGCGCTGA CCCGCGCGGT CGACAACGCC 
GCCCGTGCGG CCGGCGCGAC GTTCGAGCCC TGGTATCGCT TCTTCCCGTG GGAGGACTGG 
CGCCAGCAGC GCCCCGAGAT CATCGCGCGC GACATCATCC CCGAACTCAC CGCCTGGGCC 
AGCCAGGCCG AACAGCCCGA CACGACGCGC GCCCTCGCCC GCAAGGATCG CGTCCGGCTG 
TATTTCGGCA TCGACGGCGC GCAATGGGAC GAGGAGCGCG TGCTCGACCG CTACGAACTG 
CTGTACGAAG CCGGCCTGAT CGAAGAGGCG CGGCGCGACG GGCGGCCCGC TGCGCTCGCG 
CGCGCCAAGG TGCCGCCGCT CGGCGTGGCG ATGCGGTTCG ATCACCGCCG GATTCTCGCC 
ACAGCGATCG CGCGGCTGCG CGCCAAGCTG AAATACCGGC CGGTGGTGTT TGAACTTCTG 
CCGCCGGAGT TCACACTCAC CGAGTTGCAG CATACCGTGG AAGCGATCTC GGGCCGGCAT 
CTGCACAAGC AGAATTTCCG GCGGCTGGTC GAAGCCGGCG CGCTGGTCGA ACCGACCGGC 
GAGATGTCGA CACGAACAGG CGGACGTCCC GCCGCGTTGT TTCGCTTCCG CCGCGAGGTG 
CTGCAGGAGC GCCCCGCGCC CGGCCTGCGC GTGCGCGGTC GGCGCTGA

Protein sequence

MTDKALSGNK AWSGDKPPIP IEIGLTAAIV AIENNEPLIL TSSGGNDLIG LPYGPFDAIS 
HRTLDIGLRA WVEEQTGLRL GYVEQLYTFG DRGRHARVGD TDVHVASIGY LALTRAVDNA 
ARAAGATFEP WYRFFPWEDW RQQRPEIIAR DIIPELTAWA SQAEQPDTTR ALARKDRVRL 
YFGIDGAQWD EERVLDRYEL LYEAGLIEEA RRDGRPAALA RAKVPPLGVA MRFDHRRILA 
TAIARLRAKL KYRPVVFELL PPEFTLTELQ HTVEAISGRH LHKQNFRRLV EAGALVEPTG 
EMSTRTGGRP AALFRFRREV LQERPAPGLR VRGRR