Gene RPB_4019 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPB_4019
Symbol
ID	3911826
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris HaA2
Kingdom	Bacteria
Replicon accession	NC_007778
Strand	+
Start bp	4586924
End bp	4588237
Gene Length	1314 bp
Protein Length	437 aa
Translation table	11
GC content	67%
IMG OID	637885923
Product	hypothetical protein
Protein accession	YP_487623
Protein GI	86751127
COG category	[S] Function unknown
COG ID	[COG4949] Uncharacterized membrane-anchored protein conserved in bacteria
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.132904
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.807924
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGGCTG AAGTTCTGAT CGGTGATGGC GATGGTAGAC TTTCGCCGCA TCCACTGCGG 
GCGGCCGTCT TGGGCGAGGT TCACGCGCGC CCGTTCACTG CGCTCGCAGT GCCGGCGCGG 
GTGCTGCATT TCGCGTTCGA CACCTCGGGC GAGAAGGCCA AGGCCGATCG CATCGCGCTG 
ACGAAATTCT GCGAATCACG CGGGCTGCAG CCGCCGCCGT CCAACGAGAA GCATCACCGC 
GCCTCGTTCG GCACGACCAT GCTGCGCTGG GAACAGCATT CCGAATTCAC CACCTACACC 
TGGGAATTCA CCGCCGACCC GGTCGCGATG CCGTTTCATC CGGAGGCCTC GTCGCTGGCT 
TCGCCGATGC GGCTGGTGCC CCAGCCCGGG CCGTTGCTGG TCGCGGTCGA TCTGCATGCG 
CTGCCGGACG ATCCGCCGCG CACCGCGCCG GAGCGATTGT TCGATCGCGC CAGCCTCGCT 
GTCGCGGAGA ATTCCGACGG CGCGGCGGTC TATGCCACCG ATTTCCAGCC CGGTCCCTCG 
GGCTTCGTGC GGGTGCTGGT GATCGATCGC GGCATGGCGC CGGAGCGCGC CGGAGCGCTG 
GTGCAGCGTG TGCTCGAAAT CGAGACCTAT CGCACGCTGG CGCTGCTCGG CCTGCCGGAA 
GCGCAGCGGC TCGGTCCCTC GATCAGCAAC GGCGAGCGCC GCCTCGCCGA AGTCACCGCC 
GAAATGCGCA AGGCGGCCGA TCTCGCCATC AACAACAGAC TGCTGCAGGA ACTGACCGAA 
CTCGCCGCCG AGGTCGAAGC CGGCGCCGCC GCCAGTCTGG GCCGCTTCAG CGCCAGCCGC 
GCCTATGAAG AGATCATGAC CGGCCGGCTG GCGACGCTCG GCGAACGCAA GGTCGGCGGC 
CTGCCGACCT GGTCGTCGTT CCTCGCCCGC CGGATGAAGC CGGCGATGCG CACCTGCACC 
ACCACCGAGG CGCGACAATC CGACCTGTCG CTGAAACTCG CCCGCGCCGC CAACCTGCTG 
CGAACCCGCG TCGACGTCGA GCTCGAACAT CAGAATCAAG AGCTGCTGAA ATCGATGAAC 
GCGCGGACGC GGCTGCAATT GCGGCTGCAG GCCACCGTCG AAGGCCTCTC CACCGCGGCG 
ATCACCTACT ACGTGGTCGG GCTGTTCGGT TATTTGGTGA AGGGTCTGCA CGATTCCGGC 
CAGATCACGG TCGAGCCGAG CCTCGTCACC GCGGGTTTCG TGCCGATCGC CGCGTTCTCG 
ATCTGGTGGA CGGTGCGCAG CATCCGCAGG AAACACATCG CGAGCGAGGA TTGA

Protein sequence

MTAEVLIGDG DGRLSPHPLR AAVLGEVHAR PFTALAVPAR VLHFAFDTSG EKAKADRIAL 
TKFCESRGLQ PPPSNEKHHR ASFGTTMLRW EQHSEFTTYT WEFTADPVAM PFHPEASSLA 
SPMRLVPQPG PLLVAVDLHA LPDDPPRTAP ERLFDRASLA VAENSDGAAV YATDFQPGPS 
GFVRVLVIDR GMAPERAGAL VQRVLEIETY RTLALLGLPE AQRLGPSISN GERRLAEVTA 
EMRKAADLAI NNRLLQELTE LAAEVEAGAA ASLGRFSASR AYEEIMTGRL ATLGERKVGG 
LPTWSSFLAR RMKPAMRTCT TTEARQSDLS LKLARAANLL RTRVDVELEH QNQELLKSMN 
ARTRLQLRLQ ATVEGLSTAA ITYYVVGLFG YLVKGLHDSG QITVEPSLVT AGFVPIAAFS 
IWWTVRSIRR KHIASED