Gene RPB_2979 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPB_2979
Symbol
ID	3910778
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris HaA2
Kingdom	Bacteria
Replicon accession	NC_007778
Strand	+
Start bp	3391897
End bp	3393291
Gene Length	1395 bp
Protein Length	464 aa
Translation table	11
GC content	50%
IMG OID	637884885
Product	hypothetical protein
Protein accession	YP_486592
Protein GI	86750096
COG category	[S] Function unknown
COG ID	[COG4938] Uncharacterized conserved protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.213619
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	7
Fosmid unclonability p-value	0.0308944
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTTACGC ATTTAAAACT ACAAAACTTC AAATCTTGGA GAAATGCCAA TATCGCACTC 
GCGCCACTTA CAGCCCTCTA TGGCGCTAAT TCATCCGGGA AAAGCAGCAT AATTCAGTTC 
TTATTGATGC TGAAGCAAAC GAAGGACTCG CAGGACCGGT CGTTAGCGCT CGACTTCGGA 
GGAGTCGAAT CCCCCGCAGA CCTTGGATCA TTCAAGGATG CAGTCTTCTT TCACCAGGAA 
GATAATGCCA TCTCCTGGCA ACTCGACTGG CATCTCAAGA GCGACCTAAA AATTGCAGAC 
CCATCCGGAA AGCGAACTGA CTATCTGTTT GAAGGAAGGG AGATCAAGAT TTCTTCCTCA 
GTTAGACTTC GTAACAAGCA GGCGGTCGGC GAGTATCTCG AATACGATTT TGCAGGAACA 
CAATTTACTC TCAAACGCGC AAGAGAACGA CCTGCGTTTC AATTAGACAC GCAAGGTCCG 
AACGACTTTC GGTTCATCCG AACGCTGGGA CGCAAGTGGG ATTTGCCGGG CCCAACAAAA 
TCCTACGCCT TTCCCGATCA AGCTCGACTC TACTTCCAAA ATTCTCAGTT TCTGAGCGAA 
TTTGAGAACG AGTACGTCAA ACAGATGGAT AGCCTGATTC ATCTTGGCCC GCTCCGAGAC 
TACCCCAAAC GTCAGTATAT TTGGGCTGGA TCTAGCCCGA TCGACGTTGG GCGGACCGGC 
GAGCGGACTA TCGAGGCTAT ACTTGCCGCC ACCTCCCGGA ACGAAGTCAG AAACCTTCGC 
GCCAAAGCTC GACTAAGGCC ATTTCAAGAG ATGATAGCTT GGTGGCTTAG GGAAATGGGC 
CTCATCCACT CATTTAAACT CGTGGAGATC GGTTCTGGTG CTGGACTTTA TCGAACTGTA 
ATCAAGCGCG ACCCTGAATC TCCAGAAACG CTTATAACGG ATGTTGGATT CGGAATTTCT 
CAGATTCTTC CCGCTCTCGT TCTACTATAC TACGCACCTG AGGGATCGAC GATCGTACTC 
GAACAACCAG AAATACATCT TCATCCCGCA ATTCAGTCTT CTCTTGCAGA CTTGATCATA 
ACCGCAATTA AGACCCGCAA CATACAGGTC ATTCTCGAGA GCCACAGCGA GCATCTGCTC 
ATGCGACTAT TGAGGCGAGT AGCCGAGGGT AACAAGTCAC CATATCCCGA GATTGAACCC 
CAAGATATGA AGGTTTATTT TTGCCAAGCT CGTGACGGAG AATCACGAGC GGAGGAATTG 
AAGGTGAACT TGTTCGGCTC GATCGAGAAT TGGCCAACCG ATTTCTTCGG CGATCAATTT 
GGAGAGATCG CAGCGCGCGA GGAGGCGGCT ATCCAGAAAC AAGCCGCATT GAGCAAACGT 
GCGCGCAATC GTTGA

Protein sequence

MLTHLKLQNF KSWRNANIAL APLTALYGAN SSGKSSIIQF LLMLKQTKDS QDRSLALDFG 
GVESPADLGS FKDAVFFHQE DNAISWQLDW HLKSDLKIAD PSGKRTDYLF EGREIKISSS 
VRLRNKQAVG EYLEYDFAGT QFTLKRARER PAFQLDTQGP NDFRFIRTLG RKWDLPGPTK 
SYAFPDQARL YFQNSQFLSE FENEYVKQMD SLIHLGPLRD YPKRQYIWAG SSPIDVGRTG 
ERTIEAILAA TSRNEVRNLR AKARLRPFQE MIAWWLREMG LIHSFKLVEI GSGAGLYRTV 
IKRDPESPET LITDVGFGIS QILPALVLLY YAPEGSTIVL EQPEIHLHPA IQSSLADLII 
TAIKTRNIQV ILESHSEHLL MRLLRRVAEG NKSPYPEIEP QDMKVYFCQA RDGESRAEEL 
KVNLFGSIEN WPTDFFGDQF GEIAAREEAA IQKQAALSKR ARNR