Gene RPB_2838 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPB_2838
Symbol
ID	3910631
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris HaA2
Kingdom	Bacteria
Replicon accession	NC_007778
Strand	-
Start bp	3230981
End bp	3231937
Gene Length	957 bp
Protein Length	318 aa
Translation table	11
GC content	63%
IMG OID	637884738
Product	twin-arginine translocation pathway signal
Protein accession	YP_486451
Protein GI	86749955
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0715] ABC-type nitrate/sulfonate/bicarbonate transport systems, periplasmic components
TIGRFAM ID	[TIGR01409] Tat (twin-arginine translocation) pathway signal sequence

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.884222
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCGACCA CAACCCGACG GAATTTCATT CGCCTCGCGG CCACCGCGAC TGCGCTCGCC 
TCGACGGGCT TCAGGGCGTT CGCGGACGAA CGCGTCATCA AGATCGGGAC GCTGAAGCTG 
ATCCACGGCA TCACGCCGTA CTTCTATGAA AAGTTCGCGC CGGCCGGCTT CAAGATCGAG 
GTGATCCCGT TCGAAAGCCC GACCGACGGC AAGAATGCCG TTGTCACCGG CTCGGTCGAT 
CTCGGCATCT TCGGCCTGGC GGCGGCGACG CTGGGCGGCG CCAATGGTGA GCCGGTGGTG 
GTGGTTGCAG CCGCCTGCAA CCGTGGCATG GCCGTGGTCG CCGGCAAGAA TTCCGGGATC 
GGCGGCATCA AGGACCTCAA GGGCAAGAAG GTTGCGATCT GGCCGGGATC GACCCAGGAG 
GTGGTGATCC TCGACCGGCT GAGCGCCGAA GGCATGACCA TCAAGGACGT CGAAGCGGTT 
CGGGTTTCGT TCAGCGACAT GGCGCCGGCG CTCGCGCGCG GCGACATCGA CGCCTATGTC 
GGAGCCGAAC CGGCGGCCGG CATCAGCCTC GCCAACGGCG TCGGCAAGAT CGTCGAATAC 
CCGTATTCGA CTCCGACCGG TTCGCTGAAC ATGGTGCTGA GCACGCGCCG CGAACTGATC 
GAGAAGGATC CCGAACTGAT CCGCACGCTG CTGAAGATCC ACCGCAAGGC CAGCGAATTC 
GCCATGGGCG ATCGCGACGC CTTCATCGCG ATGGCGATGC AGAAGCTCGG ACAGCAGAAG 
CCGTCGATCG AACAGGCGGC GCCGAATGTC GAGCTGACCT GGAACATCGA TGATCTGTTC 
CTGAAGCAGG CGCAATACTA CGGCGCGCAA ATGCTGGCGA AGAAGCAGAT CCGGCAGCTC 
CCGGACTACA AGACCTTCAT CGACCCCAGC TTCGTCAAAG CGATCTCGGC GTCGTGA

Protein sequence

MPTTTRRNFI RLAATATALA STGFRAFADE RVIKIGTLKL IHGITPYFYE KFAPAGFKIE 
VIPFESPTDG KNAVVTGSVD LGIFGLAAAT LGGANGEPVV VVAAACNRGM AVVAGKNSGI 
GGIKDLKGKK VAIWPGSTQE VVILDRLSAE GMTIKDVEAV RVSFSDMAPA LARGDIDAYV 
GAEPAAGISL ANGVGKIVEY PYSTPTGSLN MVLSTRRELI EKDPELIRTL LKIHRKASEF 
AMGDRDAFIA MAMQKLGQQK PSIEQAAPNV ELTWNIDDLF LKQAQYYGAQ MLAKKQIRQL 
PDYKTFIDPS FVKAISAS