Gene RPB_1291 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPB_1291
Symbol
ID	3908164
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris HaA2
Kingdom	Bacteria
Replicon accession	NC_007778
Strand	+
Start bp	1473383
End bp	1474423
Gene Length	1041 bp
Protein Length	346 aa
Translation table	11
GC content	64%
IMG OID	637883185
Product	twin-arginine translocation pathway signal
Protein accession	YP_484912
Protein GI	86748416
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG4663] TRAP-type mannitol/chloroaromatic compound transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.881073
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGCCGAGCT CGAGCAACAC GTCGAATCGA CGCAGCATTC TGAAGGGCGC GCTCGCCGTC 
GCGGCGGCTC CGGCGGTGAT CGGGCAAGCG CTGGCGCAGG AGAAAGTCAC CTGGAAGGTT 
CAGGCGCATT GGCCGAAAGC GTCGGGCTCG TTCAACGACA GTCTCGCCGT GCTCGCCAAG 
CAGCTCGCGG CGCGCACCGA CGGCCGCTTC AACCTGGAAC TGTTCGGCGC CGGCGAGATC 
GCCAAGGATC GTGAGATCTA CAACGTCGTT CGGCGCGGTG TCGTACCGAT GGGGACGATT 
TCTCCGGCGT ATATTCTCGG CGAAGCGCAG GCGATGGGGC TGCTCTACGG CGTGCCCGGC 
ACGCTGCGCG AGACCTGGGA GATGATGCAT CTGACCAAGA ATCTCGGCAT CGAGAAGATG 
GTCAACGAGG AACTGCGCCC CAAGGGCGTC GTCATCTTCG CCGAGAAGGC TTACCCGACC 
GAAGTGGTGC TCAAACGCAA GATCGGATCG GCCGCCGATC TCGGCTCGCT GAAGATCCGC 
TCCGCCGGCT CGATGCTGGA ATATCTCGCC GCCGCCGGCG CATCGCCGCA GCAGATCGCC 
GGCCCTGAGA TCTATCAGGC GATCTCGACC GGCGTAGTGG ACGGCGCGCA TTGGGGCGCT 
GCGGTCGGCG CGCTGTCGAT GAAATTCTGG GAGGTCGCGC CGTTCCACAT GAAGCCGGCG 
CTCGGCTTCA CCAACGACGC CTACATCATC AATACGGCCG CGCTGGACAA GCTGCCGGCC 
GACCTGCGGA TACAATTGCT GTCGCTGATC GAGGAACGCT ATTTTCTCCG CTCGGTGGAA 
TATCTGCATC AGGAGGCCGT CGCGTTGAGT ACCGGCAAGA CCAAGATGAA CGTCGAGGTC 
GTGCGGTTTT CCGACGACGT GCTCGGCAGA TTCACCGCGG CCTCGAAGAC GATCCTGCAG 
AAGGAAACCG CCAAGGGCGC CATCGCGACG AAGGGCGGCG AGGCCCTGAC GAAGCTGATG 
TCCGATCTCG GTTACGGCTG A

Protein sequence

MPSSSNTSNR RSILKGALAV AAAPAVIGQA LAQEKVTWKV QAHWPKASGS FNDSLAVLAK 
QLAARTDGRF NLELFGAGEI AKDREIYNVV RRGVVPMGTI SPAYILGEAQ AMGLLYGVPG 
TLRETWEMMH LTKNLGIEKM VNEELRPKGV VIFAEKAYPT EVVLKRKIGS AADLGSLKIR 
SAGSMLEYLA AAGASPQQIA GPEIYQAIST GVVDGAHWGA AVGALSMKFW EVAPFHMKPA 
LGFTNDAYII NTAALDKLPA DLRIQLLSLI EERYFLRSVE YLHQEAVALS TGKTKMNVEV 
VRFSDDVLGR FTAASKTILQ KETAKGAIAT KGGEALTKLM SDLGYG