Gene RPB_2081 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPB_2081
Symbol
ID	3908494
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris HaA2
Kingdom	Bacteria
Replicon accession	NC_007778
Strand	+
Start bp	2364511
End bp	2365695
Gene Length	1185 bp
Protein Length	394 aa
Translation table	11
GC content	66%
IMG OID	637883973
Product	twin-arginine translocation pathway signal
Protein accession	YP_485698
Protein GI	86749202
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0683] ABC-type branched-chain amino acid transport systems, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.353288
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGTTTCG CTTCCCATAT TTCGCGTCGC CTGTTGCTCG CGGCCGGCGC CGCGTCGCTG 
GCACTGATCG CTGTCGGGCC GGCATCGGCC CAGGAGACCC TGAAGGTCGG CCTGGTGGCG 
GCGATGTCCG GCCAGTCGGC GAAGTCCGGC GAGGCCATCG TCCGCGGTCT GTCGCTGGCG 
CTGGACGAGA TCAACGCCAA GGGCGGCGTG CTCGGCAAGA AGCTGGAACT GGTGGTGCGC 
GACGACGAGA GCAATCCCGC CAAGGGCGTG ATCGCCGCGC GCGAGCTGGT GCAGCGCGAG 
AAGGTCGCCG CTTACTTCGG CGGCATCGAT ACGCCGGTGT CGATGGCGAT CGTGCCGTTC 
GCCAATCAGT CCAAGGTGCC GTTCATCGGC GTCTGGGCCG CCGGTACCAA GATCACCCGC 
AACGGCGCGC CGGAGAACTA CGTGTTCCGC GTCTCCGCGG TCGACGAACT GGTCGACATC 
GCGCTGGTCG ACTACGCGGT CAAGAAATAC GGCGCCAAGA AGCCGGGCAT GATCCTCATC 
AACAATCCCT GGGGCGAATC CAACGAGGCC GGGCTGAAGA GCGCGCTCGA CGCCAAGAAG 
ATGACCGCCG CCGGCATCGA GAAATTCGAG ACCGGCGACG TCGACGTCGT GCCGCAGCTC 
ACCCGGCTGA AGGACGCCGG CGCCGACACG CTGTTCATGG TCGCCAATGT CGCGCCCTCC 
GCGCAGGTGG TGAAGTCGCT CGACCGGATG GGCTGGAGCG TGCCGGTGGT GTCGCATTGG 
GGCCCGGCCG GCGGGCGTTT CACGGAGTTG GCCGGCCCCA GCGCCGAGAA GGTCCACTTC 
ATCCAGACCT TCAGCTTCTC CGGCAACACC AGCCCGAAAG CCGTGGCGCT GTTCGACGCG 
CTGAAGAAGA AATATCCCGA GGTCAAGACG GCCGCCGACG TCACCCCCGC GGTCGGCATC 
GCCAATGCCT ACGACGCCAT GCATCTCACC GCGCTGGCGA TCGCCAAGGC CGGCTCGACC 
GAAGGCCCGA AGGTCCGCGA AGGCTTCTAC CAGATCGGCA GCTATGACGG GCTGATCAAG 
ACCTACAACA AGCCCTTCAC CGCCGACAAT CACGACGCGC TGTCGCCCTC GGACTATCTG 
TTCACCTACT TCAAGGGCGC CGAGATCCTG CCGCTGACGA ACTGA

Protein sequence

MSFASHISRR LLLAAGAASL ALIAVGPASA QETLKVGLVA AMSGQSAKSG EAIVRGLSLA 
LDEINAKGGV LGKKLELVVR DDESNPAKGV IAARELVQRE KVAAYFGGID TPVSMAIVPF 
ANQSKVPFIG VWAAGTKITR NGAPENYVFR VSAVDELVDI ALVDYAVKKY GAKKPGMILI 
NNPWGESNEA GLKSALDAKK MTAAGIEKFE TGDVDVVPQL TRLKDAGADT LFMVANVAPS 
AQVVKSLDRM GWSVPVVSHW GPAGGRFTEL AGPSAEKVHF IQTFSFSGNT SPKAVALFDA 
LKKKYPEVKT AADVTPAVGI ANAYDAMHLT ALAIAKAGST EGPKVREGFY QIGSYDGLIK 
TYNKPFTADN HDALSPSDYL FTYFKGAEIL PLTN