Gene RPB_3120 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPB_3120
Symbol
ID	3910921
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris HaA2
Kingdom	Bacteria
Replicon accession	NC_007778
Strand	-
Start bp	3554244
End bp	3555266
Gene Length	1023 bp
Protein Length	340 aa
Translation table	11
GC content	63%
IMG OID	637885024
Product	twin-arginine translocation pathway signal
Protein accession	YP_486729
Protein GI	86750233
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0715] ABC-type nitrate/sulfonate/bicarbonate transport systems, periplasmic components
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCGATGG ATCCTACGCG CCGCGGCTTT TTGACGCTTG CTGCAGGTGC GACGATGGCC 
GCGCCCGGCA TTCTTCGCGC ACAGACGCTG CGCCCGGTAA CGTGTCTGAC CGACTGGTTG 
CATCAGGGGC CGAATTGCGG TTTCGCAGTC GCGAAAGAAA AGGGCTTCTA CGCCGAGGCG 
GGTCTCGACG TCGCGCTGAG TCAAGGCAAG GGCTCGGGCG GAACCGCGCA GATCGTGGCG 
AACAAGGCGT CGATGTTCGG CTTCGCGGAC GGATTTGTCG TCGGTAATAG CGTCTCCAAG 
GGCATGCGCC TGACGATGGT CGGCGCGGTG TTCCGTCGCA CGCCGACGGC CGTGATCGTG 
CTCGACGAAT CCTCGATCCA ACAGCCGAAA GATCTGATCG GCAAGACCAT CGGCATTCCG 
ACCGGCTCCG CACAATTTCA GCAATGGCCG GCCTTCGTCA ACGGCGCGGG GCTGCAGCTG 
TCACAGATCA AGGTCATCAA TGTCGATGCT GCGGGCGCAG TGCCGGCGCT GATCTCGGGA 
AAGGTCAACG CAATCGCCGG CTTCGCCCAA GGCTGGGTTC CGAGCATCGA GATCCGCGGC 
AACAAGAAGG CGCGAACGTT CTGGTACGCC GATCACGGCG TCAACGCGGT GAGTAACGGC 
ATTATCGTCC ATCGGGACAC GCTGTCCGAC AAGCCGCTGG TCGCCGCCTT CGTCCGGGCG 
ACCTTGAAGG GCTTTCTGTA TGGCCGTCAG AATCCCGACG AGACGGCGCA GATCATCAAG 
AAGTATCAGG AAGCCAGCGA TCCGGCGATC ACCAAGCGGG AAGCCGAACT GTCCTGGCGG 
ACCTGGGTGA CGCCGACGAC GAAAGACAAG CCGCTGGGAT GGATTGCGCC GGAGGATTGG 
AAGGCGACGG TGGAGACGCT CAAGGCCTAT GGCGGGGTGA CCATCGATCT CGATCCGTCG 
CAGCTCTACA CCAACGAGTT CGTGCCGACG GAGCCCGAAT TCGTGCCCCC CCAGAACGCC 
TGA

Protein sequence

MPMDPTRRGF LTLAAGATMA APGILRAQTL RPVTCLTDWL HQGPNCGFAV AKEKGFYAEA 
GLDVALSQGK GSGGTAQIVA NKASMFGFAD GFVVGNSVSK GMRLTMVGAV FRRTPTAVIV 
LDESSIQQPK DLIGKTIGIP TGSAQFQQWP AFVNGAGLQL SQIKVINVDA AGAVPALISG 
KVNAIAGFAQ GWVPSIEIRG NKKARTFWYA DHGVNAVSNG IIVHRDTLSD KPLVAAFVRA 
TLKGFLYGRQ NPDETAQIIK KYQEASDPAI TKREAELSWR TWVTPTTKDK PLGWIAPEDW 
KATVETLKAY GGVTIDLDPS QLYTNEFVPT EPEFVPPQNA