Gene RPB_3110 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPB_3110
Symbol
ID	3910911
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris HaA2
Kingdom	Bacteria
Replicon accession	NC_007778
Strand	-
Start bp	3543263
End bp	3544303
Gene Length	1041 bp
Protein Length	346 aa
Translation table	11
GC content	66%
IMG OID	637885014
Product	twin-arginine translocation pathway signal
Protein accession	YP_486719
Protein GI	86750223
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0715] ABC-type nitrate/sulfonate/bicarbonate transport systems, periplasmic components
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.995497
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.585688
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCGAGAG GGAAGATGAC ACGGCGCGAT TGGCTGAAGA CCGGGGCCGC GACCATGGCC 
GTCGTGTCGT TTCCGGCGAT CGTGCGGGCG CAATCGCTGA AGTCTCTGCG TGCGGTCTCT 
CTGCAGACCG ACTGGATCTA CGGCGGACCG AACGCCGGCT TCCTGGTCGC GAAGGAGAAG 
GGCTACTTCG CCGATGAAGG CCTCGACGTC TCCATCAACC AGGGCAAGGG CTCCGGCAAC 
ACCGCGCAGA TCGTCGCGTC GAAGGCTGCG CAGTTCGGCT TCGCCGACGG CTACGTCGTC 
GGCAACACGG TGTCGAAGGG CGCCAAGCTG AAGATGGTCG CCGGGATCTA TCGGCGGAAC 
CCATGCGCCG TGCTCGTGCT CGAGGGCTCG GATGTCAGGG AGCCGAAGGA TCTGGTCGGC 
AAGACCGTCG GCATCACCAC CGGCTCGGCG CAGTTCCAGC AATTTCCGGC GTTCCTCAAG 
AGTTCGGGGG TCGATCCCGC GTCGGTCCGC GTCGTCAATG TCGACGGCGC CGGCGCCGGC 
CCGGCGCTGA TCAACGGCCA GGTCGCGGCG ATCGCCGGCT TCGCCCAAGG CTACATCCCG 
TCGATCGAGA TCCGCGGCAA GAAGAACGTG CGGCCTTTCT GGTACTCCGA CGCCGGGGTG 
GTCTGCATGA GCAACGGCCT GATCGTGCAC GACGACATGC TGTCCGAGCC GAATGTCATA 
CGCGGCATGG TGCTGGCCAG CGTGAAGGGG TTCCTCTACG GCCGCGCCCA TCCCGACGAA 
CTGACGCAGG TCGTGAAGAA GTATCTCGAG TCGACCGACC CGGCGATCAC CTTGCGCGAG 
GCGCAGCTGT CGTGGAGCAC CTGGGTCACC CCGACGTCGG CCAACAAGCC GCTCGGCTGG 
ATGCCGCCCG AGGATTGGGC CTCGACCGTG GCGGTGCTGA AGGCGAATGC CGGAGTCACC 
ACAGCGCTCG AGCCGGCGGC GCTCTACACC AACGATTTCG TGCCCACGGG CCGGGAGTTC 
GTCCCGCCGC AGAGCGTGTG A

Protein sequence

MPRGKMTRRD WLKTGAATMA VVSFPAIVRA QSLKSLRAVS LQTDWIYGGP NAGFLVAKEK 
GYFADEGLDV SINQGKGSGN TAQIVASKAA QFGFADGYVV GNTVSKGAKL KMVAGIYRRN 
PCAVLVLEGS DVREPKDLVG KTVGITTGSA QFQQFPAFLK SSGVDPASVR VVNVDGAGAG 
PALINGQVAA IAGFAQGYIP SIEIRGKKNV RPFWYSDAGV VCMSNGLIVH DDMLSEPNVI 
RGMVLASVKG FLYGRAHPDE LTQVVKKYLE STDPAITLRE AQLSWSTWVT PTSANKPLGW 
MPPEDWASTV AVLKANAGVT TALEPAALYT NDFVPTGREF VPPQSV