Gene RPB_2056 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPB_2056
Symbol
ID	3909871
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris HaA2
Kingdom	Bacteria
Replicon accession	NC_007778
Strand	+
Start bp	2338230
End bp	2339147
Gene Length	918 bp
Protein Length	305 aa
Translation table	11
GC content	68%
IMG OID	637883949
Product	ABC transporter related
Protein accession	YP_485674
Protein GI	86749178
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG1116] ABC-type nitrate/sulfonate/bicarbonate transport system, ATPase component
TIGRFAM ID	[TIGR01184] nitrate transport ATP-binding subunits C and D

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATCGACA AGTTCATTTC GATCGAGGGC ATCGCCAAGC GCTATCCCGG CGCGGCCGGC 
GCCGGCGACA CCACGATCTT CGAGAACCTC TGGTTGTCGC TGCCGCGCGG CGAGTTCGGC 
TGCGTCATCG GCCATTCCGG CTGCGGCAAG ACCACGGTGC TCAACATCCT CGCCGGGCTC 
GACGCGCCCA GCGAAGGCGC GGTGATCGTC GACGGCCAGG CGATCGAGGG CACCAGCCTC 
GACCGCGCGG TGATCTTCCA GAGCCACGCG CTGCTGCCGT GGCGCACGGT GATGGGCAAC 
GTCGCCTATG CGGTGAGTTC GAAATGGCGC AAATGGGACA AGGCGCGCGT CCGCGCCCAC 
GCCCAGCAAT TCATCGACCT CGTCGGCCTG ACCGGTTCGG AGCACAAGCG GCCCTCGGAA 
CTGTCCGGCG GCATGAAACA GCGCGTCGGC ATCGCCCGCG CGCTGAGCAT CACGCCGAAG 
ATCATGCTGA TGGACGAGCC GTTCTCGGCG CTCGACGCGC TGACCCGCGG CTCGCTGCAG 
GACGAGGTCC GCCGGATCTG TCTGGAGACC GGCCAGACCA CCTTCATGAT CACCCACGAC 
GTCGACGAGG CGATGTATCT CGCCGATAAA ATCTTCCTCA TGACCAACGG CCCCGGCGCC 
GTGGTGGCGG AGATCGTCGA GAACCCGCTG CCGAAGGATC GCGCAAGGAT CGATCTGCAC 
CGGCATCCTT ATTACTACGC GCTGCGCAAC CACATCGTCG ACTTCCTGGT GACGCGCAGC 
AAGACCTTCG CCGCCGCCAA TCCGAACCAC GATCCGCTCG CCGTGCCGGT GGTGCGCCCC 
GGCCTCGGCG AACCCGCTCT GGTGCCGGCC GCGAACGGCG CCGGCGCGTC GGCTCCGGCG 
CAGCTCCGCG CGCGCTGA

Protein sequence

MIDKFISIEG IAKRYPGAAG AGDTTIFENL WLSLPRGEFG CVIGHSGCGK TTVLNILAGL 
DAPSEGAVIV DGQAIEGTSL DRAVIFQSHA LLPWRTVMGN VAYAVSSKWR KWDKARVRAH 
AQQFIDLVGL TGSEHKRPSE LSGGMKQRVG IARALSITPK IMLMDEPFSA LDALTRGSLQ 
DEVRRICLET GQTTFMITHD VDEAMYLADK IFLMTNGPGA VVAEIVENPL PKDRARIDLH 
RHPYYYALRN HIVDFLVTRS KTFAAANPNH DPLAVPVVRP GLGEPALVPA ANGAGASAPA 
QLRAR