Gene RPB_1120 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPB_1120
Symbol
ID	3909205
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris HaA2
Kingdom	Bacteria
Replicon accession	NC_007778
Strand	+
Start bp	1289268
End bp	1290272
Gene Length	1005 bp
Protein Length	334 aa
Translation table	11
GC content	64%
IMG OID	637883013
Product	ABC transporter, periplasmic binding protein
Protein accession	YP_484741
Protein GI	86748245
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0715] ABC-type nitrate/sulfonate/bicarbonate transport systems, periplasmic components
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.214587
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAACTA CGACCCTCGG AAAACTGGGG CTGACGCTGG TCGCAGCGCT GCTGGCGAGC 
CCATCGCGGG CGGAACTCGG TCAGGTGCGC GTCGCCACCC AGATCGGCCT CGCCTATCTG 
CCGCTGATCG TCATGGAGCA CGACAAGCTC TGGGAGAAGA AGGCGGCGGA GAAGGGCGTT 
TCGGTCAAGG TCGAATACCT CCGGCTCGGC GGCGGCTCGC CCCTCAACGA CGCGCTGCTG 
TCGGACTCGG TGCAAGTCGC CTCGGCCGGT CTCGCGCCGC TGCTGACGCT GTGGGACCGC 
ACCAAGCCCA ACTACAAGGT CAAGGCTCTG TCGGCCGTCG CCACGGCGCC GATGTATCTG 
CTGTCCAACA ACCCCAACGT CAAAACCATC AAGGACTTCA CCCCGGCGGA CCGCATTGCG 
GTGGCGAGCG TCAAGATCTC GATCAACGCC ATCGTGCTCA ACATGGGCGT CGAGCAGGCC 
TTCGGCGCCG GCAAGGCCAA CGCGCTCGAC GACATTCAGG TCGCGATGGC GCATCCCGAA 
GCCTATGCGG CGCTGACCAC GCGCGCCGGC GGCATCACCG GCTACATGGC GACCTCGCCG 
TTTCAGGAGC GGGCGCTGAC GCAGCCCGGC ATTCACAAGG TCGCCGATTC GTTTGGCATT 
CTCGGCGGGC CGTCGACCTT CAGCGTCGCC TACGCCAAAT CGGACTTCGT CAACGGCAAT 
CCGAAGCTGG TCGAGGCGTT CATCGAAGCG CAGCGCGAAG CCGTCAAGTT GATCGTCACC 
GACCGGGCCA AGGCGATCGA CGGCTACCTC GCGGTCACCG GCGACAAAAC CGACCGCAAG 
CTGATCGAGA CCATCCTCGC TTCCCCCGAA TATGATTTCG ACATCGCGCC GAAGGCGACG 
ATGCCGATGG CGGGCTTCAT GCAGCGCACC GGCATTCTGA AGTCGGCGCC CGCGTCGTGG 
CGCGACTACT TCTTCGACAC CATGAAGAAC GAGAAGGGAA GCTGA

Protein sequence

MKTTTLGKLG LTLVAALLAS PSRAELGQVR VATQIGLAYL PLIVMEHDKL WEKKAAEKGV 
SVKVEYLRLG GGSPLNDALL SDSVQVASAG LAPLLTLWDR TKPNYKVKAL SAVATAPMYL 
LSNNPNVKTI KDFTPADRIA VASVKISINA IVLNMGVEQA FGAGKANALD DIQVAMAHPE 
AYAALTTRAG GITGYMATSP FQERALTQPG IHKVADSFGI LGGPSTFSVA YAKSDFVNGN 
PKLVEAFIEA QREAVKLIVT DRAKAIDGYL AVTGDKTDRK LIETILASPE YDFDIAPKAT 
MPMAGFMQRT GILKSAPASW RDYFFDTMKN EKGS