Gene RPB_2000 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPB_2000
Symbol
ID	3909506
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris HaA2
Kingdom	Bacteria
Replicon accession	NC_007778
Strand	+
Start bp	2272021
End bp	2273340
Gene Length	1320 bp
Protein Length	439 aa
Translation table	11
GC content	69%
IMG OID	637883894
Product	hypothetical protein
Protein accession	YP_485619
Protein GI	86749123
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.846413
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGCAACGAC AATTCGCGCC GCGATTGCGG CAATTGCACT GGTACGAGAT CGCGCTGATC 
GCCGCCGTCG CGCTGGCGCT CTGCATCTAT CTGCCGATCG TGGTGAAGCG CTCGGCGGTG 
CACGGGTTCG GCGACGTCCA GGTGTTCTTC CGCGCCGGCT GGGCGGTGTG GACAGGCTAT 
CCCCTGTATG AAGTCGCCGA TCATCACGGC TGGACCTATC ACTACCCGCC GTTCTTCGCG 
TTGCTGATGG GGCCGTTCGC CTATCCGCTC GACGGCTATC CCAAACCGGC CTGGGCGCTG 
CCGCTGCCGA TGTCGGTCGC GGTGTGGTAC GCGCTCAGCG CCGCCGCCGT GCTGATCGCG 
ATCGACTGGT GGGCGAGGGC GCTCGAACGC GGCGCTCCGC CTCTGCTCCA GGAGGCCGGC 
TGGAACGGGT GGTGGATGCT GCGGATCGGG CCGCTGGCGA CGCTGCTGCC GTTCATCGGC 
GACGGTTTCG GCCGCGGGCA GCCGAGCGCG CTGGTGCTGC TGACGATGGT GGCGTTCCTC 
GTGCTTTACG TGCAGGGCCG GATCTATGCG GCGGCGTGCG CGCTGGCGAT CGGCTTCACC 
ATCAAGCTGT TTCCGATCGC GCTGCTGCTG TTTCCGATAC TGCGGCGGGA CGTGAAAACG 
GTGCTGGCCA CCGCCGGCTT CAGTCTCGTC TTCCTGTTCG TCGTGCCGAC GCTGTGCCTC 
GGGCCGGCCG AAGTGATCAA ACTCTACACC GCGATGTGGA CCGAGCATCT CAACGGCATC 
CTCACCGGCG TGCCGAACGC CAAGATTGCC GCCGAAATCA CCTTCACCTC GTACGACATG 
CTGAGCATCG CCGCGATGCT GGCGCGGATC GGCGCTGGCG GCCTGCCCGC GGCCGACACG 
CTGCCGGGAT TCGCCACCGC GGGACAGATG GCCTTCAACG CCGCGTTCGC GGCCGCGCTT 
CTGTGGATCG GCCACGGCCG GTTCTGGCGC CTGACCGGGC CGCAACCGCC GCCGTCCGAA 
GCGCTGCTGA TCGGCGGCGC CATCCTGTGC GCCGCGCTGC CGGTGATGCT GTCGGTGTCG 
CAGCCGAACT ACGTGGCGTT CGTCGCGCCG TTGGTCGCAG TGGTGCAGGT CGACGCGTGG 
CGACGCAGCG GCGAGGTCAG GGTGGTGCCG CTGCTGATCG CCTGGGCCGG CGTGATGTGG 
CTCGGCATGG TCGCGACCGA AGGCGGGGTC TGGCAGCCGC TGCGCGTGAT CGGGCTGGCG 
ACGCCGGCGA TCGTGGCGCT GCTCGGCTGG GGCCTCGTCT GCCTGCGGCG GGCGCGATAG

Protein sequence

MQRQFAPRLR QLHWYEIALI AAVALALCIY LPIVVKRSAV HGFGDVQVFF RAGWAVWTGY 
PLYEVADHHG WTYHYPPFFA LLMGPFAYPL DGYPKPAWAL PLPMSVAVWY ALSAAAVLIA 
IDWWARALER GAPPLLQEAG WNGWWMLRIG PLATLLPFIG DGFGRGQPSA LVLLTMVAFL 
VLYVQGRIYA AACALAIGFT IKLFPIALLL FPILRRDVKT VLATAGFSLV FLFVVPTLCL 
GPAEVIKLYT AMWTEHLNGI LTGVPNAKIA AEITFTSYDM LSIAAMLARI GAGGLPAADT 
LPGFATAGQM AFNAAFAAAL LWIGHGRFWR LTGPQPPPSE ALLIGGAILC AALPVMLSVS 
QPNYVAFVAP LVAVVQVDAW RRSGEVRVVP LLIAWAGVMW LGMVATEGGV WQPLRVIGLA 
TPAIVALLGW GLVCLRRAR