Gene RPC_2084 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPC_2084
Symbol
ID	3971849
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB18
Kingdom	Bacteria
Replicon accession	NC_007925
Strand	-
Start bp	2281867
End bp	2283066
Gene Length	1200 bp
Protein Length	399 aa
Translation table	11
GC content	67%
IMG OID	637925192
Product	hypothetical protein
Protein accession	YP_531957
Protein GI	90423587
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.413022
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGTTGAGA CCTTGATGCG ATCCCCGATC CGCCGGATTT TGGCCGGCGC CGCGTTGTTG 
GGCCTTGGTG CCCTCAGCTT CGAAGCCGCG GCGCAGGGCT ATCCGCCTGC ATCCGCGCCG 
CCTCCCCAAC AGGGCTATCC GCAGAGCTAT CCGCCCGGGC AAAACCCGCA GGGCGGCGCC 
GCGACCAATC CGATGTGCCA GCGGCTGGAA GCGCAATTGG CCAACGTCGA CCGCGGCGGC 
AACGGCGATC AGGCCAAGGC CGAGCAGATT CGCCGCTTCG AGGATTCCGC CGCCAGGCAG 
CAAGGCGAAC TCGACCGCGT CACCACCCAG GCCAAGCGGA TGGGCTGCGA CAGCTCGGGA 
TTCTTCTCGC TGTTCAACAA CCAATCCGCG CAATGCGGCC CGATCAACAA CCAGATCCAG 
CAGATGCGCG GCAATCTGGA CCAGATCACC ATCAGCCTGG AGCGGCTGCG GATGGGCGGC 
GCCGGCACTT CGGAGCGCGA CAATCAGCGC CGTTCGGTGC TGCTGGCGCT GGCGCAGAAC 
AATTGCGGCC CGCAATACGC CGCCGCGGCG CGCAACGGCG GCAATTTCCT CGACAATCTG 
TTCGGCAACA ACAACAACCC GGGCGGTAAC GACAATCCCG GCGGCGTCCC CGTCCCGGCC 
GATCTCGGGC CGCAATCCGG CACCTATCGC ACCGTCTGCG TGCGCAGCTG CGACGGCTTC 
TATTTTCCGA TCTCGTTCGC CACCGTGCCG GGCCGGTTTC CCGACGACGA AAGGTCCTGC 
AAGAACCTCT GCCCGGCCGC GGAAGCCACG CTGTTCACCT ATCGCAATCC CGGCGAGGAC 
ATGAACCAGG CGGTGTCGAT CAACGGCCAG CCCTATGCCT CGTCGCCGAA CGCGTTCCGC 
TATCGCCAGG AATTCAACCC GTCTTGCGCC TGCAAGGCCG CCGGCCAGAC CTGGGCCGAC 
GCCTTGAAGA GCATCGACGA CAAGGGCTCG GTCGAACAAG GCGATATCTT CGTCACCGAG 
GAGCGCGCCA AGAAGATGTC GCAGCCGCTG GCGAAGCCGG CATCGGCCGC GCAGAAGAAA 
GGCGCCGCCA CCCCCGCGGC TGCACCCAGC GCGGCCCCGG CGCCGGCGGC GGATGCAACC 
ACCGATGCCA GCGGCAACAA GATCCGCTCG GTCGGCCCGA CCTTCATCCC GGCGCGATAG

Protein sequence

MVETLMRSPI RRILAGAALL GLGALSFEAA AQGYPPASAP PPQQGYPQSY PPGQNPQGGA 
ATNPMCQRLE AQLANVDRGG NGDQAKAEQI RRFEDSAARQ QGELDRVTTQ AKRMGCDSSG 
FFSLFNNQSA QCGPINNQIQ QMRGNLDQIT ISLERLRMGG AGTSERDNQR RSVLLALAQN 
NCGPQYAAAA RNGGNFLDNL FGNNNNPGGN DNPGGVPVPA DLGPQSGTYR TVCVRSCDGF 
YFPISFATVP GRFPDDERSC KNLCPAAEAT LFTYRNPGED MNQAVSINGQ PYASSPNAFR 
YRQEFNPSCA CKAAGQTWAD ALKSIDDKGS VEQGDIFVTE ERAKKMSQPL AKPASAAQKK 
GAATPAAAPS AAPAPAADAT TDASGNKIRS VGPTFIPAR