Gene RPD_1913 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPD_1913
Symbol
ID	4022395
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB5
Kingdom	Bacteria
Replicon accession	NC_007958
Strand	-
Start bp	2149390
End bp	2150505
Gene Length	1116 bp
Protein Length	371 aa
Translation table	11
GC content	61%
IMG OID	637962106
Product	hypothetical protein
Protein accession	YP_569049
Protein GI	91976390
COG category	[S] Function unknown
COG ID	[COG5330] Uncharacterized protein conserved in bacteria
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.171289
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.959449
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGTTCAA AATCGGCACT ATCCGCCGCC AATCTTCTCG ATGAACTGCA ATCCACGCTC 
GCGCACGGCA CGGTCGCCCG GCGCGTCGAA ACATTGCGCC GGGTCACCGA TCTGTATCTC 
GACGGCGAGG TCGACTACAC CGAGGATCAG ATCTCGGTAT TCGACGATGT CTTCAACTGC 
CTGGTTCGGA ACATCGAAAC CAACGCAAAG GTCCTGCTGG CCCAGCGGCT CGCCCCGGTG 
AACGCGCCGC CGCGGATCAT CCATCATCTC GCCTTCGAGG ACATGATCGA GATCGCGGCG 
CCGGTGCTCA CGCAGTCCGA ACAGCTCGAC GACGCAACGC TGATCGCCAA TGCCCGCACC 
AAGGGACAGG GCCATATGAT GGCGATCTCG AACCGCAAAT CGCTAAGTGG CGCGGTAACC 
GACGTGCTCG TCGAGATCGG CAATCAGCAG GTGGTGCAGA GCACCGTCAA GAATCCCGGC 
GCCGAATTCT CCGACAACGG CTATTCGATG CTCGCCAGAC GAGCCGAGCA GGACGACGAC 
CTCGCCACCG AACTCGGCAA GCGCGCAATC CCGCGCGCAC AATATCTCAA GCTGATCGCC 
ATCGCGTCGG CCTCGGTGCG GACGAAGCTC AAGGCGGCGA ATCCGACCGC CGCCTCCGAG 
GTGTCGAGTG CGGTGAAGAA AGCGACTTCG CTGGCGCGCT CTGCTCACTC GACGGTGAGC 
CGGCAAACCA ACATCGCCCA TGGCTTGGTA CGTGCCCTGT TCGAGGACGG CCGCATCAAC 
GAAGACCAGA TATTCCTCTT CGCCAACGAA CAGAAGTTCG ACGAGATCAA CCAAGCGATC 
GCCTGCCTCG CAGGGACATC AGTGGAAACC GTCGAATCAA TGATGGTCGA GTCCCGCGAC 
GAAGGCCTGC TGATTCTCGC CAAGGTCTGC AACTTCTCCT GGTCCACGGT GAACGCGATC 
ATTCATATGC GCGACGAACT GACCGGGACC AGATCGGGCG ATCTCGAGGA ATGTCGCCTC 
ACCTATGATC GGTTGCGCAA TTCGACTGCG CAGCAGGTGC TGCGCTTCCA CCGTATGCAG 
CAATCGACCG CGACCGCAAA GCCGCCGGCC GCCTGA

Protein sequence

MSSKSALSAA NLLDELQSTL AHGTVARRVE TLRRVTDLYL DGEVDYTEDQ ISVFDDVFNC 
LVRNIETNAK VLLAQRLAPV NAPPRIIHHL AFEDMIEIAA PVLTQSEQLD DATLIANART 
KGQGHMMAIS NRKSLSGAVT DVLVEIGNQQ VVQSTVKNPG AEFSDNGYSM LARRAEQDDD 
LATELGKRAI PRAQYLKLIA IASASVRTKL KAANPTAASE VSSAVKKATS LARSAHSTVS 
RQTNIAHGLV RALFEDGRIN EDQIFLFANE QKFDEINQAI ACLAGTSVET VESMMVESRD 
EGLLILAKVC NFSWSTVNAI IHMRDELTGT RSGDLEECRL TYDRLRNSTA QQVLRFHRMQ 
QSTATAKPPA A