Gene RPD_2501 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPD_2501
Symbol
ID	4022992
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB5
Kingdom	Bacteria
Replicon accession	NC_007958
Strand	-
Start bp	2795473
End bp	2796588
Gene Length	1116 bp
Protein Length	371 aa
Translation table	11
GC content	68%
IMG OID	637962694
Product	hypothetical protein
Protein accession	YP_569632
Protein GI	91976973
COG category	[S] Function unknown
COG ID	[COG1289] Predicted membrane protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.0697497
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.340753
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGGCATC ACTGGACTTG GCACAGGGTG AAGGCGCTGG CGCGCGAAGA GTGGCGCGCG 
CTGGTCACCA TCAATCCGAG CGACCGGCCT TGGCAGATGC CGGCGTCCGT CGCGCTGGCC 
GCGGGGGCGC CGATGCTGAT CGGCGCCTAT TTCGATCACC TCGACTACGG CCTGATCTCC 
TCGCTCGGCG GCATGGCGTT TCTGTATCTG CCGCGCACGC CGCTGCATCA TCGCATGGTG 
TGGATGATGG CGGCGGCGTT CGGCTTCCTC GCCTGCTACA CGGTCGGCCT GATCGTGCAT 
CTGCTGCCTT GGCTGCTGGT GCCAGCGATC ACCCTCACCG CGATCATGGT GACGATGGTG 
TGCCGGTTCT ACCGGGTCGG TCCGCCCGGC AGCCTGTTCT TCGTGATGGC GGCCTCGATC 
GCCGCCTATA CGCCGGGCGA CCTGATGCAG GTGCCGCTGA AGGTCGGGCT ATTCGCGATG 
GGCAGCCTGC TCGCGACGCT GATCGCCTTC GCCTACACCC TGTTCGTCTT GCGCATCCGC 
GAGCCGCTGC CGATCGAGCC GCTGGCGCCG GCGGATTTCG AGATCGTCGT GCTCGACTCG 
GTGCTGATCG GCTGTGCGGT CGGCGTCTCG CTGGCTCTGG CGCAGGCGCT GCAACTGGAA 
CGCCCCTATT GGGTGCCGGT GAGCTGCCTC GCGGTGATCC AGGGCCTGTC GGTGCGCGCG 
ATCTGGAACA GGCAGCTGCA TCGCATCCTC GGCACCGTGC TCGGGCTGGT GCTCGCCGCG 
GCCTTGCTGG CGCTGCCGCT GGAGAAATGG AGCATCGCGC TGATGGTGCT CGGGCTCAGC 
TTCGTGATCG AAACCGCGGT GATCCGGCAC TACGGCTTCG CGGTGATCTT CATCACGCCC 
TTGACGATCT TCCTCGCCGA CGCCGCCACG CTCGGCCAGG AAGCCCCGAG CGCGATCATC 
GAGGCGCGGC TGATCGACAC CCTGCTCGGC TGTCTGGTAG GCTTCATCGG CGGCATCCTG 
CTGCACAACG CCGCGTTCCG CCGGCTGGTG CGGCCGGCGA TCCGCAAACT GACGCCGCTC 
CGGCTGGTGC CGGATCGCGC GCCGCGGCAG CCGTGA

Protein sequence

MRHHWTWHRV KALAREEWRA LVTINPSDRP WQMPASVALA AGAPMLIGAY FDHLDYGLIS 
SLGGMAFLYL PRTPLHHRMV WMMAAAFGFL ACYTVGLIVH LLPWLLVPAI TLTAIMVTMV 
CRFYRVGPPG SLFFVMAASI AAYTPGDLMQ VPLKVGLFAM GSLLATLIAF AYTLFVLRIR 
EPLPIEPLAP ADFEIVVLDS VLIGCAVGVS LALAQALQLE RPYWVPVSCL AVIQGLSVRA 
IWNRQLHRIL GTVLGLVLAA ALLALPLEKW SIALMVLGLS FVIETAVIRH YGFAVIFITP 
LTIFLADAAT LGQEAPSAII EARLIDTLLG CLVGFIGGIL LHNAAFRRLV RPAIRKLTPL 
RLVPDRAPRQ P