Gene RPD_0082 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPD_0082
Symbol
ID	4020537
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB5
Kingdom	Bacteria
Replicon accession	NC_007958
Strand	+
Start bp	97298
End bp	98515
Gene Length	1218 bp
Protein Length	405 aa
Translation table	11
GC content	67%
IMG OID	637960259
Product	hypothetical protein
Protein accession	YP_567223
Protein GI	91974564
COG category	[S] Function unknown
COG ID	[COG1322] Uncharacterized protein conserved in bacteria
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.552116
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	7
Fosmid unclonability p-value	0.0373517
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAACGAGA CCCTCTTCTA TCTTGGCGAC GCTCCGGTCA GCATTGGCGC GGCGCTGTTC 
GGCGCGAGCG CGATGGCGTT GCTGTTGCTG CTGGCGATCG TGCTGGTGAT CGCGCACGGG 
CTGCAGAGCG GCAGCGCCGC GGCCCTGGCG CAGGCCCGCC GCGCCTCTGA CCTGGAGCAA 
CGCCTGTCGG GCCTGATCAG GTTCCAGAGC GAAGCCAATG GCCGGGTCGA CGCGATGGGC 
CGGGCGCTGG CGGGGCGGCA GGCCGAAATG GCGCGCGCGG TCAGCGAGCG GCTGGATACG 
GTCACCCACC GGGTCGGCCA GTCGATGACG CAATCGACCC GCCACACCAT GGAAAGCCTG 
CAGGCGCTGC ACGAGCGGCT CGGCATCATC GATCGCGCCC ACGACAACCT CACCGAGCTG 
ACCGACCAGG TGACGTCGCT GCGCGACGTG CTCGCCAACA AGCAGGCTCG CGGCGCGTTC 
GGCCAGGCGC GGATGGAGTC GATCGTGCAG GACGGGATGC CGAAGGGCGC CTACGCCTTC 
CAGTACACGC TCTCCACCGG CAAGCGGCCG GATTGCGTGG TGTTCCTGCC CGACCAGCGG 
CCGCTGTGCA TCGACGCCAA GTTTCCGCTC GAGGCGGTCA CCGCGCTCCG CGAATCCCGC 
AGCGACGGAG AGAAGAAGGC GGCGTCGCAG CGGCTGCGGC TCGACGTGAT GCGGCATGTC 
GACGATATCG CGGCCAAGTA TCTGATCCCC GGCGAGACCC AGGACACCGC GTTGATGTTC 
GTGCCATCGG AATCGGTCTA TGCCGAGATC CATGACGGCT TCGACGATGT GATCCAGAGG 
GCATATCGCG CCCGCATCGT GCTGGTGTCG CCGTCGTTGC TGATGCTGGC GATCCAGGTG 
ATGCAGCAGA TTCTGAAAGA CGCGCGGATG CGCGATGCCG CCGATCAAAT CCGAACCGAA 
GTGCTGAGCC TCGGCGACGA TCTCGCGCGG CTGCGCGAGC GTGTCACCAA GCTGCAAACC 
CATTTCGGCC AGGTCAACGA TGACGTCCGC CAGATCCTGA TCTCGGCCGA CAAGATCGAA 
CGCCGCGCCG TGCGGATCGA GGAACTGGAT TTTTCCGCGG TCGAACCGTC GACCGGCACG 
CAAGCGCCGC TGGCGCCGGA AGCCAGAGAC CTGTTCGCGT CCCGCGCGTT CAAGATCGAC 
GAAGTCGCTT CAGACTGA

Protein sequence

MNETLFYLGD APVSIGAALF GASAMALLLL LAIVLVIAHG LQSGSAAALA QARRASDLEQ 
RLSGLIRFQS EANGRVDAMG RALAGRQAEM ARAVSERLDT VTHRVGQSMT QSTRHTMESL 
QALHERLGII DRAHDNLTEL TDQVTSLRDV LANKQARGAF GQARMESIVQ DGMPKGAYAF 
QYTLSTGKRP DCVVFLPDQR PLCIDAKFPL EAVTALRESR SDGEKKAASQ RLRLDVMRHV 
DDIAAKYLIP GETQDTALMF VPSESVYAEI HDGFDDVIQR AYRARIVLVS PSLLMLAIQV 
MQQILKDARM RDAADQIRTE VLSLGDDLAR LRERVTKLQT HFGQVNDDVR QILISADKIE 
RRAVRIEELD FSAVEPSTGT QAPLAPEARD LFASRAFKID EVASD