Gene RPD_3339 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPD_3339
Symbol
ID	4023850
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB5
Kingdom	Bacteria
Replicon accession	NC_007958
Strand	-
Start bp	3702215
End bp	3703342
Gene Length	1128 bp
Protein Length	375 aa
Translation table	11
GC content	59%
IMG OID	637963544
Product	putative OpgC protein
Protein accession	YP_570464
Protein GI	91977805
COG category	[S] Function unknown
COG ID	[COG4645] Uncharacterized protein conserved in bacteria
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.523015
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGACAGCA TGAGCGAAGC AACGAAATCC ACCGCTACGA AACGCGATCT GCGTCTCGAT 
CTCTTCCGCG GCATGGCGAA CTGGGCGATC TTTCTGGATC ACATCCCTAA CAACGCGGTC 
GCATGGCTGA CGATGCGAAA CTACGGATTC AGCGACGCTG CTGAATTGTT CGTCTACGTC 
TCCGGATTCA CGGTCGCATT CGTGTATGCG CGGATGATGC GCGCCAAAGG ATTGCTCGCG 
GCGGCAATCG GAATTCTCGG CCGGGTCTGG CAGATCTATG TCGCCTATGT GCTGCTTTTC 
GTCTTCTACG TGGTTGCCGT CGGCTATGTG GGGCAGGTCG ATGGGCATGC CCATCTTCTC 
GACCAATACA ACATCCGCAG GCTGATCGCC GATCCGGTCG AATTTCTGAA GCACGGTCTT 
CTGCTCGAAT ATCGGCCGCT CAATCTGGAT GTCCTGCCGC TCTACATCGC GCTGATGGCG 
CCGTTTCCGC CGGTGCTCTG GCTGCTCACG AAGTCGCCTA ACGTCGCATT GGCCGGTTCG 
TTCATCCTCT ACATTGTCGC GCGGTGGTTA GGCTGGAATC TCACCGACTA TCCGTCCGGT 
TCCTGGTACT TCAACCCGTT CGCCTGGCAG TTTCTGTTCG TGATCGGGGC GTGGACGGCG 
ATCGTCGATC GCGACGCGTT GCAGAAGATC TTGCGGTCGA GGATCATCAT GGCGCTGGCC 
GTCGCGATCG TGGCTGTGTC TGCGATCGTG ACTGTCGCAC TACGCACCGG GAACGACTGG 
CTGTTGCCCG AGACGCTTCG GCTTGCGTTC TCCCTGAACG ACAAGACAAA CCTCGCGCCC 
TATCGCATTG TTCACTTTCT GGCATTGGCG ATCATCGTGG CGCGTCTTAT TCCGAGGGAT 
GCTCCATCGC TCAACTGGCC GGTGTGGCGG CCGTTGATCG TCAGCGGCCA GCACTCGCTG 
GAAGTGTTCT GCGTGGGAAC CTTCTTGGCA GCCATCGCCT ATTTCGCGCT CCACCTGATC 
AACGACTCTT TCGCGGCTCA GATCTTCGTG AGCGTCGTCG GCATTGCCGG GATGGTCGCG 
GTTGCCTATT TCCGGACTTG GGTGAAGAGC AGGTCGCTCG CCGTGTAG

Protein sequence

MDSMSEATKS TATKRDLRLD LFRGMANWAI FLDHIPNNAV AWLTMRNYGF SDAAELFVYV 
SGFTVAFVYA RMMRAKGLLA AAIGILGRVW QIYVAYVLLF VFYVVAVGYV GQVDGHAHLL 
DQYNIRRLIA DPVEFLKHGL LLEYRPLNLD VLPLYIALMA PFPPVLWLLT KSPNVALAGS 
FILYIVARWL GWNLTDYPSG SWYFNPFAWQ FLFVIGAWTA IVDRDALQKI LRSRIIMALA 
VAIVAVSAIV TVALRTGNDW LLPETLRLAF SLNDKTNLAP YRIVHFLALA IIVARLIPRD 
APSLNWPVWR PLIVSGQHSL EVFCVGTFLA AIAYFALHLI NDSFAAQIFV SVVGIAGMVA 
VAYFRTWVKS RSLAV