Gene RPD_3785 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPD_3785
Symbol
ID	4024301
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB5
Kingdom	Bacteria
Replicon accession	NC_007958
Strand	-
Start bp	4225216
End bp	4226643
Gene Length	1428 bp
Protein Length	475 aa
Translation table	11
GC content	66%
IMG OID	637963989
Product	PUCC protein
Protein accession	YP_570907
Protein GI	91978248
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	7
Fosmid unclonability p-value	0.0284698
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAACACAG TCAGCCAAAA GATGATGAGA GTCTGGGCCT CGCTCGGGTC TCGCTTTCTG 
CCTTTCGCGG ATGCGGCGAC GCCGGATCTG CCTCTGTCCC GGTTGCTGCG CCTGTCGCTG 
TTTCAAGTGG CGGTCGGCAT GTCGCTGGTG CTGCTGGTCG GCACCCTGAA CCGGGTGATG 
ATCGTCGAAC TGAACGTGCC GGCCTCGATC GTCGGCGTGA TGGTCTCCAT TCCGCTGATC 
TTTGCGCCGT TCCGGGCGCT GATCGGCTTC AAATCCGACG TCCACAAATC CGTGCTCGGC 
TGGCGGCGCG TGCCTTTCCT TTACAAGGGC ACCCTGGTTC AGTTCGGCGG CCTGGCGATT 
CTGCCGTTCG CGCTGCTGGT GTTGTCCGGC GGCGGCGAGG CTGGACATGC GCCGGTGTGG 
ATCGGGCAAT TCGGCGCCGC GCTGGCCTTC CTGCTGATCG GCGCCGGCGT TCACACCACG 
CAGACGGTCG GGCTCGCGCT CGCGACCGAC CTCGCGTCTC CGGAATCCAG GCCGAAAGTC 
GTCGGCCTGA TGTACACCAT GCTGATGTTC GGCATGATCG CGAGCGCGAT CATCTTCGGC 
ATGCTGCTTG CTGACTTCTC GCCCGGCCGG TTGATCCAGG TGATCCAGGG CTCGGCCGTG 
GTCACGATCG TTCTCAACGG CATCGCGGTC TGGAAGCAGG AAGCGCGTCG CAGCTCGGGC 
GCGACCCAGG CGACCGCGCA TCCGGGGGCG CCGGCGGCCA GCTTCCGCGA ATCCTGGGAT 
GTTTTCATCC AGGGTAAGGA TGCGACGCGC CGTCTGATCG CGGTCGGTTT CGGCACCATG 
GCGTTCAGCA TGGCGGACGT GTTGCTCGAG CCCTATGGCG GCCAGATCCT GTCGATGTCG 
GTCGGCGACA CCACCAAGCT CACCGCCGCG CTCGCGATCG GCGGCCTGCT CGGCTTCGGT 
CTCGCCTCGC GCGTGCTGAG CCGCGGCGCC GATCCGTTCC GGATGGCGAG CTTCGGCTCG 
ATGGTCGGCA TTCCGGCCTT CCTTGCGGTG ATCTTCGCCG CCGAACTGCA GGGGACCGCA 
TCGGTGCTGG CATTCGGTTG CGGCACCGCG CTGATCGGCT TCGGCGCCGG CCTGTTCGGC 
CACGGCACGC TGACCGCGAC GATGAACGCC GCGCCGAAGG ATCAGGCCGG CCTCGCGCTC 
GGCGCCTGGG GTGCGGTGCA GGCTTCTGCA GCCGGCGTCG CGATCGCGCT CGGCGGTATT 
CTTCGTGACC TCGTGACGGC CTTCGCACCG CAGTTCGGCC CCGCGGCTGG CTACAATTTC 
GTCTATTGCC TCGAACTGCT GCTGCTGTTC GCGACGCTCG TGACGATGGT CCCGCTGATC 
AGGCGACGGG ACACTCTACT GATGCAGGGC CACCTGACGC GGTCCTGA

Protein sequence

MNTVSQKMMR VWASLGSRFL PFADAATPDL PLSRLLRLSL FQVAVGMSLV LLVGTLNRVM 
IVELNVPASI VGVMVSIPLI FAPFRALIGF KSDVHKSVLG WRRVPFLYKG TLVQFGGLAI 
LPFALLVLSG GGEAGHAPVW IGQFGAALAF LLIGAGVHTT QTVGLALATD LASPESRPKV 
VGLMYTMLMF GMIASAIIFG MLLADFSPGR LIQVIQGSAV VTIVLNGIAV WKQEARRSSG 
ATQATAHPGA PAASFRESWD VFIQGKDATR RLIAVGFGTM AFSMADVLLE PYGGQILSMS 
VGDTTKLTAA LAIGGLLGFG LASRVLSRGA DPFRMASFGS MVGIPAFLAV IFAAELQGTA 
SVLAFGCGTA LIGFGAGLFG HGTLTATMNA APKDQAGLAL GAWGAVQASA AGVAIALGGI 
LRDLVTAFAP QFGPAAGYNF VYCLELLLLF ATLVTMVPLI RRRDTLLMQG HLTRS