Gene RPD_2398 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPD_2398
Symbol
ID	4022887
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB5
Kingdom	Bacteria
Replicon accession	NC_007958
Strand	-
Start bp	2671319
End bp	2672746
Gene Length	1428 bp
Protein Length	475 aa
Translation table	11
GC content	67%
IMG OID	637962589
Product	PUCC protein
Protein accession	YP_569529
Protein GI	91976870
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.6432
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.14907
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAACACAG TCAGTCAGAA AGTGATGAAG GCCTGGGCCT CGCTCGGGTC TCGCTTTCTG 
CCTTTCGCGG ATGCGGCGAC GCCGGATCTG CCTCTGTCCC GGTTGCTGCG CCTGTCGCTG 
TTTCAAGTGG CGGTCGGCAT GTCGCTGGTG CTGCTGGTCG GCACCCTGAA CCGGGTGATG 
ATCGTCGAAC TGAACGTGCC GGCCTCGATC GTCGGCGTGA TGGTCTCCAT TCCGCTGATC 
TTTGCGCCGT TCCGGGCGCT GATCGGCTTC AAATCCGACG TCCACAAATC CGTGCTCGGC 
TGGCGGCGCG TGCCTTTCCT TTACAAGGGC ACCCTGGTTC AGTTCGGCGG CTTGGCGATC 
CTGCCGTTCG CGCTGCTGGT GTTGTCCGGC GGCGGCGAGG CCGGACATGC GCCGGTGTGG 
ATCGGGCAAT TCGGCGCCGC GCTGGCCTTC CTGCTGATCG GCGCCGGCGT TCACACCACG 
CAGACGGTCG GGCTCGCGCT CGCGACCGAC CTCGCGTCTC CGGAATCCAG GCCGAAAGTC 
GTCGGCCTGA TGTACACCAT GCTGATGTTC GGCATGATCG CGAGCGCGAT CATCTTCGGC 
ATGCTGCTTG CTGACTTCTC GCCCGGCCGG TTGATCCAGG TGATCCAGGG CTCGGCCGTG 
GTCACGATCG TTCTCAACGG CATCGCGGTC TGGAAGCAGG AAGCGCGTCG CAGCTCGGGC 
GCGACCCAGG CGACCGCGCA TCCGGGGGCG CCGGCGGCCA GCTTCCGCGA ATCCTGGGAT 
GTTTTCATCC AGGGTAAGGA TGCGACGCGC CGTCTGATCG CGGTCGGTTT CGGCACCATG 
GCGTTCAGCA TGGCGGACGT GTTGCTCGAG CCCTATGGCG GCCAGATCCT GTCGATGTCG 
GTCGGCGACA CCACCAAGCT CACCGCCGCG CTCGCGATCG GCGGCCTGCT CGGCTTTGGT 
CTCGCCTCGC GCGTGCTGAG CCGCGGCGCC GATCCGTTCC GGATGGCGAG CTTCGGCTCG 
ATGGTCGGCA TTCCGGCCTT CCTTGCGGTG ATCTTCGCCG CCGAACTGCA GGGGGTCGCG 
TCGGTGCTGA CATTCGGTTG CGGCACCGCG CTGATCGGCT TCGGCGCCGG CCTGTTCGGC 
CACGGCACGC TGACCGCGAC GATGAACGCC GCGCCGAAGG ATCAGGCCGG CCTCGCGCTC 
GGCGCCTGGG GTGCGGTGCA GGCTTCTGCA GCCGGCGTCG CGATCGCGCT CGGCGGTATT 
CTTCGTGACC TCGTGACGGC CTTCGCACCG CAGTTCGGCC CCGCGGCTGG CTACAATTTC 
GTCTACTGCC TCGAACTGCT GCTGCTGTTC GCGACGCTCG TGACGATGGT CCCGCTGATC 
AGGCGACGGG ACACTCTACT GATACAGGGC CACCTGACGC GGTCCTGA

Protein sequence

MNTVSQKVMK AWASLGSRFL PFADAATPDL PLSRLLRLSL FQVAVGMSLV LLVGTLNRVM 
IVELNVPASI VGVMVSIPLI FAPFRALIGF KSDVHKSVLG WRRVPFLYKG TLVQFGGLAI 
LPFALLVLSG GGEAGHAPVW IGQFGAALAF LLIGAGVHTT QTVGLALATD LASPESRPKV 
VGLMYTMLMF GMIASAIIFG MLLADFSPGR LIQVIQGSAV VTIVLNGIAV WKQEARRSSG 
ATQATAHPGA PAASFRESWD VFIQGKDATR RLIAVGFGTM AFSMADVLLE PYGGQILSMS 
VGDTTKLTAA LAIGGLLGFG LASRVLSRGA DPFRMASFGS MVGIPAFLAV IFAAELQGVA 
SVLTFGCGTA LIGFGAGLFG HGTLTATMNA APKDQAGLAL GAWGAVQASA AGVAIALGGI 
LRDLVTAFAP QFGPAAGYNF VYCLELLLLF ATLVTMVPLI RRRDTLLIQG HLTRS