Gene RPD_4319 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPD_4319
Symbol
ID	4024843
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB5
Kingdom	Bacteria
Replicon accession	NC_007958
Strand	+
Start bp	4785713
End bp	4786816
Gene Length	1104 bp
Protein Length	367 aa
Translation table	11
GC content	68%
IMG OID	637964528
Product	Sel1
Protein accession	YP_571437
Protein GI	91978778
COG category	[R] General function prediction only
COG ID	[COG0790] FOG: TPR repeat, SEL1 subfamily
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.754604
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.455844
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAGGCGC TGCGCCCGAC CTCGATCCTA GCGGCGGCGC TGATGCTGCT CGCCACCAGC 
GCATCCGCGC AATTGTCTCT GACGCCGCCG CCGCCCAATC CTTTTCCGAA GCCGATCGAG 
CCGGAAAAGC CGAAGCCCAA ACCGAAATCC GACCCGAAGC CGCCCGCGGC CGAGAAGGAC 
AAGGCCAAAA AGCCTGCGGC CGACAAGGCC GGCGCGGCGA AGCCCGGCGG CGCGCCGACC 
GCCGAGGACG CCGCCAATCT CGACGATCCC AATGTCGACC TGGTGTATGG CGCGTATCAG 
CGCGGCTTCT ACAAGACCGC GTTCGAGATC GCGATCAAGC GCGCGCAGGA GCAGAACGAT 
CCCAAGGCGA TGACCATGCT GGGCGAGCTC TACGCCAATG CGCTGGGGGT CAAGCGCGAC 
TACAGCAAGG CCGTGGAATG GTACAGGCGG GCGGCCGATC TCGGCGATCG CGAGGCGATG 
TTCTCGCTGG CGATGGCGCG AATGGCCGGG CGCGGCGGCG CCGCCAGCCG CGAAGAAGCC 
GCCAAATGGC TGGCGTCCTC GGCCAAGCTC GGCGAACCGA AGGCGGCGTA TAATCTGGCG 
CTGCTGTATC TCGACGGCCA GACCTTCCCG CAGGATATCA AGCGCGCCGC AGAATTGCTG 
CGGGTGGCGG CCGACGCCGG AAATTCCGAG GCGCAATATG CGCTGGCGAC CTTCTACAAG 
GAGGGCACCG GCGTCGAGAA GAACCTCGAC CAGGCGGTGC GGCTGCTGCA ATCGGCGGCG 
CTCGCCGGCA ATGTCCCGGC CCAGGTCGAA TACGCGATCG CGCTCTACAA CGGCACCGGT 
ACGGTGAAGA ACGAGCCCGC CGCGGTGGCG ATGCTGCGCA AGGCTGCGCG CGCCAACAAC 
CCGATCGCGC AGAACCGGCT GGCGCATGTG CTGCTCAACG GCCAGGGCGC GCCGCGCGAT 
CCGGTCGAGG CGATCAAATG GCACCTGGTC GCCAAGACCG CCGGCAAGGG CGACCTGATG 
CTCGACGAGG CGCAGGCGCA GCTCAGCGCC GAGGACCGCG CCAAGGCCCA GGACGCCGCG 
CGCAAATGGG TCGGCAGCAA GTGA

Protein sequence

MKALRPTSIL AAALMLLATS ASAQLSLTPP PPNPFPKPIE PEKPKPKPKS DPKPPAAEKD 
KAKKPAADKA GAAKPGGAPT AEDAANLDDP NVDLVYGAYQ RGFYKTAFEI AIKRAQEQND 
PKAMTMLGEL YANALGVKRD YSKAVEWYRR AADLGDREAM FSLAMARMAG RGGAASREEA 
AKWLASSAKL GEPKAAYNLA LLYLDGQTFP QDIKRAAELL RVAADAGNSE AQYALATFYK 
EGTGVEKNLD QAVRLLQSAA LAGNVPAQVE YAIALYNGTG TVKNEPAAVA MLRKAARANN 
PIAQNRLAHV LLNGQGAPRD PVEAIKWHLV AKTAGKGDLM LDEAQAQLSA EDRAKAQDAA 
RKWVGSK