Gene Rpal_5059 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rpal_5059
Symbol
ID	6412753
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris TIE-1
Kingdom	Bacteria
Replicon accession	NC_011004
Strand	-
Start bp	5442525
End bp	5443490
Gene Length	966 bp
Protein Length	321 aa
Translation table	11
GC content	66%
IMG OID	642714944
Product	PDZ/DHR/GLGF domain protein
Protein accession	YP_001994023
Protein GI	192293418
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0265] Trypsin-like serine proteases, typically periplasmic, contain C-terminal PDZ domain
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCCTTCGC TCCCCGAATG GAATGTCCCG GCCGCGATTC GGCCTCGCTC GGCCGATTTC 
GGCTTCGATC TCGATCGCGC GTTGTCTGCG GTGGTCGGGC TGCACGCGAT CATTCCAGCC 
GATGCCTACA CCGCCGGTAC GCTCGGCACC GAGCGCGCCG GCAACGGCGT GCTGATCGAC 
GACGGTCTGG TACTGACCAT CGGTTATCTG ATCACCGAAG CCGAAACGGT GTGGCTGCAT 
CTCGGTGACG GCCGCGTCGT TGAGGGCCAT GCGCTCGGAT TCGATCAGGA GAGCGGCTTC 
GGCCTGGTTC AAGCGCTCGG CCCAATCGAT CTGCCGCCGC TACCGCTCGG CCGCTCTGCT 
TTCGCCAAGG CGGGCGAGCG CGTCATTATC GGCGGCGTCG GTGGCCGCAC ACGGTCGGTG 
GCCGGCCGCA TCGCCACACG TCAGGAATTC GCCGGCTACT GGGAGTATCT GCTCGACGAT 
GCGATCTTCA CCGAGCCGTC GCATCCGAAC TGGGGCGGCA CCGCGCTGCT GTCGGCGACC 
GGCGAACTGA TCGGCGTCGG CTCGCTGCAG ATCGAACGCA GCGGCTCGAA CGAGCATTAC 
AATTTGAGCG TGCCGATCGA TCTGCTGCCA CCTGTGCTGA GCGATCTTCG GAAGTTCGGC 
CGGCCGAACA AGCCGCCGCG GCCGTGGCTG GGGCTGTATT CGACCGAGAT CGAAGACAAG 
GTCGTGGTGG TCGGAATTGC GCCGAAGGGC CCGGCGGCGC GCGCCGAGCT GAAGACCGGC 
GACGTGATCC TCGCAGTCGC GGGCGACAAG GTGACCAGTG AAGCGGAGTT CTATCGCAAG 
GTCTGGGCAC TGGGCACTGC AGGCGTAGAG GTGCCACTGA CGCTGTTCAG CGGCGGCGCC 
ACCTTCGACG TGGTGCTGCA TTCCTCCGAC CGCGCCAAGT TCCTCAAGGC ACCGCGGCTG 
CATTGA

Protein sequence

MPSLPEWNVP AAIRPRSADF GFDLDRALSA VVGLHAIIPA DAYTAGTLGT ERAGNGVLID 
DGLVLTIGYL ITEAETVWLH LGDGRVVEGH ALGFDQESGF GLVQALGPID LPPLPLGRSA 
FAKAGERVII GGVGGRTRSV AGRIATRQEF AGYWEYLLDD AIFTEPSHPN WGGTALLSAT 
GELIGVGSLQ IERSGSNEHY NLSVPIDLLP PVLSDLRKFG RPNKPPRPWL GLYSTEIEDK 
VVVVGIAPKG PAARAELKTG DVILAVAGDK VTSEAEFYRK VWALGTAGVE VPLTLFSGGA 
TFDVVLHSSD RAKFLKAPRL H