Gene Rpal_1930 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rpal_1930
Symbol
ID	6409590
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris TIE-1
Kingdom	Bacteria
Replicon accession	NC_011004
Strand	-
Start bp	2081465
End bp	2082688
Gene Length	1224 bp
Protein Length	407 aa
Translation table	11
GC content	66%
IMG OID	642711816
Product	OsmC family protein
Protein accession	YP_001990928
Protein GI	192290323
COG category	[E] Amino acid transport and metabolism [O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG1506] Dipeptidyl aminopeptidases/acylaminoacyl-peptidases [COG1765] Predicted redox protein, regulator of disulfide bond formation
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.0101124
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCCCACCG AACGTTTCCA ATTTGCAGGC AGCGGCGGGC ATCAACTCGC GGCGGCGCTC 
GATCTGCCGG ATGCGCAGCC TCTCGCCTAT GCGCTGTTCG CGCATTGCTT CACCTGCAGC 
AAGGACAACC TTGCGGCACG GCGGATCGCG GCGGCGCTGG CGGCGTGCGG CATCGCGGTG 
CTGCGGTTCG ACTTCACCGG GCTTGGCGCC AGCGAGGGCG AGTTCGAAAA CGCGACGTTT 
TCGTCCAACG TCGCCGATCT GGTGCTGGCG GCGGACCATC TGCGCGCGAC GCATCGGGCG 
CCGTCACTGC TGATCGGCCA CAGTCTCGGC GGCGCTGCGG TGCTGGCAGC CGCAGCACAG 
ATTCCCGAAG CGAAGGCGAT CGCCACCATT GCGGCGCCGT CCGATCCGTC GCACGTCACC 
GGACTATTTG CCGATGATAT CGAGACGATC CGCACTGAAG GCCGCGTCAA TGTTTCGCTG 
GCCGGCCGCC CGTTTACGAT CAAGCGCGAG TTTCTCGACG ACATCGCCGA ACACAATCTG 
ATGGCCGAGA TCGGCAAGCT GCACAAAGCG CTGCTGATCC TGCACGCGCC GACCGACGAC 
ACCGTCGGCA TCGACAACGC CACCAAGATC TTTCTCGCGG CCAAACATCC GAAGAGCTTC 
GTCTCGCTCG ATCACGCCGA CCATCTGCTG AGCGATCGCC GTGACGCGAA CTACGCCGCG 
GGGGTGATCG CCGCCTGGGC GCAGCGCTAC ATCGATGCCG AACCGCCGGC CCCGACCGCC 
GGCGCGCCAG AAGTGCCGCG CCTCGTCACC GTGCAGGAAA CCGGCGACGG CAAGTTCCAG 
CAGCAGATCA GCGTCGGACC GCATCGGCTG CTCGCCGATG AGCCGGCCAA CGTCGGCGGC 
CGCGACAGCG GCCCGGGGCC CTACGACCTA CTGCTGTCCG CGCTCGGCGC CTGCACCTCG 
ATGACGATGC GGCTCTATGC CGAACGCAAG GCGCTGCCGC TCGATCGCGT CACGGTGACG 
CTGAGCCACG CCAAGATCCA CGCCGAGGAT TGCGCCGAAT GCGAAACCAA GGTCGGGCTA 
CTCGACCGGA TCGAGCGGGT GATCGGCATC GAGGGTGACC TCTCCGCCGA GCAGCGCGCC 
AAGCTGATCG AAATCGCCGA CAAATGTCCG GTGCACCGCA CCCTCACCTC GGAAGTCAGC 
ATCATCACGC GCAGCACCGA TTGA

Protein sequence

MPTERFQFAG SGGHQLAAAL DLPDAQPLAY ALFAHCFTCS KDNLAARRIA AALAACGIAV 
LRFDFTGLGA SEGEFENATF SSNVADLVLA ADHLRATHRA PSLLIGHSLG GAAVLAAAAQ 
IPEAKAIATI AAPSDPSHVT GLFADDIETI RTEGRVNVSL AGRPFTIKRE FLDDIAEHNL 
MAEIGKLHKA LLILHAPTDD TVGIDNATKI FLAAKHPKSF VSLDHADHLL SDRRDANYAA 
GVIAAWAQRY IDAEPPAPTA GAPEVPRLVT VQETGDGKFQ QQISVGPHRL LADEPANVGG 
RDSGPGPYDL LLSALGACTS MTMRLYAERK ALPLDRVTVT LSHAKIHAED CAECETKVGL 
LDRIERVIGI EGDLSAEQRA KLIEIADKCP VHRTLTSEVS IITRSTD