Gene Rpal_2052 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rpal_2052
Symbol
ID	6409712
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris TIE-1
Kingdom	Bacteria
Replicon accession	NC_011004
Strand	+
Start bp	2223995
End bp	2225617
Gene Length	1623 bp
Protein Length	540 aa
Translation table	11
GC content	65%
IMG OID	642711938
Product	PepSY-associated TM helix domain protein
Protein accession	YP_001991050
Protein GI	192290445
COG category	[S] Function unknown
COG ID	[COG3182] Uncharacterized iron-regulated membrane protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGACCAAGC ACGATCGACA ATCCGCGAGC CGCAGCATCC GGCAGAGCAT GTCGGACCTT 
CACACCTGGA CCGGGCTGCT GCTCGGCTGG GTGCTGTATG CGATGTTCCT CACCGGCACG 
GTGTCGTTCT TCAAGGAGGA GCTGTCGCAG TGGATGCGGC CGGAACTGCC GCGCGTGACG 
CAGGCGCTGG ACCCGGCCGT GGTGGCGGAG CGCGTCGCCG ATGAGATCGG CCGGATCGCG 
CCCAACGCGA CGCAGTGGAG CATCAAGCTC CCCGAGGGGC GCAGCAACAG CGTCTATGCG 
TTCTGGCGGC TTCCGATCGC GCAGGATGCG CGCGGCTTCG GAGAAGGGCA CTTCGACGCG 
GTGACTGGCC GTCAGGTCGA GGCTCGGGGA ACACTGGGCG GCGATTTCTT CTACCGCTTC 
CATTTCCAGT TCTACTACAT GTCGCCGTTC TGGGGGCGGC TGCTTGCCGG TCTGGCGGCG 
ATGTTCATGC TGATCGCCAT CGTCGCCGGC GTCATCACCC ACAAGAAGAT CTTCACCGAC 
TTCTTCACCT TCCGCTGGGG CAAGGGGCAG CGCTCCTGGC TCGACGCCCA CAACGCGCTG 
TCGGTGTTCG GCCTGCCATT TCATGTGATG ATCACCTACA CCGGGCTGGT GACGCTAATG 
GCGCTGTACG TGCCATGGGG CGAGCGCGCC GCCATCAAGA CGCCCGCCGA GCGCCAGCAG 
CTGATGGCGG AGCTCAGTGC TTTCATTCAG CCCGGCAAGC CCGCGGCCGA AGCGGCGCCG 
CTCGGGTCGA TCGAAACCAT GGTGCGGCAG GCTCAGGTTC GATGGGGTAC GCCCGATGTC 
GGGCGCGTCA ACGCGGCCAA TCCGGGCAAC GCGGCTGCCC GTATAGCGGT GACCCGTGGC 
GATGCCGGGC GTGTATCAAT GAGTCCGGAT TACCTGGAGT TCGACGGCGT CACCGGAAAA 
CTGCTCACCG TGCATGATCA TGTCGGTGCT GCGGCCGAAA CCCGCGGCGT GCTCTACGCG 
CTGCACATCG GGCGGTTCAG CGACCTCGAA ACCCGGTGGC TTTACTTCAT CGTCAGCTTC 
ATGGGCACCG CGATGGTCGG TACCGGTCTG GTGATGTGGA CAGTGAAGCG ACGGCAGAAG 
CTGCCTGATC CAGAGCGGCC GTATTTCGGA TTCCGTCTGG TCGAGCGGCT CAACATTGCC 
AGCATCGCCG GGCTGTCGAT CGCCATGACG GCGTTCCTGT GGGCCAACCG TCTGTTGCCG 
ACCGCGATGG CGGAGCGGGC GTTCTGGGAA ATCCATGTGT TCTTCATCGT CTGGGGGCTG 
ACCTTGCTCC ACGCACTGCT GCGGCCGGCG CGAGTGGCCT GGGTCGAGCA GCTATGGACG 
GCCGCTGCGT TGTTAGCGTT GATCCCGGTG CTCAACGCGA TGACGACGCT GCGTCCGCTG 
TGGCACAGCT TCGCTATCGG GGATTGGGTG TTCGTCGGCA CGGATCTGAT GTGCTGGACG 
CTGGCGCTGC TGCATGCCGT GCTGGCGATC CGCACCGCGC GTCACGGCGC GCGGGTTCGC 
CCGCCGCGCG GCTCGGCGAC ACGCCACGCG CTCCCAACGA TGTCGAGCGA GGCGGCAACA 
TGA

Protein sequence

MTKHDRQSAS RSIRQSMSDL HTWTGLLLGW VLYAMFLTGT VSFFKEELSQ WMRPELPRVT 
QALDPAVVAE RVADEIGRIA PNATQWSIKL PEGRSNSVYA FWRLPIAQDA RGFGEGHFDA 
VTGRQVEARG TLGGDFFYRF HFQFYYMSPF WGRLLAGLAA MFMLIAIVAG VITHKKIFTD 
FFTFRWGKGQ RSWLDAHNAL SVFGLPFHVM ITYTGLVTLM ALYVPWGERA AIKTPAERQQ 
LMAELSAFIQ PGKPAAEAAP LGSIETMVRQ AQVRWGTPDV GRVNAANPGN AAARIAVTRG 
DAGRVSMSPD YLEFDGVTGK LLTVHDHVGA AAETRGVLYA LHIGRFSDLE TRWLYFIVSF 
MGTAMVGTGL VMWTVKRRQK LPDPERPYFG FRLVERLNIA SIAGLSIAMT AFLWANRLLP 
TAMAERAFWE IHVFFIVWGL TLLHALLRPA RVAWVEQLWT AAALLALIPV LNAMTTLRPL 
WHSFAIGDWV FVGTDLMCWT LALLHAVLAI RTARHGARVR PPRGSATRHA LPTMSSEAAT