Gene RPB_4238 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPB_4238
Symbol
ID	3912046
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris HaA2
Kingdom	Bacteria
Replicon accession	NC_007778
Strand	-
Start bp	4814010
End bp	4815203
Gene Length	1194 bp
Protein Length	397 aa
Translation table	11
GC content	69%
IMG OID	637886141
Product	PepSY-associated TM helix
Protein accession	YP_487840
Protein GI	86751344
COG category	[S] Function unknown
COG ID	[COG3182] Uncharacterized iron-regulated membrane protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.593429
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGCAAGGT CGTCCGCGAT CAAACCGGCG CTGCTGCAAC TGCATTCGAT CGCCGGCCTG 
ATCCTGTCGC TGTTCCTCGC CGTGATCGCG CTGAGCGGCG CGGTGCTGAG TTTCGAGGAC 
GAGATCCAGG CCGCGCTGAA TGCCGATCGC ACAACGGTCG AGCTCCGCGC GACGCCGCGG 
CTGCAGCCCG ACGAATTGAT CGCCCGGCTG CAGGCCGCCA CCGGCGCCGG CAAGATCGCC 
TCGCTCACGC TGGCGCGCGA TCCGGCGGCG GCGGTTCACA TCCGCTTCGC GCGCAATGAC 
GACGCCTCGC GGCCGTCGTC GCTCTATGTC GATCCCTATG ACGCCCGCGT GCTCGGCCAT 
CCGGTCGGCG AGGGCTTCTT CGCCACGGTG CGCAAGCTGC ATCGCTGGCT GCTGCTGCCG 
GGCGATGCCA AGGGTTGGGG CCGGCCGATC GGCGGCATCG TCGCAATGGG CCTGATCGCG 
ATGCTGATCA CCGGGCTGGT GCTGCGCTGG CCGCATCGCG CCGGCAGCGT GAAGGTCTGG 
CTGAAGCCGA ATTGGCGGCT GCGCGGCCGC GGCCTGCACC GCTCGTTGCA CGCGGTGATC 
GGCACTTGGG CGATGCTGAT CTATCTGGTG ATGGTGCTGA CCGGATTGTG GTGGTCGTTC 
GACTGGTACA GAGACGGCGC AATCTGGCTT TTGTCCAGCG CGCCCCCGCG CGCCGAACCG 
ATGCAGCCAG CGCCGAAGCG CATGGCCGCC GCATCCGACA AGTCCGACAG CAAGCGCGAG 
GCTGCATCGG CGCTGCCGCT CGATCGTGTG TGGTCGGCCT TCCTGCAGCA GCAGGGCGAG 
CGCTTCGTCA CCGCGCGCCT GACGCCGCCG GCCGGCGGCG GCACGCTGGT GCGCGTCCGA 
TCCTGGAGCG CCGCCGCCGA CGGCGTCCGC GACGAATTCC GCATCGATGC CGCGAGCGGC 
AAGATCGTCT CCGCCGACCT CTACGCCGCC AAGCCGCTCG GCGACCGCAT CCTCGCCCGC 
GTGCTCGACA TCCACCGCGG CGCGATCCTC GGCTGGCCGG GCAAGCTGCT GTTCATGCTC 
GCCGCGCTTG CAATGCCGCT GTTCGTGATC ACCGGATTGC TGCTGTATCT GTCACGCCGA 
CGCCACAACC GCCTCACGCG CGCGCCGGTC GGAGAACTGG CGGCAGGAAA ATAG

Protein sequence

MARSSAIKPA LLQLHSIAGL ILSLFLAVIA LSGAVLSFED EIQAALNADR TTVELRATPR 
LQPDELIARL QAATGAGKIA SLTLARDPAA AVHIRFARND DASRPSSLYV DPYDARVLGH 
PVGEGFFATV RKLHRWLLLP GDAKGWGRPI GGIVAMGLIA MLITGLVLRW PHRAGSVKVW 
LKPNWRLRGR GLHRSLHAVI GTWAMLIYLV MVLTGLWWSF DWYRDGAIWL LSSAPPRAEP 
MQPAPKRMAA ASDKSDSKRE AASALPLDRV WSAFLQQQGE RFVTARLTPP AGGGTLVRVR 
SWSAAADGVR DEFRIDAASG KIVSADLYAA KPLGDRILAR VLDIHRGAIL GWPGKLLFML 
AALAMPLFVI TGLLLYLSRR RHNRLTRAPV GELAAGK