Gene Rpal_4256 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rpal_4256
Symbol
ID	6411940
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris TIE-1
Kingdom	Bacteria
Replicon accession	NC_011004
Strand	+
Start bp	4575860
End bp	4577020
Gene Length	1161 bp
Protein Length	386 aa
Translation table	11
GC content	64%
IMG OID	642714138
Product	hopanoid biosynthesis associated radical SAM protein HpnH
Protein accession	YP_001993227
Protein GI	192292622
COG category	[R] General function prediction only
COG ID	[COG0535] Predicted Fe-S oxidoreductases
TIGRFAM ID	[TIGR03470] hopanoid biosynthesis associated radical SAM protein HpnH

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	0.59824
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCTATTC CGTTTCACAA GGAACTGGTG ATCGGCGGTT ATCTGCTGAA GCAGAAGCTG 
CTCGGGCGGA AGCGTTATCC GCTGGTACTG ATGCTGGAGC CGCTGTTCCG CTGTAACCTC 
GCCTGCGCCG GCTGCGGCAA GATCGACTAT CCCGACGCGA TCCTGAACCG CCGGATGACC 
GCACAAGAGT GCTGGGACGC CGCCGAGGAA TGCGGCGCGC CGATGGTTGC GATCCCGGGC 
GGCGAACCGC TGATCCACAA GGAGATCGGC GAGATCGTGC GCGGCCTGGT GGCGCGCAAG 
AAGTTCGTGT CGCTGTGCAC CAACGCGCTG CTGCTCGAGA AGAAGCTGCA TCTGTTCGAG 
CCGTCGCCCT ACCTGTTCTT CTCGGTGCAT CTCGACGGCC TGAAGGAGCA CCACGACAAG 
GCGGTGTCGC AGCAGGGCGT GTTCGACCGC GCAGTCGCGG CGATCAAGGC CGCCAAGGCC 
AAGGGCTTCA CCGTCAACGT CAACTGCACG GTGTTCGACG GCTACGCCGC CGAAGACATC 
GCCAAGTTCA TGGACTTCAC CGAGGAACTC GGCGTCGGCG TCTCGATCTC GCCGGGCTAC 
GCCTATGAGC GCGCTCCGGA CCAGGAGCAC TTCCTCAACC GCACCAAGAC CAAGAACCTG 
TTCCGCGAGG TGTTCGCGCG CGGCAAGGGC AAGAAGTGGA GCTTCATGCA CTCCAGCATG 
TTCCTCGACT TCCTGGCCGG CAATCAGGAG TTCGAGTGCA CGCCGTGGGG TATGCCGGCG 
CGCAACATTT TCGGCTGGCA GAAGCCCTGC TACCTGCTCG GCGAAGGCTA CGCCAAGACT 
TTCCAGGAGC TGATGGAAAC CACCGATTGG GATTCCTACG GCACCGGCAA GTACGAGAAG 
TGCGCCGACT GCATGGCGCA TTGCGGCTAC GAACCGACCG CGGCGATGGC CTCTCTCAAC 
AATCCGCTGA AGGCCGCCTG GGTGGCGCTC CGCGGCATCA AGACCTCGGG CCCGATGGCG 
CCGGAGATCG ACATGTCGAA GCAGCGCCCG GCGCAGTACG TGTTCTCCGA GCAGGTCCAG 
AAGACGCTGA CGCAGATCCG CCAGGACGAG GCCGCCGAGG CCAAGGACAA GCGGCAGGCG 
GAAAGGTCGA CGGCGGCCTG A

Protein sequence

MAIPFHKELV IGGYLLKQKL LGRKRYPLVL MLEPLFRCNL ACAGCGKIDY PDAILNRRMT 
AQECWDAAEE CGAPMVAIPG GEPLIHKEIG EIVRGLVARK KFVSLCTNAL LLEKKLHLFE 
PSPYLFFSVH LDGLKEHHDK AVSQQGVFDR AVAAIKAAKA KGFTVNVNCT VFDGYAAEDI 
AKFMDFTEEL GVGVSISPGY AYERAPDQEH FLNRTKTKNL FREVFARGKG KKWSFMHSSM 
FLDFLAGNQE FECTPWGMPA RNIFGWQKPC YLLGEGYAKT FQELMETTDW DSYGTGKYEK 
CADCMAHCGY EPTAAMASLN NPLKAAWVAL RGIKTSGPMA PEIDMSKQRP AQYVFSEQVQ 
KTLTQIRQDE AAEAKDKRQA ERSTAA