Gene RPC_3763 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPC_3763
Symbol
ID	3969356
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB18
Kingdom	Bacteria
Replicon accession	NC_007925
Strand	-
Start bp	4185856
End bp	4186977
Gene Length	1122 bp
Protein Length	373 aa
Translation table	11
GC content	71%
IMG OID	637926873
Product	putative hydrogenase expression/formation protein HupK
Protein accession	YP_533617
Protein GI	90425247
COG category	[C] Energy production and conversion
COG ID	[COG0374] Ni,Fe-hydrogenase I large subunit
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCGGCG CGGCGGCAGC GGACGGCATC GAAGTGACGC TGCAGCTCGC CGCCGGCCGT 
GTCGCCGAGG TTGCGATCAC CACGCGGCCG CCATCCGGCA TCGACCGCTA CGCCAAGGGC 
CGGCCCGCCG ACGAGGTCGC CAAGGCGCTG CCGCGGATAT TTGGGCTCTG CGCCATGGCG 
CAGGGCGCCG CAGTGATTGC TGCGACCGCC GCCGCGCGCG GCACCGCACT TGCTCCCGAT 
CAGTTGGCAG CGTGCGCGAG TGCGGTCGCC GCCGAACGCG TGCTGGAATT GCTGCGCGGC 
ACGGTGACGA TGCTGGCAGG ACCCGATCTC GGCGGCACCG CACCGGCGTT GCGCGCGCTC 
GGTGCTGCCG CACACAGCTT CGACGCCGCG GCGCTGCCCG ATCGCGCGGC GAGTGACGCC 
GCGATCGACG CGATCGAGCA GAACCTCGTG GCGCTCGGCC TTTCCGCGCA TTGCTTCGAT 
GGCGCCGACA AATGTCAACG CTGGGCTGCA TCCGATGCGC CGCTGCCGCG GCTATTGCAG 
CCGTTGCTCG CCGGCGATGC CAGTTCCGGC GCCCTCGTGC TCGATGCACT GAGCGCCGCC 
GACGATGCGG TGATCGCAGA CAGACTGGGG CAGGGCGGCG CCGCGTTTGC CGCCCGTCCG 
CATCTCGACG GCCGGGTGCC GGAGACCGGC GCGTTGGCGC GGACCCGCTC GCATCCGCTA 
TTGTCCTGCC GCGACGCCAC GCTTGCCGCG CGCCTGTTGG CGCGGTTGAT CGAAGCGCGG 
CAGACCCCCG CATTGCTCCG CGGCCTCGCC GCCGGCGTCG CCGATCCCGC CGAACTGATC 
GCCGCCATGC CGCTGGCGCC CGGCATCGGC TTTGCCGCGG TGGAATGCGC CCGCGGCCGG 
TTGCATCATT GGATCGCGCT TAGCGCCGAT GGCCGCATCG CCAGGCTGGA AATTCTGGCG 
CCGACCGAAT GGAATTTTCA TCCCCAAGGG CCGCTCGCCC GTGCGCTGCA CGGCGCTGCG 
GCCCGCACCG ACGCCGAACG CCGCAGCATC GAACAATTGA TAGCGGCGTT CGATCCCTGC 
GTTGGCCTGG CGGTGCATTA TGCGGAGTTG ACCGATGCAT GA

Protein sequence

MTGAAAADGI EVTLQLAAGR VAEVAITTRP PSGIDRYAKG RPADEVAKAL PRIFGLCAMA 
QGAAVIAATA AARGTALAPD QLAACASAVA AERVLELLRG TVTMLAGPDL GGTAPALRAL 
GAAAHSFDAA ALPDRAASDA AIDAIEQNLV ALGLSAHCFD GADKCQRWAA SDAPLPRLLQ 
PLLAGDASSG ALVLDALSAA DDAVIADRLG QGGAAFAARP HLDGRVPETG ALARTRSHPL 
LSCRDATLAA RLLARLIEAR QTPALLRGLA AGVADPAELI AAMPLAPGIG FAAVECARGR 
LHHWIALSAD GRIARLEILA PTEWNFHPQG PLARALHGAA ARTDAERRSI EQLIAAFDPC 
VGLAVHYAEL TDA