Gene RPC_4501 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPC_4501
Symbol
ID	3972416
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB18
Kingdom	Bacteria
Replicon accession	NC_007925
Strand	-
Start bp	5012528
End bp	5013613
Gene Length	1086 bp
Protein Length	361 aa
Translation table	11
GC content	64%
IMG OID	637927612
Product	NADH dehydrogenase (ubiquinone)
Protein accession	YP_534343
Protein GI	90425973
COG category	[C] Energy production and conversion
COG ID	[COG3261] Ni,Fe-hydrogenase III large subunit
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.0565202
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAATCCT TCAACATGCC GGTCGGCCCG CTGCACGTCT CGCTCGAAGA GCCGATGTAT 
TTCCGCATCG ACGTCGAGGG CGAGAAGGTC GCGGGGCTTG AAATCACCGC AGGCCACGTG 
CATCGCGGTA TCGAATATCT CACCGCCAAG CGCAACATCT ACCAGAACCT GGCGCTGATC 
GAGCGGGTCT GCTCGCTGTG CTCGAACAGC CATCCGGAAG CCTATTGCAT GGCGCTGGAG 
ACCATCGCCG GCATCGAGGT GCCGGAGCGC GCGCAGTATC TGCGGGTGTT CGCCGACGAG 
ATCAAGCGCG TCGCCTCGCA CATGTTCAAC GTCGCGATCC TGGCGCATGT CGTCGGCTTC 
GAATCGCTGT TCATGCACGT CATGGAAGCC CGCGAGATCA TGCAGGACAC CAAGGAGACC 
GTGTTCGGCA ACCGCATGGA TCTTGCCGCC AACATCATCG GCGGGGTGAA ATACGATATC 
GACGCCACGC AGTCGGCCTA CATCATCAGC CAGCTCGACC GGCTGGAGCC GCTGCTGTTG 
AACGAGATCA TTCCGGTCTA CGAGACCAAT GCCACGATCC AGTCGCGCAC CCGCGGCATC 
GGCCGGATCA GCCGCGAGCA CTGCATCGAA TACGGCCTGA TGGGCCCGGT GGCGCGCGGC 
GCCGGGCACG GCTATGACGT ACGCACCGCG GCGCCCTACG CGGTCTATGA CCGGATGGAC 
GTCGAAGTGA TCACCTATCC GGACGGCGAC GTCTGGTCGC GCGCCATGGT GCGGCTGAAG 
GAGGTGGCGG CCTCGATCCG GCTGCTGCGG CAGTGCCTGC GCGATCTGCC GGATGGTGCG 
ACCGACGCCG GCCCGCTGCC GTTCATTCCG GCCGGCGAGG CGGTGACCAA GGTCGAGGCG 
CCGCGCGGCG AACTCGTCTA CTACGTCAAC ACCGACGGCA CCGACATTCC GGCGCGGGTG 
AAATGGCGGG TGCCGAGCTA CATGAACTGG GACGTGCTGC ATCTGATGAT GGTCGGCGAG 
GGGATCTCCG ACATTCCGTT GATCGTCAAC AGCATCGATC CCTGCATTTC ATGCACCGAG 
CGTTGA

Protein sequence

MKSFNMPVGP LHVSLEEPMY FRIDVEGEKV AGLEITAGHV HRGIEYLTAK RNIYQNLALI 
ERVCSLCSNS HPEAYCMALE TIAGIEVPER AQYLRVFADE IKRVASHMFN VAILAHVVGF 
ESLFMHVMEA REIMQDTKET VFGNRMDLAA NIIGGVKYDI DATQSAYIIS QLDRLEPLLL 
NEIIPVYETN ATIQSRTRGI GRISREHCIE YGLMGPVARG AGHGYDVRTA APYAVYDRMD 
VEVITYPDGD VWSRAMVRLK EVAASIRLLR QCLRDLPDGA TDAGPLPFIP AGEAVTKVEA 
PRGELVYYVN TDGTDIPARV KWRVPSYMNW DVLHLMMVGE GISDIPLIVN SIDPCISCTE 
R