Gene Rsph17029_2147 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rsph17029_2147
Symbol
ID	4896867
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodobacter sphaeroides ATCC 17029
Kingdom	Bacteria
Replicon accession	NC_009049
Strand	+
Start bp	2277591
End bp	2279381
Gene Length	1791 bp
Protein Length	596 aa
Translation table	11
GC content	65%
IMG OID	640112741
Product	nickel-dependent hydrogenase, large subunit
Protein accession	YP_001044022
Protein GI	126462908
COG category	[C] Energy production and conversion
COG ID	[COG0374] Ni,Fe-hydrogenase I large subunit
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.0605986
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.266797
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGTCGCGA CACCGAACGG TTTCAACCTG GACAACACCG GCCGCCGCAT CGTGGTGGAC 
CCGGTGACCC GGATCGAGGG TCACATGCGC TGCGAAGTGA ACGTGGACGA CCAGGGCATC 
ATCCGTAATG CCGTCTCGAC GGGAACCATG TGGCGCGGCC TCGAGGTCAT CCTCAAGGGC 
CGCGACCCGC GCGACGCCTG GGCCTTCACC GAGCGGATCT GCGGGGTCTG CACCGGCACC 
CATGCACTCA CCTCCGTCCG CGCGGTCGAG GATGCGCTGG GGATCTCGAT CCCCGACAAT 
GCGAACTCGA TCCGCAACAT GATGCAGCTG AACCTGCAGA TCCACGACCA CATCGTCCAT 
TTCTACCATC TGCACGCGCT GGACTGGGTG AACCCGGTCA ATGCGCTGCG CGCCGATCCC 
AAGGCCACGT CCGAGCTGCA GCAGAAGGTC TCGCCTTCGC ACCCGCTCTC GTCGCCGGGC 
TATTTCCGCG ACGTGCAGAA CCGGCTGAAG AAATTCGTGG AATCGGGGCA GCTCGGCCTG 
TTCAAGAACG GCTACTGGGA CAATCCGGCC TATCTGCTGC CGCCCGAGGC GGACCTGATG 
GCCACGACCC ACTATCTCGA GGCGCTCGAC CTGCAGAAGG AGATCGTGAA GGTCCACACG 
ATCTTCGGCG GCAAGAACCC GCATCCGAAC TGGCTGGTGG GGGGCGTGCC CTGCCCGATC 
AACATCGACG GCGTGGGCGC GGTCGGCGCG ATCAACATGG AGCGTCTGAA CCTCGTCTCC 
TCGATCATCG ACCAGTGCAT CCAGTTCACC AACAACGTCT ATCTGCCCGA CGTGGTGGCC 
ATCGGCGGCT TCTACCGCAA CTGGCTCTAT GGCGGCGGGC TCTCGTCGAA GTCGGTGATG 
GCCTATGGCG ACATCCCCGA GCATCCGAAC GATTTCTCGC CCGAACAGCT CCATCTGCCG 
CGGGGGGCGA TCATCAACGG CAATCTCGAG GAAGTGCATG ACGTCGATCC GCGCGACCCC 
GAGCAGGTGC AGGAATTCGT CGATCACTCC TGGTATGCCT ATGGCGAGCC GGGGCGCGGG 
CTGCACCCCT GGGACGGCGT GACCGAGCCG CGCTACGAGC TCGGCCCCAA TGCCAAGGGC 
ACGCGGACGA ACATCCTCGA GCTCGACGAG GCGGCGAAAT ATTCCTGGAT CAAGGCGCCG 
CGCTGGAAGG GTCACGCGAT GGAGGTGGGC CCGCTCGCCC GCTACATCGT GGGCTATGCC 
AAGGGCCACG AGGACATCAA GAACCAGGTC GAGGGTCTCT TGCGCACCAT GGACCTGCCG 
GTCTCGGCAC TGTTCTCGAC GCTGGGCCGC ACGGCCGCCC GCGCGCTCGA GGCGGAATAC 
TGCTGCCGCC TGCAGAAGCA CTTCTTCGAC AAGCTCATCA CCAACGTGAA GAACGGCGAC 
AGCAGCACCG CCAATGTCGA GAAGTGGGAG CCGCGCACCT GGCCGAAGGA GGCCAAGGGC 
GTCGGCATGA CCGAGGCCCC GCGCGGCGCG CTCGGCCACT GGATCCGCAT CAAGGACGGC 
CGGATCGAGA ACTATCAGTG CGTGGTGCCC ACCACCTGGA ACGGCAGCCC GCGCGACGCG 
GCCGGCAACA TCGGCGCCTT CGAGGCGAGC CTGCTCGACA CCAAGATGGA GCGCCCCGAG 
GAGCCGGTCG AGATCCTGCG CACGCTGCAC TCTTTCGACC CCTGCCTCGC CTGCTCCACC 
CATGTCCTGT CGCCGGACGG CCAGGAACTC ACCACCGTCA AGGTCCGCTG A

Protein sequence

MVATPNGFNL DNTGRRIVVD PVTRIEGHMR CEVNVDDQGI IRNAVSTGTM WRGLEVILKG 
RDPRDAWAFT ERICGVCTGT HALTSVRAVE DALGISIPDN ANSIRNMMQL NLQIHDHIVH 
FYHLHALDWV NPVNALRADP KATSELQQKV SPSHPLSSPG YFRDVQNRLK KFVESGQLGL 
FKNGYWDNPA YLLPPEADLM ATTHYLEALD LQKEIVKVHT IFGGKNPHPN WLVGGVPCPI 
NIDGVGAVGA INMERLNLVS SIIDQCIQFT NNVYLPDVVA IGGFYRNWLY GGGLSSKSVM 
AYGDIPEHPN DFSPEQLHLP RGAIINGNLE EVHDVDPRDP EQVQEFVDHS WYAYGEPGRG 
LHPWDGVTEP RYELGPNAKG TRTNILELDE AAKYSWIKAP RWKGHAMEVG PLARYIVGYA 
KGHEDIKNQV EGLLRTMDLP VSALFSTLGR TAARALEAEY CCRLQKHFFD KLITNVKNGD 
SSTANVEKWE PRTWPKEAKG VGMTEAPRGA LGHWIRIKDG RIENYQCVVP TTWNGSPRDA 
AGNIGAFEAS LLDTKMERPE EPVEILRTLH SFDPCLACST HVLSPDGQEL TTVKVR