Gene Rru_A1161 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rru_A1161
Symbol
ID	3834671
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodospirillum rubrum ATCC 11170
Kingdom	Bacteria
Replicon accession	NC_007643
Strand	+
Start bp	1378441
End bp	1379526
Gene Length	1086 bp
Protein Length	361 aa
Translation table	11
GC content	65%
IMG OID	637825250
Product	Ni-Fe hydrogenase, small subunit
Protein accession	YP_426249
Protein GI	83592497
COG category	[C] Energy production and conversion
COG ID	[COG1740] Ni,Fe-hydrogenase I small subunit
TIGRFAM ID	[TIGR00391] hydrogenase (NiFe) small subunit (hydA) [TIGR01409] Tat (twin-arginine translocation) pathway signal sequence

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGGGGAAA CCGAGACCTT TTACGAGGTC ATCCGTCGCC AGGGGATTTC CCGGCGCGGC 
TTCTTGAAGT TCTGCGGTGT CACCGCCGCC GGGCTGGGCC TGGGCGCCGG CGGCGCGGCG 
CGCATCGCCC AGGCGCTGGA AACCAAGCCA CGGGTGCCGG TGATCTGGCT GCATGGCCTG 
GAATGCACCT GTTGTTCGGA AAGCTTCATC CGCTCGGCCC ATCCGCTGGT CAGCGACGTG 
GTGCTGTCGA TGCTGTCGCT CGATTACGAC GACACGCTGA TGGCCGCCGC CGGTCATCAG 
GCCGAGGCGA TCCTGGCCGA GACCCGCGAG ACCTATCGCG GGCGCTATAT CCTGGCGGTC 
GAGGGCAACG CGCCGCTGGC CAATGACGGC TTTTTCTGTA TGCCCGGCGG TCGGCCCTTC 
GTTGATACCC TGAAGGAAAT GGCCGCCGAC AGCGCCGCCG TCATCGCCTG GGGATCGTGC 
GCCAGTTGGG GCTGCGTTCA GGCGGCCAAG CCCAATCCCA CCGGGGCGGT GCCGATTGAT 
CAGGTGATCA CCGGCAAGCC GCTGATCAAG GTGCCGGGCT GTCCGCCGAT CGCCGAGGTG 
ATGACCGGGG TGATCAGCTA CCTGCTGACC TTCGACCGCT TCCCCGAGCT TGATCTGCAG 
GGGCGGCCGA AAATGTTCTA TTCCCAACGC ATCCACGACA AATGTTACCG CCGCGGCCAT 
TTCGATGCCG GCCAGTTCGT CGAGGCCTTC GACGATGACG CCGCCCGCCG CGGTCACTGT 
CTGTACAAGA TGGGCTGCAA GGGGCCCACG ACCTACAACG CCTGTTCGAC CACCGGCTGG 
AACGAGGGCA CCTCGTTTCC CATCCAATCG GGCCATGGCT GCCTGGGCTG TTCAGAGGAT 
GGCTTTTGGG ACAAGGGGCC GTTCTACGAG CGGTTGTCGA CCATCAATCA GTTCGGGATT 
GAAGCCAATG CCGACATCGT AGGCGGAACG GCCGCCGGGG TGGTGGCGGC CGGGGTGGCG 
GCCCATGCCG GCGTCACCGT GGCCCGGCGC CTGATGTCGA AGAACGAAAA CAAAGACAAA 
GAGTAG

Protein sequence

MGETETFYEV IRRQGISRRG FLKFCGVTAA GLGLGAGGAA RIAQALETKP RVPVIWLHGL 
ECTCCSESFI RSAHPLVSDV VLSMLSLDYD DTLMAAAGHQ AEAILAETRE TYRGRYILAV 
EGNAPLANDG FFCMPGGRPF VDTLKEMAAD SAAVIAWGSC ASWGCVQAAK PNPTGAVPID 
QVITGKPLIK VPGCPPIAEV MTGVISYLLT FDRFPELDLQ GRPKMFYSQR IHDKCYRRGH 
FDAGQFVEAF DDDAARRGHC LYKMGCKGPT TYNACSTTGW NEGTSFPIQS GHGCLGCSED 
GFWDKGPFYE RLSTINQFGI EANADIVGGT AAGVVAAGVA AHAGVTVARR LMSKNENKDK 
E