Gene RPC_3772 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPC_3772
Symbol
ID	3969365
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB18
Kingdom	Bacteria
Replicon accession	NC_007925
Strand	-
Start bp	4192927
End bp	4194051
Gene Length	1125 bp
Protein Length	374 aa
Translation table	11
GC content	65%
IMG OID	637926882
Product	hydrogenase (NiFe) small subunit (hydA)
Protein accession	YP_533626
Protein GI	90425256
COG category	[C] Energy production and conversion
COG ID	[COG1740] Ni,Fe-hydrogenase I small subunit
TIGRFAM ID	[TIGR00391] hydrogenase (NiFe) small subunit (hydA) [TIGR01409] Tat (twin-arginine translocation) pathway signal sequence

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.427783
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGCGCAG GGACAGAAAC ATTCTATGAG GTGATCCGCC GCCAAGGCAT CACCCGGCGC 
AGCTTCGTCA AATTCTGCAG CCTGACCGCG ACCAGCCTCG GGCTCGGCCC GATCGGCGCC 
ACCGAGATCG CGCAGGCGCT GGAGACCAAG CCGCGGGTGC CGGTGATCTG GATGCACGGG 
CTGGAATGCA CCTGCTGCTC GGAAAGCTTC ATCCGCTCGG CGCATCCTTT GGTCAAAGAC 
GCCGTGCTGT CGATGATCTC GCTGGATTAC GACGACACCA TCATGGCGGC GGCCGGCCAT 
CAGGCCGAAG CGATCCTGCA GGAGACCCGC GAGAAATACA AAGGCCAGTA CATCCTCGCG 
GTGGAAGGCA ATCCGCCGCT CAACGAAGAC GGCATGTTCT GCATCGACGG CGGCCGCCCG 
TTCGTCGAGA AGCTGAAGGA GATGGCCGAA GATTCCATGG CGGTGATCGC CTGGGGCGCC 
TGCGCCTCCT GGGGCTGCGT GCAGGCGGCG AAGCCCAATC CGACCCAGGC CACCCCGATC 
GACAAGGTGA TCCGCAACAA GCCGATCATC AAGGTGCCGG GCTGTCCGCC GATCGCCGAG 
GTGATGACCG GCGTCGTCAC CTACATCACC ACTTTCGGCC GGCTGCCCGA GCTCGACCGC 
CAGGGCCGGC CGAAAATGTT CTACTCGCAG CGCATCCACG ACAAATGCTA TCGCCGGCCG 
CATTTCGACG CCGGCCAGTT CGTCGAAGAG TGGGACGACG ACGCCGCGCG AAAAGGCTAC 
TGCCTGTACA AGATGGGCTG CAAGGGCCCG ACCACCTACA GCGCCTGTTC GACGGTGCGC 
TGGAACGGCG GCGTCTCGTT CCCGATCCAA TCCGGCCACG GCTGCATCGG CTGCACCGAA 
GATAATTTCT GGGACAACGG CTCGTTCTAC GACCGGCTGA CCACCATCAA GCAGTTCGGC 
GTCGAGGCCA ACGCCGACAA GATCGGCGCC ACCGTAGCCG GCGTGGTCGG CACCGCGATC 
GCCGCGCACG CCGCGGTCAC CACGGTGCGC AGCATGGCGA AACGTCGCAA GGAGAACGGC 
GGCAACGGCA ACGGCAATAA ACCCAACGAC ACATCGGCCG GCTGA

Protein sequence

MGAGTETFYE VIRRQGITRR SFVKFCSLTA TSLGLGPIGA TEIAQALETK PRVPVIWMHG 
LECTCCSESF IRSAHPLVKD AVLSMISLDY DDTIMAAAGH QAEAILQETR EKYKGQYILA 
VEGNPPLNED GMFCIDGGRP FVEKLKEMAE DSMAVIAWGA CASWGCVQAA KPNPTQATPI 
DKVIRNKPII KVPGCPPIAE VMTGVVTYIT TFGRLPELDR QGRPKMFYSQ RIHDKCYRRP 
HFDAGQFVEE WDDDAARKGY CLYKMGCKGP TTYSACSTVR WNGGVSFPIQ SGHGCIGCTE 
DNFWDNGSFY DRLTTIKQFG VEANADKIGA TVAGVVGTAI AAHAAVTTVR SMAKRRKENG 
GNGNGNKPND TSAG