Gene Rpal_1154 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rpal_1154
Symbol
ID	6408810
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris TIE-1
Kingdom	Bacteria
Replicon accession	NC_011004
Strand	+
Start bp	1224638
End bp	1225750
Gene Length	1113 bp
Protein Length	370 aa
Translation table	11
GC content	63%
IMG OID	642711052
Product	hydrogenase (NiFe) small subunit HydA
Protein accession	YP_001990169
Protein GI	192289564
COG category	[C] Energy production and conversion
COG ID	[COG1740] Ni,Fe-hydrogenase I small subunit
TIGRFAM ID	[TIGR00391] hydrogenase (NiFe) small subunit (hydA) [TIGR01409] Tat (twin-arginine translocation) pathway signal sequence

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGGTGCAG TGACGGAAAC CTTTTACGAG GTGATCAGGC GGCAGGGGAT CACGCGGCGC 
AGCTTCGTGA AATTCTGCAG TCTCACGGCC ACCAGTCTCG GCCTCGGGCC GATCGGTGCC 
ACCCAGATCG CGCATGCGCT GGAGACCAAG CCGCGCGTGC CGGTGATCTG GATGCACGGG 
CTGGAATGCA CCTGCTGCTC GGAAAGCTTC ATCCGCTCGG CGCATCCTCT GGTGAAGGAT 
GCGGTGCTGT CGATGATCTC GCTCGATTAT GACGACACCA TCATGGCGGC GGCGGGTCAT 
CAGGCCGACG CGATCCTCGA AGAGACTCGC AAGAAGTATA AAGGCCAGTA CGTGCTGGCG 
GTGGAGGGCA ATCCGCCGCT GAACGAAGAC GGCATGTTCT GCATCGACGG CGGCCGCCCG 
TTCGTCGAGA AACTGAAGGA AATGGCCGAA GACTCGATGG CGGTGATCGC CTGGGGGAGC 
TGCGCCTCCT GGGGCTGCGT ACAGGCCGCC AAGCCCAACC CGACCAATGC CACCCCGATC 
GACAAGGTGA TCCGCAACAA GCCGGTGATC AAGGTGCCGG GCTGTCCGCC GATCGCCGAA 
GTCATGACCG GCGTTGTCTC CTACATCATC ACCTTTGGAC GGTTGCCCGA GCTTGACCGC 
CAGGGCCGGC CGAAGATGTT CTACTCGCAG CGCATCCACG ACAAATGCTA TCGCCGGCCG 
CATTTCGACG CCGGTCAGTT CGTCGAGGAA TGGGACGACG ACGGCGCGCG CAAAGGCTAC 
TGCCTCTACA AGATGGGCTG CAAGGGCCCG ACTACCTACA ACGCCTGTTC GACGGTGCGC 
TGGAACGGCG GCGTGTCGTT CCCGATCCAG TCCGGCCATG GTTGCATCGG CTGCTCGGAA 
GACGCGTTCT GGGACAAGGG CTCGTTCTAC GACCGGCTCA CCACCATCAA TCAGTTCGGT 
ATCGAGGCCA ACGCCGACAA GATCGGCGCC ACGGTCGCCG GCGTCGTCGG CACGGCGATC 
GCCGCGCACG CCGCGGTGAC CACCGTGCGC AATCTGTCGC GCCGCAAGGA AGTCCCGAAC 
GGCAACGGCA CCTCCAACGG CAAGTCGGCT TAA

Protein sequence

MGAVTETFYE VIRRQGITRR SFVKFCSLTA TSLGLGPIGA TQIAHALETK PRVPVIWMHG 
LECTCCSESF IRSAHPLVKD AVLSMISLDY DDTIMAAAGH QADAILEETR KKYKGQYVLA 
VEGNPPLNED GMFCIDGGRP FVEKLKEMAE DSMAVIAWGS CASWGCVQAA KPNPTNATPI 
DKVIRNKPVI KVPGCPPIAE VMTGVVSYII TFGRLPELDR QGRPKMFYSQ RIHDKCYRRP 
HFDAGQFVEE WDDDGARKGY CLYKMGCKGP TTYNACSTVR WNGGVSFPIQ SGHGCIGCSE 
DAFWDKGSFY DRLTTINQFG IEANADKIGA TVAGVVGTAI AAHAAVTTVR NLSRRKEVPN 
GNGTSNGKSA