Gene Rfer_4089 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rfer_4089
Symbol
ID	3961787
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodoferax ferrireducens T118
Kingdom	Bacteria
Replicon accession	NC_007908
Strand	+
Start bp	4563772
End bp	4564767
Gene Length	996 bp
Protein Length	331 aa
Translation table	11
GC content	59%
IMG OID	637918913
Product	hydrogenase 2 protein HybA
Protein accession	YP_525318
Protein GI	89902847
COG category	[C] Energy production and conversion
COG ID	[COG0437] Fe-S-cluster-containing hydrogenase components 1
TIGRFAM ID	[TIGR01409] Tat (twin-arginine translocation) pathway signal sequence

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.224971
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGACACTC GTCGTCACTT CTTGAAAGGG GTTGTTGCGG GTGGCGCAGC GATCACCTCA 
GCCGCAGTTG CGCCACCAGC TTGCGCGCGC GAGACCCATA GTCGCCCGGC CGAGGCGCTG 
GGCCTGTTGT ATGACGCGAC GCTGTGCATC GGCTGCAAGG CCTGCGTGGC CGCCTGCAAA 
GAGGCCAATA ACAATCCGCC GGAGTTCTCG ACCGAAGATC GTCTCTGGGA CACGCCACTG 
GACACGTCGG GCTACACCTT CAACATCATC AAGATGTACC GCAACGGCAC GATGCAGACC 
AAAGATGCCG AGGTGAATGG CTTTGCCTTC ATGAAGACAT CGTGCATGCA TTGCGCCGAC 
CCCTCCTGCG TGTCTGCTTG TCCGGTGTCG GCCATGACGA AAGACCCGGC AACCGGCATT 
GTGGCCTACG ACCCCGGCGC CTGTGTCGGC TGCCGTTATT GTGTGGTGGC TTGCCCGTTT 
GGTATTCCCA AATACCAATA CGACTCGCCC ACCGGCAAGA TTGGCAAATG TGAGTTGTGT 
CGTCATCGCT ACGCTGACGG TCACTACTCC GCCTGCGCCG AAGTATGCCC AACCGGTGCC 
ACGCTCTATG GCCGCAGTGC CGATCTGCTG CTTGAAGCCA AACGACGTAT TGCACTCAAG 
CCCGGCAGCG TCACACGTTA CCCGAGAGGC AAGATTGGCG GCCCGGATCA GAGCTATGAA 
GGTCCGGTCG GCAACTATCT CCAGCACGTG TATGGCGAGA AAGAATTCGG CGGCACGCAG 
GTGCTCAAAC TCTCCGCGGT AACTTTTGCC AAGGTCGGCA TGCCCGACTT GCCACCCAAG 
TCGTCGGCGG CCACGTCGGA GACCCTCCAG CATTCACTTT ACGGTGGATT GGTGATGCCG 
GTGGTCGTGT TGGGCGCATT GAGCTTCATT GCCAAACGCA ACGTACATGA CGAGGACGAT 
GAGTCAGGCA CTGACAAAGA CAAAGGGGAG AAGTGA

Protein sequence

MDTRRHFLKG VVAGGAAITS AAVAPPACAR ETHSRPAEAL GLLYDATLCI GCKACVAACK 
EANNNPPEFS TEDRLWDTPL DTSGYTFNII KMYRNGTMQT KDAEVNGFAF MKTSCMHCAD 
PSCVSACPVS AMTKDPATGI VAYDPGACVG CRYCVVACPF GIPKYQYDSP TGKIGKCELC 
RHRYADGHYS ACAEVCPTGA TLYGRSADLL LEAKRRIALK PGSVTRYPRG KIGGPDQSYE 
GPVGNYLQHV YGEKEFGGTQ VLKLSAVTFA KVGMPDLPPK SSAATSETLQ HSLYGGLVMP 
VVVLGALSFI AKRNVHDEDD ESGTDKDKGE K