Gene YpsIP31758_4118 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	YpsIP31758_4118
Symbol
ID	5384597
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Yersinia pseudotuberculosis IP 31758
Kingdom	Bacteria
Replicon accession	NC_009708
Strand	-
Start bp	4646611
End bp	4647582
Gene Length	972 bp
Protein Length	323 aa
Translation table	11
GC content	54%
IMG OID	640867147
Product	putative aerobic formate dehydrogenase, iron-sulfur subunit
Protein accession	YP_001403061
Protein GI	153948809
COG category	[C] Energy production and conversion
COG ID	[COG0437] Fe-S-cluster-containing hydrogenase components 1
TIGRFAM ID	[TIGR01582] formate dehydrogenase, beta subunit, Fe-S containing

Plasmid Coverage information

Num covering plasmid clones	54
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCACTGC AAACTCAAGA CATTATCCGG CGCTCCGGTA CTAATTCCCT TACGCCGCCA 
CCTCAGGTCC GTGATCATCA GGAGCCGGTG GCTAAACTTA TCGATGTCAC CACCTGTATC 
GGCTGTAAAG CCTGTCAGGT GGCGTGTTCA GAGTGGAACG ATATCCGCGA TGAAGTCGGT 
CATAACGTCG GGGTGTATGA CAACCCCGCC GATTTGACCG CTAAGTCGTG GACAGTGATG 
CGTTTCTCTG AAGTTGAAGA TGAAGAGAGC GGCAAGCTGG AGTGGCTGAT CCGCAAGGAT 
GGCTGTATGC ATTGCGCCGA TCCGGGCTGC CTGAAGGCAT GTCCATCGGA AGGGGCGATC 
ATTCAGTACG CCAACGGTAT CGTTGATTTC CAATCAGAAC ATTGTATTGG TTGTGGCTAC 
TGCATCGCAG GTTGTCCGTT CGATGTCCCG CGCATGAATA AAGATGACAA TCGGGTGTAT 
AAATGCACCT TGTGTGTCGA TCGTGTCGGT GTTGGTCAGG AACCTGCTTG TGTGAAAACC 
TGCCCGACTG GAGCGATTCA CTTTGGTACC AAAGAGTCGA TGAAAGAAGT GGCGGCTGGC 
CGGGTTGCTG AGCTAAAAAC CCGTGGGTTT GATAACGCAG GGTTATATGA CCCTGCGGGC 
GTCGGCGGTA CCCATGTGAT GTATGTACTG CATCATGCGG ATAAACCCCA GCTTTATCAT 
GGCCTGCCGG AGAATCCGAC CATCAGTCCG ACGGTGACTT TCTGGAAAGG CATCTGGAAA 
CCGTTGGCTG CGGTAGGTTT CGCGGCGACC TTCGCTGCCA GTATCTTCCA TTACGTTGGC 
GTAGGCCCGA ACCGGGTGGA GGAAGAGGAA GAAGACGATG AGACAACGGA TCCTACCCCT 
TCCGAGACGG TAGCAAAGGC ACCAGAGCAG ACAACCTCTG AGCGCTCAGA CGAAGGGGAA 
ACGCGGAAAT GA

Protein sequence

MSLQTQDIIR RSGTNSLTPP PQVRDHQEPV AKLIDVTTCI GCKACQVACS EWNDIRDEVG 
HNVGVYDNPA DLTAKSWTVM RFSEVEDEES GKLEWLIRKD GCMHCADPGC LKACPSEGAI 
IQYANGIVDF QSEHCIGCGY CIAGCPFDVP RMNKDDNRVY KCTLCVDRVG VGQEPACVKT 
CPTGAIHFGT KESMKEVAAG RVAELKTRGF DNAGLYDPAG VGGTHVMYVL HHADKPQLYH 
GLPENPTISP TVTFWKGIWK PLAAVGFAAT FAASIFHYVG VGPNRVEEEE EDDETTDPTP 
SETVAKAPEQ TTSERSDEGE TRK