Gene SO_3920 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SO_3920
Symbol	hydA
ID	1171559
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shewanella oneidensis MR-1
Kingdom	Bacteria
Replicon accession	NC_004347
Strand	+
Start bp	4067806
End bp	4069038
Gene Length	1233 bp
Protein Length	410 aa
Translation table	11
GC content	49%
IMG OID	637345680
Product	periplasmic Fe hydrogenase, large subunit
Protein accession	NP_719451
Protein GI	24375408
COG category	[R] General function prediction only
COG ID	[COG4624] Iron only hydrogenase large subunit, C-terminal domain
TIGRFAM ID	[TIGR02512] hydrogenases, Fe-only

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACAACGA CAACTTATCA ACCAGGAGAA ATCCAAGGGC TGATCAAGAT TAATGCATCC 
AAATGCAAAG GATGTGATGC CTGTAAACAA TTCTGCCCAA CCCATGCCAT TAATGGCGCT 
TCGGGTGCAG TACACTCTAT CGATGAAGAT AAATGCTTAA GCTGCGGACA GTGTTTAATT 
AACTGTCCAT TTAGCGCTAT TGAGGAAACC CACAGCGCAC TTGAAACCGT GATTAAAAAG 
CTCGCTGATA AAAATACCAC CGTGGTCGGG ATTATCGCGC CTGCGGTACG GGTGGCGATT 
GGTGAAGAAT TTGGCTTAGG TACAGGTGAG CTAGTAACAG GCAAACTCTA CGGTGCCATG 
AATCAAGCTG GCTTTAAAAT TTTCGACTGT AACTTCGCCG CCGATTTGAC CATTATGGAA 
GAAGGCAGTG AGTTTATTCA TCGCCTGCAC GCCAATGTAA AAGGTGAAGC TAACGCAGGC 
CCATTGCCGC AATTTACCTC CTGCTGCCCA GGCTGGGTAC GCTACCTCGA AACCCGCTAC 
CCTGCACTTT TACCTAACCT ATCGACCGCC AAATCACCTC AGCAAATGGC AGGGACTGTC 
GCCAAAACCT ACGGCGCCAA GGTATATCAA ATGCAGCCAG AGAATATTTT CACTGTCTCT 
GTAATGCCTT GCACCTCGAA AAAGCTCGAA GCCTCCCGTC CCGAATTTAA CTCGGCTTGG 
CAATATCATC AGGAACACGG CGCAAACTCG CCCTCCTACC AAGATATTGA TGCCGTGCTC 
ACCACAAGGG AAATGGCTCA GTTACTCAAA CTGCTCGATA TCGATCTCGC GAATACCGCG 
GAATATCAAG GCGATAGTTT GTTCTCTGAA TACACTGGCG CGGGCACAAT TTTTGGAACA 
ACCGGCGGGG TGATGGAAGC GGCGCTGCGT ACCGCCCATA AAGTACTGAC TGGAACTGAA 
ATGGCTAAGC TGGAATTTGA ACCCGTACGC GGGCTAAAAG GCGTGAAATC AGCCTCTGTC 
AGCCTGTTTG ATACAGAGCT TAACCAAGAT GTGACCGTCA ATGTCGCCGT AGTGCACGAC 
ATGGGCAACA ACATTGAGCC CGTACTGCGC GATGTGATGG CTGGCACCTC TCCTTATCAC 
TTTATTGAGG TGATGAACTG CGCTGGCGGT TGCGTCAACG GCGGAGGCCA ACCTATTGAA 
GGTAAAGGCT CTTCATGGCT GGGTAACATT TAA

Protein sequence

MTTTTYQPGE IQGLIKINAS KCKGCDACKQ FCPTHAINGA SGAVHSIDED KCLSCGQCLI 
NCPFSAIEET HSALETVIKK LADKNTTVVG IIAPAVRVAI GEEFGLGTGE LVTGKLYGAM 
NQAGFKIFDC NFAADLTIME EGSEFIHRLH ANVKGEANAG PLPQFTSCCP GWVRYLETRY 
PALLPNLSTA KSPQQMAGTV AKTYGAKVYQ MQPENIFTVS VMPCTSKKLE ASRPEFNSAW 
QYHQEHGANS PSYQDIDAVL TTREMAQLLK LLDIDLANTA EYQGDSLFSE YTGAGTIFGT 
TGGVMEAALR TAHKVLTGTE MAKLEFEPVR GLKGVKSASV SLFDTELNQD VTVNVAVVHD 
MGNNIEPVLR DVMAGTSPYH FIEVMNCAGG CVNGGGQPIE GKGSSWLGNI