Gene Ssed_1900 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ssed_1900
Symbol
ID	5611131
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shewanella sediminis HAW-EB3
Kingdom	Bacteria
Replicon accession	NC_009831
Strand	-
Start bp	2284025
End bp	2285140
Gene Length	1116 bp
Protein Length	371 aa
Translation table	11
GC content	51%
IMG OID	640932786
Product	hydrogenase expression/formation protein HypD
Protein accession	YP_001473639
Protein GI	157375039
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0409] Hydrogenase maturation factor
TIGRFAM ID	[TIGR00075] hydrogenase expression/formation protein HypD

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.00044285
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGTTAGCAC TGAAATCACT TTACCAAGGG TTCAGAGACC CTAAAACCAT TGCTAAACTG 
GCGGAGATGA TCGCCATAGA AGCGGCAAAA TGTTCAGAAC CCATTAACAT CATGGAAGTG 
TGCGGTGGAC ATACTCACAC CATCATGAAA TATGGTTTGA ATCAGCTCTT GCCTGAGAAC 
ATTAAGTTCA TCCATGGGCC CGGATGCCCG GTTTGTATCA TGCCTAAAGA GCGTATCGAC 
CATGCCGCGA CACTTGCCAG TCTACCTAAT GTCATTCTCG TCACATTAGG CGACATGATC 
AGGGTGCCGG GTTCGAAAGG CAGCCTCGCC GAGTTCAGGT CGAAAGGGTG CGACATTCGT 
CCGATCTACG ATCCACTCGA TACTCTGGCT ATCGCCATCG ATAACCCGGA TAAAACCGTT 
ATCTTCTTTG CTATCGGCTT TGAAACATCT ACCCCTATGA CAGCGGTTCT TCTCGAGCAG 
GCAGAAAAGA GAAATATCGA TAACCTGCTG TTTCATATCA ACCATGTGTT AGTGCCACCG 
GCAATGGATG CGGTCATGGC GGATCCCAAG GCGACGGTTA ACGCCTTTAT CGGTCCGGCT 
CACGTCAGCG TGATAAGTGG CGCTAAGGTC TATCGTCCTG CCGTTGATAA TTACCATATG 
CCTGTTGTGG TATCGGGTTT TGAACCTGTC GACGTTATGG AGTCCATCTT AAGAATTACC 
AAGCAGAAGG CGCAAGGTGT GGCCGAGCTC GATGTGCAAT ATAGCCGAGC CGTGACCGAA 
GAGGGAAACC TTGCCGCACA GGAGAAGAAC GAGCACTTCT TCGAAATAAG AGAAGATTTC 
CGCTGGCGTG GACTCGGCCC GATCCCAAAT TCCGCCCTGA AACTCAGCTC ACAATATGCC 
CACCGGGATG CTGAACTCAT CTACGCCGAC AGGTTGCCGG TAAAAGAGAT CGACGACCAT 
AAAGCCTGTC AGTGCGGTGA TATCCTGCGC GGACTCGCTA ACCCGAAAGA TTGTAAAGTC 
TTCGGGCGAG GTTGCAGTCC TGAATCACCA CTGGGCAGTT GTATGGTCAG CTCTGAAGGT 
GCCTGTAACG CTTACTACCG CTACAACGGA GTTTAA

Protein sequence

MLALKSLYQG FRDPKTIAKL AEMIAIEAAK CSEPINIMEV CGGHTHTIMK YGLNQLLPEN 
IKFIHGPGCP VCIMPKERID HAATLASLPN VILVTLGDMI RVPGSKGSLA EFRSKGCDIR 
PIYDPLDTLA IAIDNPDKTV IFFAIGFETS TPMTAVLLEQ AEKRNIDNLL FHINHVLVPP 
AMDAVMADPK ATVNAFIGPA HVSVISGAKV YRPAVDNYHM PVVVSGFEPV DVMESILRIT 
KQKAQGVAEL DVQYSRAVTE EGNLAAQEKN EHFFEIREDF RWRGLGPIPN SALKLSSQYA 
HRDAELIYAD RLPVKEIDDH KACQCGDILR GLANPKDCKV FGRGCSPESP LGSCMVSSEG 
ACNAYYRYNG V