Gene Sterm_3601 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sterm_3601
Symbol
ID	8599047
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sebaldella termitidis ATCC 33386
Kingdom	Bacteria
Replicon accession	NC_013517
Strand	+
Start bp	3822332
End bp	3824095
Gene Length	1764 bp
Protein Length	587 aa
Translation table	11
GC content	41%
IMG OID
Product	hydrogenase, Fe-only
Protein accession	YP_003310366
Protein GI	269122189
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	31
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAACATA ATTTAATCAC CCTTACTATA GATCATAAAA CTGTGGAAGT ACCTGAAGGC 
ACTACCATAC TTGCTGCAGC TAAAAGTGTC GGCATTAGTA TTCCTACTCT CTGTTACCTG 
AATCTTTCAG ACTTCGGCTG TGTAAATACC CCGTCTTCTT GCAGAATGTG TCTTGTAGAA 
GTAGAAGGCA GAAGAAATCT TGCTCCTGCA TGCGTTACTC CTGCTTCTGA TAAAATGACA 
GTCAGTACTA ACTCTGTAAG AGCACTGAAA ACCAGAAAAA CAATGCTGGA ATTACTTCTT 
TCAGATCACC CGAAAGACTG CCTGACCTGT CAGAAATCAG GAAACTGTGA ATTGCAGAGC 
CTTGCTGATA AATTTTCTAT AAGAGATATA AAGCTGAAAG GAGAACAGTC TGCTTACAGA 
CTGGATATCT CAAAATCCCT TATCCGTGAT ATGGATAAAT GTATTATGTG CCGCCGCTGT 
GAAACAATGT GCAATGAAGT ACAGACTGTA GGAGTATTAT CTGCTATAAA CAGAGGGTTT 
GAATCTGTTA TTGCCACTGC TATGGAAATA AATCTGAGTG ACTCTGTATG CACATATTGC 
GGACAGTGTG CTGCCGTCTG TCCCACAGGA GCCTTGGTAG AGAATGATGC TACATGGGAT 
GTTGTCAAAG CTTTGGGAGA CCCGGAAAAA ACAGTCATTG TCCAGACTGC TCCTTCGGTA 
AGGGCAGCAC TCGGAGAAGA ATTCGGGCTG GAGCCGGGAA CACTTGTTAC GGGTAAAATG 
GTGGCAGCAT TGCGCGGTCT TGGTTTTGAC AAGGTATTTG ATACAGATTT TGGTGCTGAT 
CTTACTATAA TGGAAGAAGC TTCCGAATTT TTAGACAGAT TAACACGGCA TCTTGACGGT 
GACACCAGTG TAAAACTTCC TATACTTACT TCTTGCTGTC CTGCATGGGT AAACTTTTTT 
GAGCATAATT TCAGCGACCT TCTGGATGTT CCTTCCACTT CAAAATCTCC TATGCAGATG 
TTCAGTGCCG TAGTAAAAAA TGTTTACGCT CAGGAGCTGG GTGTAGACAG AAAAAACCTT 
GTGGTTGTTT CTGTTATGCC TTGTCTTGCA AAAAAATACG AAGCAAGCCG TGATGAATTT 
TCAATAGGAA ATGACTATGA TACTGATATC GTTCTTTCTA CAAGGGAACT TGCAAAATTA 
ATAAAACAAT ATAATATAGA ATTTAATCTG CTGAAAGATG AAGAGTTTGA TAATCCTCTC 
GGAGAATCAA CAGGTGCAAG TATTATTTTC GGAAGAACAG GGGGAGTTAT TGAAGCAGCG 
CTCAGAACAG CTGCTGACTG GTATACCAAA GAAGATCTGC AGGACATTGA TTATACTCAG 
GTCAGAGGAT TTGAAGGAGT TCGAAGTGCT GATGTAAAAA TCGGCGATCT GGAGCTGAAA 
ATCGGAATTG CTCATGGTCT GGGAGAAGCA CGCAAGCTGC TTGAGGAAGT AAGAGCCGGA 
AAATCTGCAT ACCATGCTAT AGAAATAATG GCCTGTAAAG GCGGATGTAT CGGCGGCGGC 
GGACAGCCTT ACCATCACGG GAATACTGCT ATACTAAAGA AGCGAACCGA GGCGCTCAAA 
ACTGAAGACG AATCTAAAAA AATCAGAAAA TCCCATGAGA ATCCTTATAT TATAAAACTA 
TATAAAGAGT ATTTCGGAGA GCCTTTAAGC CACAGATCCC ACGAATTACT GCATACAAAA 
TATTTCAAAA AGCATAAAAT ATAA

Protein sequence

MKHNLITLTI DHKTVEVPEG TTILAAAKSV GISIPTLCYL NLSDFGCVNT PSSCRMCLVE 
VEGRRNLAPA CVTPASDKMT VSTNSVRALK TRKTMLELLL SDHPKDCLTC QKSGNCELQS 
LADKFSIRDI KLKGEQSAYR LDISKSLIRD MDKCIMCRRC ETMCNEVQTV GVLSAINRGF 
ESVIATAMEI NLSDSVCTYC GQCAAVCPTG ALVENDATWD VVKALGDPEK TVIVQTAPSV 
RAALGEEFGL EPGTLVTGKM VAALRGLGFD KVFDTDFGAD LTIMEEASEF LDRLTRHLDG 
DTSVKLPILT SCCPAWVNFF EHNFSDLLDV PSTSKSPMQM FSAVVKNVYA QELGVDRKNL 
VVVSVMPCLA KKYEASRDEF SIGNDYDTDI VLSTRELAKL IKQYNIEFNL LKDEEFDNPL 
GESTGASIIF GRTGGVIEAA LRTAADWYTK EDLQDIDYTQ VRGFEGVRSA DVKIGDLELK 
IGIAHGLGEA RKLLEEVRAG KSAYHAIEIM ACKGGCIGGG GQPYHHGNTA ILKKRTEALK 
TEDESKKIRK SHENPYIIKL YKEYFGEPLS HRSHELLHTK YFKKHKI