Gene Sterm_3801 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sterm_3801
Symbol
ID	8599247
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sebaldella termitidis ATCC 33386
Kingdom	Bacteria
Replicon accession	NC_013517
Strand	-
Start bp	4038390
End bp	4039727
Gene Length	1338 bp
Protein Length	445 aa
Translation table	11
GC content	37%
IMG OID
Product	RNA modification enzyme, MiaB family
Protein accession	YP_003310566
Protein GI	269122389
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	0.920944
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

TTGAAAGGAT GGTTTAAAAA TTTGGAAAAG AAAGCAACAA TAATTACTTA CGGCTGTCAG 
ATGAATGTGA ATGAAAGCGC TAAGATGAAA AAAATGCTGC AGTCCATCGG GTATAAGATT 
GTTGATGATA TAAAAATTTC TGATCTTGTT CTTCTGAATA CATGTACTGT ACGAGAAGGA 
GCAGCGGTAA AAGTCTACGG AAAATTAGGA GAACTGAAGA AATTAAAAGA AAAAAGAAAC 
AACATGATAA TAGGTGTAAC TGGGTGTCTT GCCCAGGAGG TCAGAGAAGA ATTTATTAAA 
AGAACTCCTT TTGTAGATCT GGTAATAGGA AATCAGAATA TTGCCAAGCT TCCTGACATC 
ATAGAAAAAA TTCAAAAAGG AACAGTAGAT CATATAGTAA TGGTAGAAGA TGAAGATGAG 
CTTCCAAAAA GGGTAGATGC TGATTTCGGA GATGATATAG TAGCATCTGT TTCAATAACT 
TACGGCTGTA ATAATTACTG CACATTCTGT ATAGTGCCTT ACGTACGGGG AATGGAGAGA 
TCGGTTCCAA TGAGGGAAAT ACTTGATGAT GTAAAGCAGT ATGCAGATAA AGGTTACAAA 
GAAATATTAT TTTTAGGACA AAATGTTAAT TCTTACGGAA GTGACAGAAT CGAAATGGGA 
GAAGATTTTG CCGGGCTTCT TACAAAGGCT GCCAATATAG AAGGAGACTT CTGGCTGAAA 
TATATTTCGC CGCATCCGAA AGATTTTACT GATTCGGTAA TAAAAGCAAT AGCAGAAAAT 
CCCAAGGTAG CAAGAATGCT TCATCTGCCT CTGCAGTCAG GCTCTACTAA GATACTCGGG 
GCAATGAACC GAGGATATAC AAAGGAAGAA TTTATAGAAC TTGCTCTTAA AATAAAAAAA 
GAGATTCCTG ATATAGGTAT AACAACAGAT ATTATCGTAG GATTTCCGGG AGAGACTGAC 
GAGGATTTTC AGGATACTCT GGATGTAGTG GAGCAGGTAG GTTTTGAAAA CGCATTCATG 
TTTATGTATT CCAAAAGAAG CGGAACTCCT GCAGCAGTGC TGGAAGAACA GGTGCCTGAA 
CAGGTAAAGA AAGAAAGACT TCAGCAGCTG ATGAGACTTC AGAATGCAAG AGCAAAAGAA 
GAGAGCAAAA AATATTATGG TCAGACTTTG AAGGTTCTTG TAGAGGGACC GAGCAGCAAA 
AATCCTGATA TGCTTACAGG AAGAACCTCT ACTCATAAAA TAGTGCTTTT TAAAGGTGAT 
GAAGAGCTTT CGGGGAAATT TGTAAATGTA AAAATATATG AAACAAAAAC ATGGACATTA 
TATGGTGAAT TAGTCTAG

Protein sequence

MKGWFKNLEK KATIITYGCQ MNVNESAKMK KMLQSIGYKI VDDIKISDLV LLNTCTVREG 
AAVKVYGKLG ELKKLKEKRN NMIIGVTGCL AQEVREEFIK RTPFVDLVIG NQNIAKLPDI 
IEKIQKGTVD HIVMVEDEDE LPKRVDADFG DDIVASVSIT YGCNNYCTFC IVPYVRGMER 
SVPMREILDD VKQYADKGYK EILFLGQNVN SYGSDRIEMG EDFAGLLTKA ANIEGDFWLK 
YISPHPKDFT DSVIKAIAEN PKVARMLHLP LQSGSTKILG AMNRGYTKEE FIELALKIKK 
EIPDIGITTD IIVGFPGETD EDFQDTLDVV EQVGFENAFM FMYSKRSGTP AAVLEEQVPE 
QVKKERLQQL MRLQNARAKE ESKKYYGQTL KVLVEGPSSK NPDMLTGRTS THKIVLFKGD 
EELSGKFVNV KIYETKTWTL YGELV