Gene Sterm_2017 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sterm_2017
Symbol
ID	8597483
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sebaldella termitidis ATCC 33386
Kingdom	Bacteria
Replicon accession	NC_013517
Strand	+
Start bp	2147135
End bp	2148790
Gene Length	1656 bp
Protein Length	551 aa
Translation table	11
GC content	30%
IMG OID
Product	Uracil DNA glycosylase-like protein
Protein accession	YP_003308803
Protein GI	269120626
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.490669
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAGTAA TATTGGATAA AAAGTTAATA AATGAAAAAG GATTAAAGGA TTTTGATCTG 
GATCCTGTTA ATAAAGACCT TGTTGCTGTG GGGAAGAAGC TTTATTTTGT ATCGCAGGAT 
TTGGAAGGAA AAGTAATTAT TAAGGAACTC GGCGGAAAAT TGAAGAATAT AGAGGGAGTA 
AAATTTATAA AGGAAGAAAA TCAGCTCTTT GTATCAAATT CTTTTCTTGT TCTGACTATG 
TACGGGGAGA TTTTCAAATA TTATGACAGA AAACATAAAG CGTCCAAAAC AGTGTTTTCT 
ATGGAAAGAA CACCTGATTA TATAAATTTT ACCACAAATG GGAAGATAAT ATATCTGATG 
GACGATACTC TTTATTCATA TAATCCTAAT TCCGAAATGA CTATAAAAAA GCCTGTTATT 
AATAAAAATA ATGAAAACAG AGGGAAATAC AAAATATATG TAAACGGTGA AAATATAGTA 
TTAAAGCATC GTGCACTTCA TTCACAGGAA AATACCATAA GTATTTTTGA TGAGAAGCTG 
GAAGAGATTT TTAATATAAA AACTGTAAAA AATCATATAT ACTCAAGTAT ATCAGAACTT 
CAATATATTG CAGGCACAGA AGACGGAGAA GTGGAAATAT GGGATGTGAT CACAAAAGAG 
CTTTATAATT CCGTGAAGAT AAGCGACTAT CGCATATCTT ACATTGAAAA GACAAAGGAA 
AATTACCTTC TAGGTCTCTC TTCGGGAGAA TTAATCATAA CAGACGAAAA ATTCAGAATA 
GAGAAAAAGC TGAATCTTCA TAAAGGCGAT ATTTTGAAAA TAAAGGCCAA TGATGAAAGA 
ATATTCACAC TTGGAATGGA TTATAATATA TTAAGTCTGA AAATATTGAA AAATGAGGAA 
ACTGATATTG AAAGACGCGG CTTTATGCAG GAATATAATA TAAATGACGA ATATTTTGAG 
TTTTTTACTT ATGAAAGAAT AGAAGCTGTA AGAAATTTTA TAAGAGAATT AAAAATAAAA 
AATATATCAT ATAATCCAAA GGAAAATCTT ATATTTAAAG TATTTTCAGA GCCGCTTTCG 
GAACAAAAAA TATGTATACC GGTAAAAGAG CCGTATACTC AGGGAAATAC CGCAACAGGA 
CTTGCATTGG AAATGGAAAA AAATTCATGG ACTGATCCCG AACTGAATAA TTCTTTGAGA 
AACATACTGA AATTGCTTTA TAAAACATAT ATGGGCACTT CAAAAGATTT GAATTATATA 
AGGGAAGATA TAGAAAAGCA TATATTTAAT ATTCTTCCTC CGGACAAAAT TTTTAAATAC 
TGGCAGAAAA ACGGAGTACT TCTTTTGAAT ACGGTTTTGA CAATTGCGGA AACAAAAGCA 
GCTGATCATA GTAAATTTTG GACACCTTTT ACACAGGAAC TGCTGGAATT TATCTCAGAA 
AAAAATAAAA ATATCACATA TTTTTTATGG GGAAAAGATG TGCAGGCATT TGAGAAAAAT 
ATAAAAAGCG GAGAAATAAT CAAACATAAT CATCCGTCTG TATGGGGAAA TCCTGAAAAT 
GAGAAAGATT TTTTGAACAG CAGCTCATTT GAGAAAACAA AAGGAATTAT AAACTGGCTT 
GGGTGTGAAA TGGAACGAAA GACGACATTA TTTTAA

Protein sequence

MKVILDKKLI NEKGLKDFDL DPVNKDLVAV GKKLYFVSQD LEGKVIIKEL GGKLKNIEGV 
KFIKEENQLF VSNSFLVLTM YGEIFKYYDR KHKASKTVFS MERTPDYINF TTNGKIIYLM 
DDTLYSYNPN SEMTIKKPVI NKNNENRGKY KIYVNGENIV LKHRALHSQE NTISIFDEKL 
EEIFNIKTVK NHIYSSISEL QYIAGTEDGE VEIWDVITKE LYNSVKISDY RISYIEKTKE 
NYLLGLSSGE LIITDEKFRI EKKLNLHKGD ILKIKANDER IFTLGMDYNI LSLKILKNEE 
TDIERRGFMQ EYNINDEYFE FFTYERIEAV RNFIRELKIK NISYNPKENL IFKVFSEPLS 
EQKICIPVKE PYTQGNTATG LALEMEKNSW TDPELNNSLR NILKLLYKTY MGTSKDLNYI 
REDIEKHIFN ILPPDKIFKY WQKNGVLLLN TVLTIAETKA ADHSKFWTPF TQELLEFISE 
KNKNITYFLW GKDVQAFEKN IKSGEIIKHN HPSVWGNPEN EKDFLNSSSF EKTKGIINWL 
GCEMERKTTL F