Gene Sterm_3109 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sterm_3109
Symbol
ID	8598563
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sebaldella termitidis ATCC 33386
Kingdom	Bacteria
Replicon accession	NC_013517
Strand	+
Start bp	3255815
End bp	3257911
Gene Length	2097 bp
Protein Length	698 aa
Translation table	11
GC content	35%
IMG OID
Product	protease-associated PA domain protein
Protein accession	YP_003309882
Protein GI	269121705
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	0
Plasmid unclonability p-value	0.0000000536812
Plasmid hitchhiking	No
Plasmid clonability	unclonable

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAAAAA TTTTGATTTT ATTTTTTACA GTGTCGTTAA TGATGATTTC GGCACCCAGA 
GAAAGCACAG ACAGCAGGGA AAATATCATA AATCATCTTG ATATTAATTA TTCTTATAAT 
ATTGCCGAAT CCCTGACGAA GTTTAAGACT AACGAAAAAC TGGGATTTCG TACTGCCGGT 
TCCAGTGCTG AACATGCAGC CGGAGATATG CTTTATGAAG AGTTCAAAAA GCTCGGGCTT 
AAAAATGTCA GAAAAGATGA ATTTACTGTA GATGCATGGG AATTTAAAAA TGCAGAGCTT 
ACGTATACCG ATAAAAAAAA TAAAAAGCAA AGGCTTACTT TAAACAGTTA TGCTGCCAAT 
TTTGCGACAA ATGGTACAGA AGTGTATGAT CTGGTTTATC TGAACAAGGG TACCAGAGAT 
GATTATGAAA ATGCGGATGT CAAGGGAAAG ATAGTTATGG TTGATATTAA TCAGCGTGAG 
GACTGGTGGA TTAATTATCC TGCCATGCAG GCAAAGCTAA AAGGAGCAAA GGCTGTAATA 
GCCGTAAATA ACGGAGGATA TGCAGAAATC AGCGATGATG CCCTGAATGT ACAGGACATG 
TGCGGTCCTG ATGATACACC TGCCTTGGGA ATGTCAAAAG CAGACGGTGA TAAGCTGAAA 
GCTCTTATGA ATAAAAATAG AACTGTAAAA ATAGAACTAA ATGTGGATTC TCAGGTTAAA 
AGAGATCAAA AGGCCTATAA TATTGTTGGT GAAATCCCCG GAAAGGATCC TGATTCACTT 
ATAATATTAA GTTCACATTA TGACGGATAT TTTGAGGCAT TTCAGGATAA TGCTACAGCA 
GTTGCCCTTA CTATGGGAAT AGCCAAAAGT ATAATTGACA GCGGGTATCA GCCTGAAAAA 
ACAATTATCG TTATTGCACA TGCTGCCGAA GAATGGGGAA CAGTAGATAC AAGATATGAC 
TGGTCTGTAG GTGCGTATAA TCAGGTGTTT AAAGTAAGAC CGGACTGGGC AGCCAAAAGT 
TTTGCCATGC TGAATTTTGA ACAGCCGGGA TCTGAACATG TAAAAACACA GGAAATAAGA 
ACTGTTTATG AATATAAAAC ATTCATTGAA AGTATTGCTG ACAGAATTAA ACCGTCTGTC 
TCAGGTGTAT ATGAGGGAGG AATCAAGGTT ACCACACCTC CGAGAACATG GGCGGATGAT 
TTTTCATATT CTATAGCCGG GATTCCTACT ATAAGAAATG ATTATGTAGG AGCACAGTTT 
ATGAAATCGA CATATCATAC AAATTATGAT ACTAAAGCAA CTTATAATGA AAAAGCCTTT 
ACTTATAATC ACCAGCTTTA TGCACAGATT GTTTACGAGC TTGATCAAAA AGCAGTTATG 
CCGATGGATT TTACTACACG TTTCAATGAA TTCAAAGCTA CGCTGGATAT GGATTTACTG 
GCTAAAACCG GAAATGAAGG AAAAAAACTT CTGACAGACA TTGAAGAAGT AATAAAAACT 
TCTGAAAATC TGAACAGACT GCTTGCAGAT ATAAATAATA AGCATGAGCA GGCTATAAAA 
AGTAATAATA CTGCCGAAAT TAAGAAATAT GAAACAAAAG CAGATACTGT GAACAAACAG 
CTCCTTGCTC TTTATAAATA TTGTCAGGAT TCATTTATAA AGCTTACATG GGAAGATGAT 
TCCATATTCC CGCATGAACA TGCACAAAAT AATATAAATG CCCTAAATGA AGCTGTAGCT 
TTACTTGAAA AGGGAGATAT AGATACTGCA GTTAATGATC ACCTTTCTTT AATTGATAAT 
AACTGGTATG CACTGAGTTT TGACAAAGAA ACTTATGAAT ATTTTACGAA TCAGGTTTTA 
AAACAAGATA AGGAACGTCT GAACTGGGGT GCAGGAAGAA TTATGGGACA TGAGGATCTT 
TATGATATTA TTTTCTCTTT GCAGCAAAAA CAAAAATCAG GAGAAAAAAA TGTTAAGAAT 
GAAATAGAAG CTTTGAAAAA GATTCTTGCT TCTCAGGAAG CACTTATGAA AAATACTGTT 
ATTACAGAAA ATAAACAGCT TCTTGAAGTA AAAAAATATC TAAATAAAAT AAAGTAA

Protein sequence

MKKILILFFT VSLMMISAPR ESTDSRENII NHLDINYSYN IAESLTKFKT NEKLGFRTAG 
SSAEHAAGDM LYEEFKKLGL KNVRKDEFTV DAWEFKNAEL TYTDKKNKKQ RLTLNSYAAN 
FATNGTEVYD LVYLNKGTRD DYENADVKGK IVMVDINQRE DWWINYPAMQ AKLKGAKAVI 
AVNNGGYAEI SDDALNVQDM CGPDDTPALG MSKADGDKLK ALMNKNRTVK IELNVDSQVK 
RDQKAYNIVG EIPGKDPDSL IILSSHYDGY FEAFQDNATA VALTMGIAKS IIDSGYQPEK 
TIIVIAHAAE EWGTVDTRYD WSVGAYNQVF KVRPDWAAKS FAMLNFEQPG SEHVKTQEIR 
TVYEYKTFIE SIADRIKPSV SGVYEGGIKV TTPPRTWADD FSYSIAGIPT IRNDYVGAQF 
MKSTYHTNYD TKATYNEKAF TYNHQLYAQI VYELDQKAVM PMDFTTRFNE FKATLDMDLL 
AKTGNEGKKL LTDIEEVIKT SENLNRLLAD INNKHEQAIK SNNTAEIKKY ETKADTVNKQ 
LLALYKYCQD SFIKLTWEDD SIFPHEHAQN NINALNEAVA LLEKGDIDTA VNDHLSLIDN 
NWYALSFDKE TYEYFTNQVL KQDKERLNWG AGRIMGHEDL YDIIFSLQQK QKSGEKNVKN 
EIEALKKILA SQEALMKNTV ITENKQLLEV KKYLNKIK