Gene Sterm_4038 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sterm_4038
Symbol
ID	8599482
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sebaldella termitidis ATCC 33386
Kingdom	Bacteria
Replicon accession	NC_013517
Strand	-
Start bp	4296194
End bp	4297411
Gene Length	1218 bp
Protein Length	405 aa
Translation table	11
GC content	35%
IMG OID
Product	extracellular solute-binding protein family 1
Protein accession	YP_003310801
Protein GI	269122624
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	37
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAAATT TAAAAGTACT CATACTTATG GTATTTTCAA TATTCATTTT AGTGTCATGC 
GGAGGGGGAG ACTCCAAGGT AAAAACAATA GATTTTATAA TATCTGATGA TTCCCTTGAA 
GGGGGAGCCA TGGCAAAGGC AGTGGAAAGA TATAATAATT CACAGGACGA AATAAAAATA 
AATCTTATAG AACTTCCTTA TGACAGTGTA AGAGCAAAAG TAAAGACAAT GGTAGCAGGA 
GGAAAGGCGC CGGCTCTTAT GAGAACATCA AATATAGATG AATTTGAAAC AGTTTTGGCA 
GATCTCTCAG ATACAGTGAA TCCTGCTGAT TTTACAGATA AAATGGAAGA AAATCTTATG 
GACGGGAAAT TTTTGGGAGT ACCTTTGAAT TTAACAGTAA ACGGGCTTAT TTATAATAAA 
ACATTATTTG ATAAGGCAGG AGTAAAGGTA CCTGATTCAC AGGATAATAT CTGGACATGG 
GATGAATTTG TGCAGGCATT AAATACCGTG AAAGAAAAGA ACAGTTTAAA ATACGGAATG 
GTAATGGACT TTTCTCAGAA CAGATATCAG ACAATGCTTT ATCAGTTTGG AGGAAGAATA 
TTTGATGAGA ACGGGGATAT AGTGGTAGAT CAGCCTGACA GTATAAGAAC TCTTGATTAT 
TTTATAAAGC TTCATAAAGA TAAGGTAATG CCTGATGATG TATGGCTTGG CGGGGAAGAT 
GCAAGCAATC TTTTCAAAAC AGGAACTATT CCTGCATATT ACTCGGGAAG CTGGAAAATA 
AATGAATATA AAAATGATAT AAAAGATTTT GAGTGGGGAA TAGCATATAT GCCGAAAGAA 
AAAAACAGAT CTTCAATAGC AGGCGGAAAT TTTCTTGTAG CATTTACTAA GTCACCTGAT 
CTTGAAGAGG CAAAAAAATT CATTAAGTGG TTTTATCAGG ACGAGAATTA TAAGCAGTAT 
TGTGAAGACG GAGCCTATAT ATCCGGGAAA TTAAGCGTAC ACCCGTCTTA TGACTACGGT 
CAGGAATTTT TTGATATTCT TGATAATGAA ATTGTGAATA CACCTGAATT AAGTCCTAAT 
GACAAAAAAA TGATAAAAAA ATATAAAGCA GCAGGAAATA TGATGAGAGA TTATATCGTA 
TATGCTATTC AGGGAGAAAG AACACCAGTA CAGGCAATGA CTGAACTAAA GGAAAAATGG 
TCTGAGCTGA AAAAATAA

Protein sequence

MKNLKVLILM VFSIFILVSC GGGDSKVKTI DFIISDDSLE GGAMAKAVER YNNSQDEIKI 
NLIELPYDSV RAKVKTMVAG GKAPALMRTS NIDEFETVLA DLSDTVNPAD FTDKMEENLM 
DGKFLGVPLN LTVNGLIYNK TLFDKAGVKV PDSQDNIWTW DEFVQALNTV KEKNSLKYGM 
VMDFSQNRYQ TMLYQFGGRI FDENGDIVVD QPDSIRTLDY FIKLHKDKVM PDDVWLGGED 
ASNLFKTGTI PAYYSGSWKI NEYKNDIKDF EWGIAYMPKE KNRSSIAGGN FLVAFTKSPD 
LEEAKKFIKW FYQDENYKQY CEDGAYISGK LSVHPSYDYG QEFFDILDNE IVNTPELSPN 
DKKMIKKYKA AGNMMRDYIV YAIQGERTPV QAMTELKEKW SELKK