Gene Sterm_2139 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sterm_2139
Symbol
ID	8597604
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sebaldella termitidis ATCC 33386
Kingdom	Bacteria
Replicon accession	NC_013517
Strand	+
Start bp	2278450
End bp	2279805
Gene Length	1356 bp
Protein Length	451 aa
Translation table	11
GC content	39%
IMG OID
Product	PTS system, cellobiose-specific IIC subunit
Protein accession	YP_003308924
Protein GI	269120747
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.00121046
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGAAAAAT TTACTGCGTT TTTGGAAAAA CATCTTATGC CGATTGCAAC AAAATTAGCA 
ACAAACAAAT ACTTAACAGC CTTAAAAGAT TCATTTGTTT ATACTATGCC GTTTTTGATA 
GTAGGGTCAG TAGTCCTTCT TTTGGTAAAT CTGCCAATAG GAGCACCCGA ACTTTCAGAA 
GGTGTAAAGA ACCCTATGTA TGTGAAGTGG TATGGAGACT TTATGGCGCT GCATAAGGCA 
TCTTTAGTTC AGCCGTTTTA TGTAAGTATG GGAATAATGT CTATATTTGT AGCTTTCGGA 
ATAGGATACA GCCTATCACA GCAGTATCAG CTTAATGCCA TTACAGGAGG ATTTCTATCA 
TTATTTACCT TCCTTATAAT GGGTGCTAAA TTTGACTGGT TGCCAATTGG TGAAGCAACA 
GGAGGACCTG CATTATTTCA CATAGCAGAA GGCGGATGGA TGCCTGTGAT GGACGGACGG 
TATCTGGATG CAAACGGATT ATTTACGGCA ATAATCGGAG GCTTTATAGC AGTGGAAATA 
TACAGATTTA TGTTAAAAAA AGGATTTGTA ATTAAGCTTC CGGAGTCAGT TCCGCCGGCA 
ATAGCAAGAT CATTTGAATT GTTAATGCCT ATAGTTGTGG TAATAATTAT ATTCCAGCCG 
CTTAGTATCT TTGTACAAAG TAAGGCAAAT GTAATGATAC CTGAATTACT TATGGGAATT 
GTAAGACCGA TAATAAAAGC TTCTGATACT CTGCCGGCAG TATTGTTTAT ACTATTAATA 
GTACATTTAT TGTGGTTCTG CGGACTTCAC GGTGTAAACG TCGTGGTAGC AGTTATAAAT 
CCGATTATTT TAAGCAATCT TGCGGAAAAT CAGGCGGCAT TGCAGGCCGG GCAGCAGATA 
CCAAGAATAT TCGCAGGTGG TTTTCTTGAT GCATTCGTAT ATCTCGGCGG TTCTGGAGCA 
ACAATAGGTC TGGCAATAGC AATGGCACTT TCAAAGAATG CCCATATGAA ATCAATAGGA 
AGACTCTCAG TGGTTCCGGG AATCTTCAAT ATAAATGAAC CGGTAATTTT CGGTGCTCCG 
ATAGTCATGA ATCCGGTATT GTTCATTCCG TTCCTGTTCG TACCTATGAT AAATGCAACA 
ATAGCATGGA TATGTCTGAA AACAGGACTT GTAGGAAGAA TAGTAACACT GGTTCCATGG 
ACTACTCCGT CACCAATAGC AGCATTGCTT GCTACGAACT TTAATGTAAT GGCTTTTGTA 
TTAAGTGCAT TCCTTGTAGT ATTATCAACA ATATTATATC TGCCTTTCCT GAAAGCATAT 
GCAGATATAC TTAATAAACA GGAAGCAGCT CAATAA

Protein sequence

MEKFTAFLEK HLMPIATKLA TNKYLTALKD SFVYTMPFLI VGSVVLLLVN LPIGAPELSE 
GVKNPMYVKW YGDFMALHKA SLVQPFYVSM GIMSIFVAFG IGYSLSQQYQ LNAITGGFLS 
LFTFLIMGAK FDWLPIGEAT GGPALFHIAE GGWMPVMDGR YLDANGLFTA IIGGFIAVEI 
YRFMLKKGFV IKLPESVPPA IARSFELLMP IVVVIIIFQP LSIFVQSKAN VMIPELLMGI 
VRPIIKASDT LPAVLFILLI VHLLWFCGLH GVNVVVAVIN PIILSNLAEN QAALQAGQQI 
PRIFAGGFLD AFVYLGGSGA TIGLAIAMAL SKNAHMKSIG RLSVVPGIFN INEPVIFGAP 
IVMNPVLFIP FLFVPMINAT IAWICLKTGL VGRIVTLVPW TTPSPIAALL ATNFNVMAFV 
LSAFLVVLST ILYLPFLKAY ADILNKQEAA Q