Gene Sterm_2010 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sterm_2010
Symbol
ID	8597476
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sebaldella termitidis ATCC 33386
Kingdom	Bacteria
Replicon accession	NC_013517
Strand	+
Start bp	2139373
End bp	2140878
Gene Length	1506 bp
Protein Length	501 aa
Translation table	11
GC content	33%
IMG OID
Product	hypothetical protein
Protein accession	YP_003308796
Protein GI	269120619
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCAGAAA ATAAAGAAAA TATAGAGAAA AAAGAATTAG CAGAGGAAAA AGAAAATAAT 
ACGGAAATTT CTGAAGAAAA TACTGAGATA TCTCAGGAAA ATACAGGAAA AAATATTTCG 
GAAGAAATAG AACCGGAAAC AGGAGAGGAT AAAAATCCCG AAATTTTTAT CCATGAAACT 
GAAGAAGAAG CTAAAATTGA AGAAAATCCT GAAGAGGAGC TTTTGGATGA AAATATTAAG 
GATAAATTTG ACCCCGCAAA GTATGTTCCT TATGATCCAG GGGTAAAGAG CCGCGGAAAT 
AGCAGCAAGC TTCCTTATAT AATATTTGGA ATTATAGTGG CTTTGGGAAT ACTTCTTTAT 
ATTATAATTG GAAACATGGG AGGCGGTAAT AGAATAGGCG ACCTCGCTCA GGAAGAAGAA 
CAGACTGAAA TTGAACAGAC TGCTGCTCCA AGCACAGATA TTAATGATTA TAAAAAGAAA 
TACTGGAGCG GCGATTCGAG CATAACGATA ACAGATGCTT TCTCAGGATA TAAAAATGCT 
AAAAATATAG AATATCTTTT GTATGAAAAA GATGGAAGAA CGGTTTTTCA GGTTAAGGCA 
GAGCTGGAGG TAAAGCAGAT TCTCGATTAT AACGGTCCTG ATATAAAAAT CGGAAATGAC 
GGAGACCTGT CTGAAACAGC ATATCTGTAT TTCAGAAAGC ATCAGAATGA TATAAAGATT 
TATGATAACA GTTATTTTTA TATACCAAAG GAAAATACAG GAAGTGAAAA TCTGGATTTA 
TCCAAAAGAG AAGTAGAAAT AACAAACGGG AACGAAGTAT ATAAAGCTGA GTATTCCAAT 
GGTTTGAATG ATATATATAA TGACAGTTTT AATTATGGTG CAATGCTGAA AAATATGAAT 
AATTTTTATT TAAAAGTAGT TCCTAAAAAA TCAACTAGTA TAAGCGTAAA ATTTGAAACT 
AAGGAAAAGG CTGATGAGGA ATTAAATAAG GTATATCAGC ACCTCACGGG AATACTTAAT 
GATGACCAGA AGTCAAAGCT TACATCTTCC CAAAAAGCAT GGCTGGATTA CAGAGACAGC 
GAGTTTAAAT TTTTGAATTC TGTATTCTTT ATAAAAGATA TACCAAATTC TGCAGAAATT 
TCGAATAGAT TTTCTGAAAA ATACAAAATA AAAATAATAG AAAACAGAAT CAGCGAATTG 
AATACATATA AAGAACTGGT AGATAAAAAA GGTACAGTAA AACTTGATGA AACAGAAATA 
AACAAGCAGA TGGAAAATCT GAAGCAGAGA TATGCAACAC TGCTTACACA TCTGAGCGGT 
GACAGTCTGC AGTTTATGAA AGATTCGGAA ACAAAATGGT CTTCTTTTGC AGATACTGAT 
CTGATATTCG TTCAGAGCCT TTCTGCTGTA CTTCCGGAAG GAGAAACATC ACAGTTTTCA 
ATAGGATTTG AGCCTTACAG TATAAGACTG AAGATGCTTC AGGTATATGA TGATATCTTA 
TTTTAA

Protein sequence

MSENKENIEK KELAEEKENN TEISEENTEI SQENTGKNIS EEIEPETGED KNPEIFIHET 
EEEAKIEENP EEELLDENIK DKFDPAKYVP YDPGVKSRGN SSKLPYIIFG IIVALGILLY 
IIIGNMGGGN RIGDLAQEEE QTEIEQTAAP STDINDYKKK YWSGDSSITI TDAFSGYKNA 
KNIEYLLYEK DGRTVFQVKA ELEVKQILDY NGPDIKIGND GDLSETAYLY FRKHQNDIKI 
YDNSYFYIPK ENTGSENLDL SKREVEITNG NEVYKAEYSN GLNDIYNDSF NYGAMLKNMN 
NFYLKVVPKK STSISVKFET KEKADEELNK VYQHLTGILN DDQKSKLTSS QKAWLDYRDS 
EFKFLNSVFF IKDIPNSAEI SNRFSEKYKI KIIENRISEL NTYKELVDKK GTVKLDETEI 
NKQMENLKQR YATLLTHLSG DSLQFMKDSE TKWSSFADTD LIFVQSLSAV LPEGETSQFS 
IGFEPYSIRL KMLQVYDDIL F