Gene Sterm_2074 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sterm_2074
Symbol
ID	8597540
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sebaldella termitidis ATCC 33386
Kingdom	Bacteria
Replicon accession	NC_013517
Strand	+
Start bp	2201512
End bp	2202729
Gene Length	1218 bp
Protein Length	405 aa
Translation table	11
GC content	35%
IMG OID
Product	protein of unknown function DUF214
Protein accession	YP_003308860
Protein GI	269120683
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	32
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAATTTTT TAGAATTGTT AAAAATGGCC TTTTCCAATC TCCTAAGCTA TAAAATGAGA 
TCATTTCTGA CCATGCTGGG GATAATAATA GGAATAAGTG CGGTAATATT AATGTCGGCA 
ATAGGAGCCG GTGCACAGGA TAAGATAGTG GGAGATCTTA ATAAATTGGG AATAGGAAAC 
TTTGATGTTT CAATAGATAA TTCCATAGAT AATATAAAAA ACAGAAACAG ACTGCAGCAA 
AAGCATATAG ATATGATAAC TAACATAAGC GGTGTAGAGT CTGTAGCACC GACAGGAACG 
GTAAGGCACA GAATAGAAAT GTCGTCGGGG TTCGGGAATT TCAGTATAAT AACAGGTGTA 
GTTCCGGCAT CCTTTAATAT AGAAAATACC CAGCTTTTGA AAGGAAGATA TTTTAATTCG 
GAGGAATACA GAAAAACAGG ATATTTTGCC ATAGTAGATG ATGTCACTAC AGCAAGAATA 
TTCGGTGATG AATCACCGCT GGGACAAAAG ATAACAATAA GAATCAAAGA TTTAGGAAAT 
AAAGATTATG TAATAGTGGG AGTTTCAAAA AATCCTGTGG CAAGTATGAC AGGAATTTTT 
GGAGGAAACA GTCCGAGCTT TATATTGATA CCTTATCAGA ATTATCAGTA TATAAGCAAG 
CTTGATGAAA AATATTACTC GGGAATAAAA GTAAAAGTTT CAGATCCAAA CGAACTGAGC 
CAGATAATGG ATAACACAAC AAATATTTTA AATAAGGAAT CAGGAATAGC CGGATTATAT 
CGGGCTGTAA ACTCAAATAC CGGTCTGGAG CAGTTTAACA GTATACTCAG CATGCTGTCG 
ATATTTGTGA GCTTTGTAGC TTCCGTTTCC CTTTTTGTAG GGGGAATAGG GGTAATGAAT 
ATCATGCTTG TAAGTGTCAC TGAAAGAATC AGGGAAATAG GGCTTAGAAA GGCAATAGGA 
GCTAAAAATA AGGATATACT TCTTCAGTTT TTGATAGAGT CAATAATTCT TACAGTCTCA 
GGCGGTGTAA TAGGAATTCT TCTTGGAAGT GTTTCAGCGT TTTTAATATC GAATGCACTT 
GGATTGGTTC TTATTATAAA GGTAAGTATA CTTCTGATTT CAATTACAGT TTCTATGTTA 
ATAGGGGTGA TTTTCGGGGT ATATCCGGCA TCAAAAGCAT CAAAATTAAA TCCTATAGAT 
GCTTTGAGAG TAGATTAA

Protein sequence

MNFLELLKMA FSNLLSYKMR SFLTMLGIII GISAVILMSA IGAGAQDKIV GDLNKLGIGN 
FDVSIDNSID NIKNRNRLQQ KHIDMITNIS GVESVAPTGT VRHRIEMSSG FGNFSIITGV 
VPASFNIENT QLLKGRYFNS EEYRKTGYFA IVDDVTTARI FGDESPLGQK ITIRIKDLGN 
KDYVIVGVSK NPVASMTGIF GGNSPSFILI PYQNYQYISK LDEKYYSGIK VKVSDPNELS 
QIMDNTTNIL NKESGIAGLY RAVNSNTGLE QFNSILSMLS IFVSFVASVS LFVGGIGVMN 
IMLVSVTERI REIGLRKAIG AKNKDILLQF LIESIILTVS GGVIGILLGS VSAFLISNAL 
GLVLIIKVSI LLISITVSML IGVIFGVYPA SKASKLNPID ALRVD