Gene Sterm_3037 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sterm_3037
Symbol
ID	8598491
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sebaldella termitidis ATCC 33386
Kingdom	Bacteria
Replicon accession	NC_013517
Strand	-
Start bp	3177098
End bp	3178243
Gene Length	1146 bp
Protein Length	381 aa
Translation table	11
GC content	33%
IMG OID
Product	ROK family protein
Protein accession	YP_003309810
Protein GI	269121633
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.00862886
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGAATTAA TTCAGAATAA TTATCATAGA AAAATTTTGA GTTATATATA TCTTGAAAAA 
CAGATAACTA AGATACAGCT GTCTAAATTT CTTGATGTTA CAATACCGAC TGTAACTCTT 
TATTTGAACG AACTTATAAA AATGGGTCTG ATAAAAGAAA GCGGGGTAAT TAATTCCGAA 
GCAGGAAGAA AACCCGTTGT ATTTGAAATA AATTCCCAAA ACAGCTATAC CATAGGAATT 
GAAATAAGAC AGGAACTTAT TACAGTGATA ATACTGGATT TGGAATTAAA TTTGATATAT 
AAGTCGCAGG AAAATTATAA TATAAATAAT CTTCAGGAAG AATTAAAGAA TCTTGTCTAT 
AAATCAATAG TACACAGTAA TATAAAAATG GAACAGCTTC TAGGCATAGG GATAGCGTTT 
CCGGGAATAG TAAATGACAG AAAGCTGAAA TTCGAAGAAT CGCCTATAGT AGACATAAAG 
GAGTATTCAC TTGAAGGACT GAAAGAATCT TTTAATATAC CGATATATAT TGGGAATGAA 
GCAGACTATG CGGCATATGC CGAGAATCTT ATAGGCAGTT CCAAAAAATA TAAGAATTCT 
ATTTATCTTT CTGTACATGA AGGGATAGGG GGAGGAATAA TTCTGGAAAA TTCTCTTTAT 
TCCGGAGGTC TTCAGCATGC AGGCGAAGTG GGACATATGG TGATAGAATA TAAAGGACGG 
GAGTGTGAGT GCGGAAGACA TGGCTGCTGG GAAAAGTATG TTTCTTCCAA TATAATAAAT 
AAAATAATCA AGGATAACAG CCTTGCAGGT GTAGATCCAC TTCTTGACAT ATATCTGAAT 
AAAAGTGATG ATGTTATTTT TCGACAGATG GACGAGTATT TTGATTATCT TGCAGCAGGA 
ATAATGAATC TTTTTCTTAT ATTTGATCTG GATTGTATAA TAATCGGAGG TATTCTTGCA 
CCTTATGAAA AACAGATACA GAATCTGCTT ATAGAAAAAA TAAAAAATGA AAACTGCAAG 
CTGGAAAAAA ATGCCGAAAA AATTGTTTTT CCGCAATTAC TTACAACAGC TTCTGCAATA 
GGAGCCGGTA TTATTCCTTT GTCGAATATT TATGATTTTG ATCTGATATT AAAAAGCGGA 
GTATAA

Protein sequence

MELIQNNYHR KILSYIYLEK QITKIQLSKF LDVTIPTVTL YLNELIKMGL IKESGVINSE 
AGRKPVVFEI NSQNSYTIGI EIRQELITVI ILDLELNLIY KSQENYNINN LQEELKNLVY 
KSIVHSNIKM EQLLGIGIAF PGIVNDRKLK FEESPIVDIK EYSLEGLKES FNIPIYIGNE 
ADYAAYAENL IGSSKKYKNS IYLSVHEGIG GGIILENSLY SGGLQHAGEV GHMVIEYKGR 
ECECGRHGCW EKYVSSNIIN KIIKDNSLAG VDPLLDIYLN KSDDVIFRQM DEYFDYLAAG 
IMNLFLIFDL DCIIIGGILA PYEKQIQNLL IEKIKNENCK LEKNAEKIVF PQLLTTASAI 
GAGIIPLSNI YDFDLILKSG V