Gene Sterm_0102 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sterm_0102
Symbol
ID	8595598
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sebaldella termitidis ATCC 33386
Kingdom	Bacteria
Replicon accession	NC_013517
Strand	+
Start bp	108462
End bp	110120
Gene Length	1659 bp
Protein Length	552 aa
Translation table	11
GC content	43%
IMG OID
Product	dihydroxy-acid dehydratase
Protein accession	YP_003306918
Protein GI	269118741
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.0234635
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGAAGTG ATAATTTGAA AAAGGGAGAC AGAAGAGCAC CGCACAGATC CCTGCTTAAG 
GGATTAGGTT TTGTAAATGA GGAAATGGAC AAGCCTATTA TAGGAATTGC CAATTCATTT 
AATGAGATAA TACCGGGACA TGTCCATCTG CAGACTCTTG TACAGTCTGT AAAAGACGGT 
ATAAGAATGG CAGGAGGAGT TCCTATGGAA TTTAATACGA TAGGAATCTG CGACGGGCTG 
GCAATGAATC ACATAGGAAT GAAATATTCG CTGGTAACAA GACAGATAGT GGCTGATTCG 
ATAGAAGCTA CTGCGATGGC AACACCATTT GATGCTATAG TTTTTATACC AAACTGTGAT 
AAGGTAGTTC CCGGAATGCT TATGGCAGCA GCAAGACTGA ATATACCAAG TATATTTATA 
AGCGGAGGAG CAATGCTCGC AGGTGTCTAT AAAGGGAAAA AAATAGGATT AAGCAATGTT 
TTTGAATATG TTGGGCAGTT TGAATCAGGG AAAATGACTG CAAAAGAACT GAATATGGTA 
GAAGATATGG CGTGTCCTAC ATGCGGGTCA TGTTCGGGAA TGTACACTGC AAATACAATG 
AACTGTCTGA CTGAAGCTCT GGGAATGGGA CTGCCCGGGA ACGGAACTGT GCCTGCGGTA 
TTTTCGGAAA GACTCAGACT TGCTAAAAAA GCAGGAATGC AGATACTGGA AATACTAAAA 
GCTGATCTGA AACCAAAAGA TATAATGACA AAGGAAGCAT TTGTAAATGC AGTGGCAGTG 
GATATGGCAC TCGGAGGATC TACAAATACA GCACTTCATC TGCCGGCAGT AGCACATGAT 
GCAGGAGTAA AACTTACTAT AGATGATTTT AACGAAATTG CGGCGAGAGT ACCTCAGCTG 
TGTAAGCTGT CACCTTCAGG AGAGTATTTC ATAGAGGATT TATACAGAGC AGGCGGAGTT 
ACTGCGGTAA TGAGAAGACT GCTTGAAAAC GGAGAGCTGG ATGGAACTCA GAAAACAGTT 
GCACTGAAAA CACAGGAAGA GCTGTGTAAG GAAGCATATA TAAATGACGA GGATGTAATA 
AAGCCGTGGG ATAAGCCGGC GTATGCAGGC GGAGGACTGG CAGTGCTGAA AGGAAATCTT 
GCCGAGCTGG GATCAGTGGT AAAAGCCGGG GCAGTGGCAG ATGAAATGCA GGTACATTCA 
GGACCGGCAA AGGTGTATAA TTCTGAAGAG GAGGCCGTGG ACGGAATTCT CGGCGGAAAA 
GTAAAAAGCG GAGATGTAGT GGTAATAAGA TATGAAGGAC CTAAAGGCGG ACCGGGAATG 
AGAGAAATGC TTACTCCGAC ATCTGTAATA GCAGGTATGG GACTGGATAA AGAAGTAGCA 
CTTCTTACTG ACGGAAGATT TTCAGGGGCG ACAAGAGGAG CTTCAATAGG GCATGTGTGT 
CCTGAGGCAG CAGTAGGAGG AACTATAGCA GTAGTAAGAG ACGGGGATAT TATAGAAATA 
GATATACCAA ACAGAACTCT GAATGTAAAA CTAAGCGACG AGGAAATTGC AGCCAGAAAA 
GCCGAGCTGA AACCATATGA GCCTGAAGTA ACAGGATATC TGAAAAAATA TGCACTGCAT 
GTAGGATCGG CAGTTAACGG AGCAATAGAA GAATATTAA

Protein sequence

MRSDNLKKGD RRAPHRSLLK GLGFVNEEMD KPIIGIANSF NEIIPGHVHL QTLVQSVKDG 
IRMAGGVPME FNTIGICDGL AMNHIGMKYS LVTRQIVADS IEATAMATPF DAIVFIPNCD 
KVVPGMLMAA ARLNIPSIFI SGGAMLAGVY KGKKIGLSNV FEYVGQFESG KMTAKELNMV 
EDMACPTCGS CSGMYTANTM NCLTEALGMG LPGNGTVPAV FSERLRLAKK AGMQILEILK 
ADLKPKDIMT KEAFVNAVAV DMALGGSTNT ALHLPAVAHD AGVKLTIDDF NEIAARVPQL 
CKLSPSGEYF IEDLYRAGGV TAVMRRLLEN GELDGTQKTV ALKTQEELCK EAYINDEDVI 
KPWDKPAYAG GGLAVLKGNL AELGSVVKAG AVADEMQVHS GPAKVYNSEE EAVDGILGGK 
VKSGDVVVIR YEGPKGGPGM REMLTPTSVI AGMGLDKEVA LLTDGRFSGA TRGASIGHVC 
PEAAVGGTIA VVRDGDIIEI DIPNRTLNVK LSDEEIAARK AELKPYEPEV TGYLKKYALH 
VGSAVNGAIE EY