Gene Sterm_3221 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sterm_3221
Symbol
ID	8598674
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sebaldella termitidis ATCC 33386
Kingdom	Bacteria
Replicon accession	NC_013517
Strand	-
Start bp	3372941
End bp	3374017
Gene Length	1077 bp
Protein Length	358 aa
Translation table	11
GC content	39%
IMG OID
Product	Alcohol dehydrogenase zinc-binding domain protein
Protein accession	YP_003309993
Protein GI	269121816
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	2
Plasmid unclonability p-value	0.000000142115
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAGGCTT TAGCGCGGTA TGGTAAAGAG TTTGGAGGGT ATAAACTTAT TGATATACCT 
AAACCTGAAT GCGGTCCGGA TGATATTATT GTAGAAATAA AGGCCGCAGC GATTTGTGGT 
GCTGATATGA AACACTACAA AGTTGATAAT GGCTCTGATG AATTTAATTC TGTTAGGGGA 
CATGAGTTTG CGGGTGAAAT TGTGGAAATC GGAAAAAATG TTGTTGATTG GAAAATCGGA 
CAAAGAGTAG TTTCTGATAA CAGCGGTCAC GTATGCGGAG TATGTCCTGC CTGCGAACAG 
GGTGATTTTC TGTGTTGTAC GGAGAAAGTG AACCTTGGCT TGGATAATAA CAGATGGGGC 
GGAGGATTTT CAAAATATTG TTTAATTCCC GGAGAAATTT TAAAAATACA TAAACATGCA 
ATATGGGAAA TTCCAGAAAA CCTTAAATAT GAGGAAGCAG CGGTATTGGA CCCTATTTGC 
AATGCGTACA AATCAATCGC CCAGCAGTCA AAATTTTTGC CCGGACAGGA TGTCGTAGTA 
TTTGGAACAG GTCCTCTGGG ATTATTTTCT GTACAAATGG CAAGAATTAT GGGAGCAGTT 
AATATTGTTG TCGTAGGACT GGAAGATGAT GCAAAAGTAA GATTCGACAT AGCAAAAGAA 
TTAGGAGCTA CTGATGTAGT GAATGCTTCA AGAGAAGATG TGGTAAAACG CTGCCAGGAA 
ATATGCGGCA AGGATAATCT TGGTCTGGTG ATAGAGTGTT CAGGAGCAAA TATTGCACTA 
AAACAGTCAA TCGAAATGTT AAGACCAAAC GGAGAGGTAG TTCGTGTAGG AATGGGATTC 
AAACCGTTAG AATTTTCTAT TAATGATATT ACTTCATGGA ATAAAAGCAT AATAGGGCAT 
ATGGCATATG ATTCTACGTC TTGGCGTAAT GCTCTGAGAC TTCTTGAGTC AGGAGCCATT 
AAAGTACAGC CTATGATTAC ACACCGTATC GGCTTATCTG AATGGGAAAA AGGCTTTGAT 
GCAATGGTCA GCAAGGAAGC TATTAAAGTA ATTATAACAT ATGATTTTGA TGATTAA

Protein sequence

MKALARYGKE FGGYKLIDIP KPECGPDDII VEIKAAAICG ADMKHYKVDN GSDEFNSVRG 
HEFAGEIVEI GKNVVDWKIG QRVVSDNSGH VCGVCPACEQ GDFLCCTEKV NLGLDNNRWG 
GGFSKYCLIP GEILKIHKHA IWEIPENLKY EEAAVLDPIC NAYKSIAQQS KFLPGQDVVV 
FGTGPLGLFS VQMARIMGAV NIVVVGLEDD AKVRFDIAKE LGATDVVNAS REDVVKRCQE 
ICGKDNLGLV IECSGANIAL KQSIEMLRPN GEVVRVGMGF KPLEFSINDI TSWNKSIIGH 
MAYDSTSWRN ALRLLESGAI KVQPMITHRI GLSEWEKGFD AMVSKEAIKV IITYDFDD