Gene Athe_0344 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Athe_0344
Symbol
ID	7409274
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anaerocellum thermophilum DSM 6725
Kingdom	Bacteria
Replicon accession	NC_012034
Strand	+
Start bp	392725
End bp	393768
Gene Length	1044 bp
Protein Length	347 aa
Translation table	11
GC content	41%
IMG OID	643714730
Product	oxidoreductase domain protein
Protein accession	YP_002572253
Protein GI	222528371
COG category	[R] General function prediction only
COG ID	[COG0673] Predicted dehydrogenases and related proteins
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	37
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

TTGAAAAAGC TAAGACTTGC TATAATCGGA TGCGGTTCAA TCACAAAGCA CAGGCATGCG 
CCGGAGGCAA AACAAAATCC CAATGTTGAG CTTGTTGCTG TATGTGACAA GAATTTAGAC 
CATGCAAAAG CCATTGCAGA AAAATTTAAA GTTGGAAATG TCTATGATGA TTATGAAAAG 
ATGCTAAAAG AAATAAAACC TGATGCAGTA GTGGTTGCAA CGCCAAATTA TCTTCATGCC 
GATGCTACAA TAAAAGCGTT AAAAGAGGGG GCTCATGTTC TTTGTGAAAA GCCAATGGCA 
ACAACCGAAG ATGAGTGCAG AATGATGGTA GAGACTGCAA AAGAGATGGG TAAGTTTTTG 
ATGATTGCTC ACAACCAAAG GTTAAATATA GCCCACAAAA AGGCAAAAGA GGTAATACAA 
AGCGGTGAGC TTGGGAAAGT GCTGAGTTTT AAAACAACCT TTGGTCATGG CGGACCTGAG 
AGTTGGAGCT CAGACAGGCC CGATACATGG TTTTTTCACA AAGAAGCAGC AAGCTTTGGA 
GCTATGGGCG ACCTTGGCGT TCACAAGATT GACCTTATGA GATTTTTGCT TGGTGAGGAG 
TTTGTTGAGA CAGCTGCGTT TGTTACAACT CTTTCCAAGA AGTATCCAAA TGGCCAGCCA 
ATTGACGTTG ACGACAATGC AGTCTGCATT TTAAAGACAC AGAGCGGCGC GATTGGAACG 
CTCACAGCTT CATGGACATA CCCGGGAAGT GAGGATAACT CAACTGTAAT CTACTGTGAG 
AAGGGTTCAA TTACACTTTA CGCAGATCCA AAATTTTCGA TGATAATAAG ATATGCAAAC 
GGTCAAAAAG CATATTTTGA GCTTGACACA ATGCAGACAA ACGAAAGACA AACAAAATCA 
GGTGTGGTAG ACGAATTTAT TGATTGTATC TTGACAAACA CACCACCAAG AATTTCTGGA 
GAAGAAGGTT TGAAGACCAT GAAAGTTGTG TTTGCATGTT TTGAGTCAGC AAAAACTGGC 
AAGATTGTGA GGATTGATTA TTAA

Protein sequence

MKKLRLAIIG CGSITKHRHA PEAKQNPNVE LVAVCDKNLD HAKAIAEKFK VGNVYDDYEK 
MLKEIKPDAV VVATPNYLHA DATIKALKEG AHVLCEKPMA TTEDECRMMV ETAKEMGKFL 
MIAHNQRLNI AHKKAKEVIQ SGELGKVLSF KTTFGHGGPE SWSSDRPDTW FFHKEAASFG 
AMGDLGVHKI DLMRFLLGEE FVETAAFVTT LSKKYPNGQP IDVDDNAVCI LKTQSGAIGT 
LTASWTYPGS EDNSTVIYCE KGSITLYADP KFSMIIRYAN GQKAYFELDT MQTNERQTKS 
GVVDEFIDCI LTNTPPRISG EEGLKTMKVV FACFESAKTG KIVRIDY