Gene Athe_1239 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Athe_1239
Symbol
ID	7409713
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anaerocellum thermophilum DSM 6725
Kingdom	Bacteria
Replicon accession	NC_012034
Strand	+
Start bp	1328364
End bp	1329488
Gene Length	1125 bp
Protein Length	374 aa
Translation table	11
GC content	38%
IMG OID	643715604
Product	oxidoreductase domain protein
Protein accession	YP_002573112
Protein GI	222529230
COG category	[R] General function prediction only
COG ID	[COG0673] Predicted dehydrogenases and related proteins
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGAGAAGT TAAAAATTTG TCTTGTTGGG TGTGGGAGAA TATCATTCAA ACATGCTGAG 
GCTTATGCTA ACAACTATGA CCAGCTTGAG GTTGTGGGTT TTTGTGACTT AGATAGCCAA 
AAAGCTTTGA GGACAAGACA AAAGTATTAT GAACTGCTTG CAACCAAAGG AATTGAAATA 
AAAAAGGATA TACCCATATA TACAGATTAT ATAAAGATGT TAAAAGAACA AGAATGTGAC 
ATAGTTGATA TAGCGACATA CAGTGGCTGC CATGCTGAGC AAACACTTGT TGCTTTAGAT 
TTTAACAAGC ATGTGATTGT AGAAAAGCCT ATGGCACTTT CGATAGAAGA TGCAGATTTG 
ATGATTAAAA AAGCAAGAGA AAAGAAGAAG GTACTTAGTG TATGTCTGCA AAACAGGTTT 
AACAAAAGTG TGCAAAAACT TAAAAGTACT ATTGATAGTG GCAAATTCGG TAAGATACTG 
TACGCCGTTG CAAGCATTAG ATGGAATAGG AACGATGAAT ATTACAGGCA AGATAGCTGG 
AGAGGAACAT GGGAACAAGA TGGCGGTGCA CTTATGAACC AATGCACCCA CAACATTGAC 
CTTTTGCAAT GGATAATAAG TTCTGAGGTT GACGAGATTT ATGGTGACAT AGAAACATTT 
TTAAGACCTA TTGAAGCAGA GGATACAGGC TTTGCCATCT TGAAATTCAA AAGTGGAGCA 
AGAGGTATTG TTGAAGGGAC TACATGTGTT TGGCCTTCAA ATTTGGAAGA GACGCTCAGT 
GTATTTGGTC AAACAGGAAC AGCAGTGCTT GGTGGTACAT CGGTTAACAG AATTGTTGTG 
TGGCGTGTGC CTGATGAGGA TGAAAAAGAG GCTTTAGAAA AGTTTACCGA AAATCCAGAC 
AATGTATACG GGTTTGGTCA CACTCCTTTT ATCAAGAATG TTATTGAAGC CATCAAAAGA 
GGAGAAAATC CACTGGTAAC TGGAGAGGAA GGTAAAAAGT CGCTTGAGAT AATCCTGGGT 
ATTTATAAAT CTGCAATTGA AAAAATACCA ATAAAACTGC CACTTACTAA CTTTTCGACA 
ATGGATATGA AAAAAGCTTA TGAAAGGCAG AGGTTGGTAA GATGA

Protein sequence

MEKLKICLVG CGRISFKHAE AYANNYDQLE VVGFCDLDSQ KALRTRQKYY ELLATKGIEI 
KKDIPIYTDY IKMLKEQECD IVDIATYSGC HAEQTLVALD FNKHVIVEKP MALSIEDADL 
MIKKAREKKK VLSVCLQNRF NKSVQKLKST IDSGKFGKIL YAVASIRWNR NDEYYRQDSW 
RGTWEQDGGA LMNQCTHNID LLQWIISSEV DEIYGDIETF LRPIEAEDTG FAILKFKSGA 
RGIVEGTTCV WPSNLEETLS VFGQTGTAVL GGTSVNRIVV WRVPDEDEKE ALEKFTENPD 
NVYGFGHTPF IKNVIEAIKR GENPLVTGEE GKKSLEIILG IYKSAIEKIP IKLPLTNFST 
MDMKKAYERQ RLVR