Gene Athe_2078 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Athe_2078
Symbol
ID	7408787
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anaerocellum thermophilum DSM 6725
Kingdom	Bacteria
Replicon accession	NC_012034
Strand	+
Start bp	2198955
End bp	2199944
Gene Length	990 bp
Protein Length	329 aa
Translation table	11
GC content	35%
IMG OID	643716445
Product	oxidoreductase domain protein
Protein accession	YP_002573928
Protein GI	222530046
COG category	[R] General function prediction only
COG ID	[COG0673] Predicted dehydrogenases and related proteins
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAATTT GCATAGTAGG CAGTAGTGGA CACTATGTAT ATGCTTTAAG AGGAATAAAA 
GAAGACCCTC ATGCCCAAAT TGTGGGAATC TCTCCTGGAT GTGAAGGAGA GAATATTGAA 
AGGTTACATT CTCAAGTAAA TGAAATGGGA TTCACACCTG TGGTTTATAG CAATCCTATA 
AGGATGTTTG AAGATCTCAA ACCTGACATT GCTGTGATTA ATACATTTTT TTATAAAAAT 
TCTGAGCTTG CAATTGAGGC TATGAAAAGA GGAATCCACG TATATATGGA AAAGCCTGTT 
GCACTATCAA TAGAAAAACT TGAAGAACTA AAGAGTGTGT GGAGGCAAAC AAAAGTAAAA 
CTCTCATCAA TGCTGGGATT GCGCTATACA CCCCATTTTT GGACTGCTTA TAAACTTATA 
AATGAAAACA AGATAGGTAG AATAAGACTG ATACATGCCC AAAAATCTTA TAAACTTGGA 
ACTCGACCTG ACTTTTATAA ACATAGAAGA ACATATGGCG GAACAATTCC CTGGGTTGGC 
ATTCATGCTA TTGATTGGAT TTATTGGCTA AGTGGCAAGA AATTTAAATC GGTCTTTGCA 
GGACATTCAA AACTTTATAA TAATGATCAT GGTGAGCTTG AATCTACTGC TTTTTGTAGT 
TTTGTAATGG AAGATGAGAT TTTTGCAACG GTGAACATTG ACTATCTGCG TCCTGCTACT 
GCCCCTACTC ATGATGATGA TAGAATTAGA ATTGTGGGAA CAAGAGGAAT TTTTGAAGTT 
TTAAATGGAA AAGTTTTCTT GCTAAATGAT ACCACTAAAG AGATCTCAGA AGTCTCTTTA 
GAAAAACCAC CTATTGTGTT TTTAGATTTC TTAAATGAGG TAAGAGGTAC AGATAAGTGC 
TTAGTTAGTA GCGAGGATAG CTTTTATGTA ACCTTTGCTT CGCTTTTAGC AAGGCAGTCT 
GCTGATGAGG ATAAGGTAAT TGAATTTTAA

Protein sequence

MKICIVGSSG HYVYALRGIK EDPHAQIVGI SPGCEGENIE RLHSQVNEMG FTPVVYSNPI 
RMFEDLKPDI AVINTFFYKN SELAIEAMKR GIHVYMEKPV ALSIEKLEEL KSVWRQTKVK 
LSSMLGLRYT PHFWTAYKLI NENKIGRIRL IHAQKSYKLG TRPDFYKHRR TYGGTIPWVG 
IHAIDWIYWL SGKKFKSVFA GHSKLYNNDH GELESTAFCS FVMEDEIFAT VNIDYLRPAT 
APTHDDDRIR IVGTRGIFEV LNGKVFLLND TTKEISEVSL EKPPIVFLDF LNEVRGTDKC 
LVSSEDSFYV TFASLLARQS ADEDKVIEF