Gene Athe_2018 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Athe_2018
Symbol
ID	7408230
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anaerocellum thermophilum DSM 6725
Kingdom	Bacteria
Replicon accession	NC_012034
Strand	-
Start bp	2128594
End bp	2129967
Gene Length	1374 bp
Protein Length	457 aa
Translation table	11
GC content	33%
IMG OID	643716385
Product	hypothetical protein
Protein accession	YP_002573869
Protein GI	222529987
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	31
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCCTTATA AAGGTGAATT TTCGAACAAA ATAATGCATG AGCGCTTGAT TAAAAATCCT 
GAATTTCAAA AGAGACTTAA AGAGTTAAGA GTGGCTTATG ATACTCCAAA TAGAGACATA 
ACCTCGGAAA TTAGACAAAT GTTTAGAATA ATCGATACTG AAGATGCTTC AAAAAACGTG 
AAAATCGTTT TTGCGGTAGA TGGATCATAT ACTGACATTC CCATAAACAA CAATATTCCT 
TCTGCAAGAA TAGGTATTGC TAACTTTTGT GCATCAGTTG TTAAGTTAGA TGAATTAAAA 
AAAAGTGCTC AATATGAATT TCTAGATCCC CACGAATTCA ATGACACTTA CACTACTGGT 
TTACTTACTT TTGTTGGTCC TCTTGCTAAT ATAATTGAAG AGGGTAAAAC TACAACATCT 
CAATCTATTC GCTATGCAAT TTATAAATTC ATGTGCAACA AACCATTCGA TGAAACATTA 
CCTTTAATTA ACACACTCTA TACAATTTTA AAAGAAGGTA ATGACAAAAC TGTTGAATCA 
TTTAATTGTC CAAATCCAGA GTGTAACGAA CACATTGAAT GGGACTTAGA AAAAGACAAT 
ATTAATCCAA AAAAATGTCC TGGGTGTGGG GAAGAGGTGT ATTTAACTGA TTGGTTACGA 
CTGCATGAAG CAGTTGAAGA AGATTTTGAA AGCACCTCAA TACTTTCGCG CTTAACGCAA 
GTTGTGGAAC ATTTACTCGT ATTTAATCTT ATTCAGACTT GTTTAAGTAA CCAAACATTA 
GTTTCTCTAC CTTTTTCAAT GGCCTTTATT TTAGATCGTC CATTGGCAAT ATACGGCGAA 
CCAGCAAAGT TACATAGATA TATTTTGAAA TATTACCATA AGCTGATGCA AAACAAAAAT 
ACTCCTTTAA TAATTTTTGG ATTAGCTAAA AGCGGCAGAC TAAAAGACCA CTTTGAACTG 
CTTGAAAGGA GAATGAAAGA AATAGGAGAA GAGATTCCTA AAAATGCAGT TATGTTAGTA 
AGTGATGCAT ATAGATTTAA ATATATTCAG CAAAGACCTA AGCGAAATGA ATATTTTGGT 
CAAGAAATTA GCTGGGGACA GGATTTTTTG TTCTATTCTA AGGAAGCCAA AAAATTTGTG 
GTTTCTCTAC CTTATTCCGT CGATGAGAAA AAGAAAGAAT ACTATGAAAA AATGATTTTC 
AATATTGATT CATACTCAAC ACTTCCCACT GTTTTGGATT TGATTAATAA GATAACTACT 
GACTTATACG AAGATGCAAT ATTGCCTGTT GCGTTAGCCC ATCGTTATGC TTCTATTAGC 
TTAAAACCGA GCAAACAAAT ATTGGAGATG TTTGCCAGAG AGCTTATAAA ATAG

Protein sequence

MPYKGEFSNK IMHERLIKNP EFQKRLKELR VAYDTPNRDI TSEIRQMFRI IDTEDASKNV 
KIVFAVDGSY TDIPINNNIP SARIGIANFC ASVVKLDELK KSAQYEFLDP HEFNDTYTTG 
LLTFVGPLAN IIEEGKTTTS QSIRYAIYKF MCNKPFDETL PLINTLYTIL KEGNDKTVES 
FNCPNPECNE HIEWDLEKDN INPKKCPGCG EEVYLTDWLR LHEAVEEDFE STSILSRLTQ 
VVEHLLVFNL IQTCLSNQTL VSLPFSMAFI LDRPLAIYGE PAKLHRYILK YYHKLMQNKN 
TPLIIFGLAK SGRLKDHFEL LERRMKEIGE EIPKNAVMLV SDAYRFKYIQ QRPKRNEYFG 
QEISWGQDFL FYSKEAKKFV VSLPYSVDEK KKEYYEKMIF NIDSYSTLPT VLDLINKITT 
DLYEDAILPV ALAHRYASIS LKPSKQILEM FARELIK