Gene Athe_1140 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Athe_1140
Symbol
ID	7408722
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anaerocellum thermophilum DSM 6725
Kingdom	Bacteria
Replicon accession	NC_012034
Strand	+
Start bp	1234420
End bp	1236084
Gene Length	1665 bp
Protein Length	554 aa
Translation table	11
GC content	38%
IMG OID	643715506
Product	protein of unknown function DUF87
Protein accession	YP_002573014
Protein GI	222529132
COG category	[R] General function prediction only
COG ID	[COG0433] Predicted ATPase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	31
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCAAGTA GTATGTATGA AGAGAACAGA ATTGGCAAAA TCATAGGTGG TTCGTATTCA 
GAAGGTCTTG CAATAAAAGT CGAGGATGAT TCTGTTGTGG AAAGTACAAG GATTGGAGCA 
ATTCTTGTTA GCCAAACAGA AAAGAGGAAG TACTACTGTA TGCTTACCGA CATGGTAATA 
GAGGGCATGA ACAAGCAAGC TTTGACAGAA CTTCCGCGAG GAAACTCAAG CCTGCTTTTG 
AACAGAATTA CAAGGGGGAC TTCAATTTAT ACTGTGTTCA AGGCACAGCC AGTCCTTTCT 
TACGACCTTG AGGAAAAGAA AAATCAGCCT ATAAGAAACA TACCCGTTCA TGCTTCAAGT 
GTTAGAAGAG CTACCTATGA TGATATTTCA GATGTGTTTG GAAGTTTTGA AAAAAGTCCA 
AGACGTTATT TTCCAGTTGG AAGTGTTCTT GACATGGACG AAAGCTCTAC AGTATGCATA 
GACATGGAAA GATTTATTGA ACGAAGCAGT GGCATTTATG GGAGGACTGG TACAGGAAAA 
TCATTTATTG CAAGATTATT GATGGCGGGG ATTATCCTTT GTGATAAGGC ATCGCTTCTC 
ATTTTTGATG CTCACTCAGA CCATGGACCT GACAGCGTTG ATGAGGAAAA CCGTCCTGTT 
AAAGGGCTTA AAAGTCTTTT TGGAAGCAAA GTCCAGATAA TGACAATTGA AAATTCCTCG 
TCAATGGCAG GTGTTTTGCC GATTGAGATT GATGTTAGAG ATGTTGAGAT CGAGGATATT 
TTATCAATTG CAGAAGAGCT AAACCTCAAT GAGACAGCAC AACAGGTTAT GATTGCACTG 
AAAAATAAAT TGGAGACAGA GGGTAAACAC TGGCTTGAAG AGATACTTAT AAATGGTGAG 
GACTTAGCAG AGAGGTTTAA AGACAGCGAA GCAGTTGTTA ACAGAAGTTC GCTTTTGGCA 
CTTATCAGAA AGCTTTCTGT GTTAAAAGAA TTACCCTACC TTAGATATGA TAGACGACCT 
GGTACAAACT CAATTGATAT TATTTTAAAC TATCTTCAAA AAGGTATAAG TGTTGATATA 
ACATTTGGCA AAAGTGATAA ATTACTTAAT TACCTCTTTG TTACAAACGT ATTATCAAGA 
CGTATTTACC AAAGATATAT GGAGATGTAC GAAAGGTATA TCTCAAACAG ACAAAAATAT 
TCTCCTCCAA GGCCACTTGT GATTGCTATT GAAGAAGCAC ACAGATTTTT ATCGCCCGAT 
GTTGCAAAGC AGACAATATT TGGAACAATA GCAAGAGAGA TGAGAAAAGC TAAGGTAAGT 
CTTATGTGTA TAGACCAGAG ACCTTCTCAG ATAGACAGCG AGATTGCATC GCAAATTGGA 
ACAAGGATTA TTTTATCTCT TTCTGATGAA GCTGACATTA CAAGTGCACT TGCTGGTATG 
AAAAATAGTA AACAGCTGAG GGCAATTATA GAGTCGCTTG ATTCGAAACA GCAGGCTTTG 
TTAATAGGTC ATGCAGTTCC TATGCCAATT GCGATAAAAA CGAGGGGGTA TGATAGTAGC 
TTTTATGATT TTGTTTCAAT TTATTTCAAA GAAGATGAAG TGGATGAAAA GTATGAAAGA 
ACTTTAGAGG CATCTAAGAA GTGGCTTGAT GAGATGTGCT ATTAA

Protein sequence

MASSMYEENR IGKIIGGSYS EGLAIKVEDD SVVESTRIGA ILVSQTEKRK YYCMLTDMVI 
EGMNKQALTE LPRGNSSLLL NRITRGTSIY TVFKAQPVLS YDLEEKKNQP IRNIPVHASS 
VRRATYDDIS DVFGSFEKSP RRYFPVGSVL DMDESSTVCI DMERFIERSS GIYGRTGTGK 
SFIARLLMAG IILCDKASLL IFDAHSDHGP DSVDEENRPV KGLKSLFGSK VQIMTIENSS 
SMAGVLPIEI DVRDVEIEDI LSIAEELNLN ETAQQVMIAL KNKLETEGKH WLEEILINGE 
DLAERFKDSE AVVNRSSLLA LIRKLSVLKE LPYLRYDRRP GTNSIDIILN YLQKGISVDI 
TFGKSDKLLN YLFVTNVLSR RIYQRYMEMY ERYISNRQKY SPPRPLVIAI EEAHRFLSPD 
VAKQTIFGTI AREMRKAKVS LMCIDQRPSQ IDSEIASQIG TRIILSLSDE ADITSALAGM 
KNSKQLRAII ESLDSKQQAL LIGHAVPMPI AIKTRGYDSS FYDFVSIYFK EDEVDEKYER 
TLEASKKWLD EMCY