Gene Athe_2019 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Athe_2019
Symbol
ID	7408231
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anaerocellum thermophilum DSM 6725
Kingdom	Bacteria
Replicon accession	NC_012034
Strand	-
Start bp	2129997
End bp	2132099
Gene Length	2103 bp
Protein Length	700 aa
Translation table	11
GC content	31%
IMG OID	643716386
Product	protein of unknown function DUF87
Protein accession	YP_002573870
Protein GI	222529988
COG category	[R] General function prediction only
COG ID	[COG0433] Predicted ATPase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGACATGA GAAAAGTAAT AAATGAAATA AGTAAGGAAA GCGAAGTGGT AAAACAACTT 
CTTAACATTG TTCAAAATGC TAGGTTTATT GGTTATGCTA TTGATGTTTC TTACTCCTTC 
ATGACTGTTC TTACAAATGA TGCATGGAAA GAAAGAGCAA ATGGTTTGCC ACACAATAGC 
TTTTTATTTG CCGCTTCACC AAGATGGTTG ATTTATGACA AGGACACAAA TGATTTTAAC 
ATTGATCCCA CCAAAGAAAT ACCAGAGATT ATATTACTCC GTGTGACAGA AGAATATGAA 
TTACCGAATG AGGATGTTTG GTTAATGGCT AAAATTGATA AATTTAAGAA CGTAGGAACT 
CGTGAATTAA AAGAGGATTT GAGTTTTGAT GATTTTTCTC GAAATGAAAT ACAATATGCT 
GGCTTAAAAT GCCGAATTCT TGGTACATTC TATCCTTCTG AGAATAATTC ATTGGAATTT 
GGCTCTGATT TGGAAAATTA CTATGGTGCA AAAATTTTAT TTGTTTTTAA ACCTTCAAAT 
GAAGGTTTAG AAAGCATTAT AAATTTTGCT GTTATGAAAA AACAAAATGA AGTTCTCCAA 
AATGCGTCTT TAGTTCCAAT TGGTTATGTT CGATATACTT CTACATGTCG TTTACAAAAT 
CAAGAACCTT CTAAAGCACG AGTATACATC AATCTTGATG ACTTTATTAA AAGGAGAACA 
GCATTATTCG GTATGACTCG AACGGGAAAA TCAAATACTG CTAAAATTTT AATTAAAGCT 
ATTCGCGAAG CTGCTCAGAA GTCTGGACTA AAAGTATCCC AAATAATTTT TGATATTAAT 
GGTGAATATA TATATCCTAA CAAACAAGAT GAAAATAAGT CAATTTCTGT CGAGATAGAA 
AATTGTTTTG TTTTAACTCT AAATCCGAGA GCTCTAAGTA GTGAAAATCA AGAAATTCAA 
CCGTTAAAGT TTGATATGTT AAAGAATTTA AGTCTTGCCC ATGAACTTAT TCGGGCATTA 
GCAGAAAAAG AAGGAGCATT AAGTTATTCA ACAGACGCAC AAGCATTCCT TAACGTTGAT 
ATTAGCGCAT ACGAATATGA TTTAAAAAAT GGACAGCCTG AAGAAAAGAA AAGGGCTAAA 
AGAATACTTG AAGTTTACAA ATTAATTTTG GCAAAAAGTT TAGATGAACC AAATGTTGAA 
TTTGATAAAA ATGTTTTTGG TCAGACAGTA TATTCCGAGA TGGAAAATAT TCTTAGTAGT 
ACAGATGATA ACCAAGATGA AAAAGGTAGA ATAAAACAGG ACCTAAAAGA AAGGTTGGAA 
CGTTTGCAAC GTCTAAGAGA TATAACAAGA AAGAGCAGTT TCACAATAGA TGAATTTGAC 
TTTATTTTGG ACACAATCCA TTTCATTTGT ACCAAGTTAG GTAAAAACAT AAAAACCTCT 
AGCGGAAACA ATCTTTACCG AGGTGATTTT GAAACACTTG TAAATTTCGC TGTAAGACGA 
AATTCTTCAG GACAAACTAT TCTTGGTTAT TCTTTACTGC GAAAAATTCA AATAAAAGAT 
TATCACCAGA AAGATAAAAG CAATTATATT CAAACGATAA TTGAAAAAGT TAGGAATGGA 
GATGTTGTTC TAATAGATAT GGTTTACGGT AACGAACGAA TGAGAAAAAT TATAAGTTCT 
AAGATTGCTT ACGAAATATT TAACTACAAT CAGCAAATTT TCACAAGAGC AGAAGAACCA 
CCATACGTCA TTTTTTACAT TGAGGAAGCC CATAATTTAA TTGGCAAAGA CATGGATGTT 
ACAGATATAT GGCCAAGAAT TGCAAAAGAA GGTGCTAAAT ATAACATAGG TCTTGTCTAT 
TCAACACAAG AACCATCAAC TATAAACAAG AATATTCTTG CAAATACTGA AAACTGGTTT 
GTTACACATT TAAATAATGA AGAGGAAATT AAAACTGTTG CCAAATATTA TGATTTTGCT 
GACTTTAAAG AATCTATTTT GTTAGCGAAG GATGTGGGTT TTTGTAGAAT GAAAACTTTA 
TCTTCTCCTT TTGTTTGTCC TGTTCAAATT TATAAATTTT CAGATTTTAC ATTAAATAGA 
TAG

Protein sequence

MDMRKVINEI SKESEVVKQL LNIVQNARFI GYAIDVSYSF MTVLTNDAWK ERANGLPHNS 
FLFAASPRWL IYDKDTNDFN IDPTKEIPEI ILLRVTEEYE LPNEDVWLMA KIDKFKNVGT 
RELKEDLSFD DFSRNEIQYA GLKCRILGTF YPSENNSLEF GSDLENYYGA KILFVFKPSN 
EGLESIINFA VMKKQNEVLQ NASLVPIGYV RYTSTCRLQN QEPSKARVYI NLDDFIKRRT 
ALFGMTRTGK SNTAKILIKA IREAAQKSGL KVSQIIFDIN GEYIYPNKQD ENKSISVEIE 
NCFVLTLNPR ALSSENQEIQ PLKFDMLKNL SLAHELIRAL AEKEGALSYS TDAQAFLNVD 
ISAYEYDLKN GQPEEKKRAK RILEVYKLIL AKSLDEPNVE FDKNVFGQTV YSEMENILSS 
TDDNQDEKGR IKQDLKERLE RLQRLRDITR KSSFTIDEFD FILDTIHFIC TKLGKNIKTS 
SGNNLYRGDF ETLVNFAVRR NSSGQTILGY SLLRKIQIKD YHQKDKSNYI QTIIEKVRNG 
DVVLIDMVYG NERMRKIISS KIAYEIFNYN QQIFTRAEEP PYVIFYIEEA HNLIGKDMDV 
TDIWPRIAKE GAKYNIGLVY STQEPSTINK NILANTENWF VTHLNNEEEI KTVAKYYDFA 
DFKESILLAK DVGFCRMKTL SSPFVCPVQI YKFSDFTLNR