Gene Athe_1989 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Athe_1989
Symbol
ID	7408203
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anaerocellum thermophilum DSM 6725
Kingdom	Bacteria
Replicon accession	NC_012034
Strand	-
Start bp	2098642
End bp	2100459
Gene Length	1818 bp
Protein Length	605 aa
Translation table	11
GC content	37%
IMG OID	643716365
Product	Superfamily I DNA and RNA helicase and helicase subunits-like protein
Protein accession	YP_002573849
Protein GI	222529967
COG category	[L] Replication, recombination and repair
COG ID	[COG1112] Superfamily I DNA and RNA helicases and helicase subunits
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.0620689
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGGGTGATG TAAATTCTGT CAATTCCGCT TTAAAAAACT TCAATATTGT AGTTGCTTCT 
GCCAACAACA AAGCTGTGGA AAATGTCACC AAAGAAATAC CAGTTCTAAA TTCAGTTGAC 
CAATCCTGTC TTGAAAAATA TGAACTCCAT TATTTCAAAG ATGGAGCCGA ACTGGTATAC 
GACTACAGAG GGGAAAACAA TGAAAGCAGT GAGAAAACTG AATCTTTAGT ATCAGTTGAA 
AATGGGCAGC AATGCTGGGC ATTGATTTCA GCAGTTTTGG GTAAAAAAGA AAACAGAGAA 
AAGTTTTTCA GTGCTCTGGA AAAGTATATT AATGAATTAT TTTCTTCTAT ACCGCCAGTC 
AAGTGGGAAC AGTGTAAAAG AAGTTTCAAT CATGTCTTCA AGAAGTTTAG ACATGTCCAG 
AAACTTTACA GGACTATGGA ACTTTTTCTG AAACTCGAAG AAAACAGGTT TAAATTTACC 
CGTATGATAG CTGCTGCGGG GAAGATTTGC CTAAAAAAAT TTTTTGCCAG ATATTTTCCC 
GATGACATGA AACTTCCTTC CTCAGAGTTC TGGTCCCAAA ATGAGCACGA AATTCACAAA 
TCATCTCCAT GGATGAGCAG GTATCTCAAT GATATACGCA ATGAAGTTTT TGCAAGAGCT 
CTTCAGTTAC ATCAGGCAGC TATTGCTGCA AACAAAGAGA AGTTCGGGGA GAATTTAGAA 
AAATTCATTA AATATATGAG AAAAAACGAA TCACTGCCTG CAGAAAAGGC AAAAGAACTG 
TGGCATACTT TCTTTATGAT TGTTCCAGTT GTCTCAACAA CATTTGCGTC GCTGAGCAAT 
ATGTTTAAAG ATGTTGACGA CGAAATCATT GACTGGCTGA TTGTTGATGA GGCTGGGCAG 
GCACTACCCC AGCATTTTAT CGGCGCACTC CTCAGAAGTA AAAGAGCAAT AATAGTGGGA 
GACCCTCTAC AAATTCCACC TGTTGTTAAA ATACCACCAT TTGTTATTAA TGATGTGTTC 
AAAGCATATG GGATTTTCAA ATGGAGACAG GAAGACAGTA ATTCCAGTAC ACCACGTATA 
ACTGAAACTG ATTCCGTACA AATTGTAGCC GATAGAGCCA ACAAATTCGG TGCAAAGATT 
GGCGATATGT GGGTTGGGTG TCCTCTGAGA GTACATAAGC GTTGTACGGA ACCAATGTTT 
ACAGTAGCGA ATAGAATTGC TTATAAAAAC CTTATGATTT TTGATGTGAA TAAACCTGAA 
GGATTGCAAA CTGTTTTTAA AGATAGCTTC TGGGTAGATG TAAAGGGTAA GTGTGTTTAC 
AAGCATTATG TAAGAGAACA GGGAAAAGTA GTGAAAGCTA TCGTACAAGA ATTTTTGCAG 
CGAACCTTGA CAACTCAAAA TGAGGTTAAA TTAACAGAAG AGCTTTTTAT CATTTCGCCT 
TTTAAAGCAG TCAAAAGTAG TATATCTTCT ATACTGAAAA GAATGCCTCT GTATAACACA 
AATTTAAAGA AAGAAGAATG GGAGAATATA GTTAATGAAA TAGTTGGCAC AATTCACAGT 
TTTCAGGGCA AGCAAGCCAA CAATGTAATC ATATGCCTTG GTGCCGATGA AAGTAATGAA 
GGAGCTGTAA GATGGGCATC TTCAGAACCG AATATTTTAA ATGTGGCGCT GACCAGAGCT 
AAATATAGAG TCATAGTAAT AGGTGATAAA GACCTGTGGG GAAAGCATAA ATATTTTGAT 
ACACTCTTAG AAGAACTAGG TGAAAAAGTG ATTGAGTATA CCACAGAAAA AGATCTGGTC 
AACAAGATTT TTGCTTAG

Protein sequence

MGDVNSVNSA LKNFNIVVAS ANNKAVENVT KEIPVLNSVD QSCLEKYELH YFKDGAELVY 
DYRGENNESS EKTESLVSVE NGQQCWALIS AVLGKKENRE KFFSALEKYI NELFSSIPPV 
KWEQCKRSFN HVFKKFRHVQ KLYRTMELFL KLEENRFKFT RMIAAAGKIC LKKFFARYFP 
DDMKLPSSEF WSQNEHEIHK SSPWMSRYLN DIRNEVFARA LQLHQAAIAA NKEKFGENLE 
KFIKYMRKNE SLPAEKAKEL WHTFFMIVPV VSTTFASLSN MFKDVDDEII DWLIVDEAGQ 
ALPQHFIGAL LRSKRAIIVG DPLQIPPVVK IPPFVINDVF KAYGIFKWRQ EDSNSSTPRI 
TETDSVQIVA DRANKFGAKI GDMWVGCPLR VHKRCTEPMF TVANRIAYKN LMIFDVNKPE 
GLQTVFKDSF WVDVKGKCVY KHYVREQGKV VKAIVQEFLQ RTLTTQNEVK LTEELFIISP 
FKAVKSSISS ILKRMPLYNT NLKKEEWENI VNEIVGTIHS FQGKQANNVI ICLGADESNE 
GAVRWASSEP NILNVALTRA KYRVIVIGDK DLWGKHKYFD TLLEELGEKV IEYTTEKDLV 
NKIFA