Gene Athe_0568 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Athe_0568
Symbol
ID	7406909
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anaerocellum thermophilum DSM 6725
Kingdom	Bacteria
Replicon accession	NC_012034
Strand	+
Start bp	641172
End bp	642659
Gene Length	1488 bp
Protein Length	495 aa
Translation table	11
GC content	32%
IMG OID	643714951
Product	metal dependent phosphohydrolase
Protein accession	YP_002572467
Protein GI	222528585
COG category	[T] Signal transduction mechanisms
COG ID	[COG2206] HD-GYP domain
TIGRFAM ID	[TIGR00277] uncharacterized domain HDIG

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.17826
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

TTGAAACTAC AAAAGAATTT ATGGATGAGG ATTTTTGAGT TTTTTCTCTT CTTTTTAATA 
TGTTTTCCCC TGGCAGTTCA GGTTGCTGAG ATTTTCATAC ATATTCAAAA ACCTGTCATT 
GAATATCTTA AAATTGTAAC ACTGTTCCTT GCAGTGGCAT TTTTTACAGT ATTTTATATT 
CTCAGATATG GCAGTATATT GAAAAGATAT AGAGTATTTG AGAAAAAACA AAAAGTCATA 
ATTAAAAAGC TAAAAGAGGA AAAAGATAGT ATTGAAAAGA ACTACATTGA TAGTATTCGA 
CTGAACAAAG AAATGACAAA TATTGTAAAG AGATTAATTG AAACAGAAAG GGACTTAAGA 
GAAAAAAATG AATGGTTTAA AAATTTTTTT GAGCTCTCGA CTAAGATTAT TAGTCTTTCG 
AATGTAGAAA ATATAGTTGA GGTTATAGGT GAGTATAGCC ATGGAAGTTT GAAATTTTCT 
CGTATAAGCA TTTATCATGA TGGTGATGAT AAAAAATTCA AAATCTTGGG TCAGTTTGGG 
CAAAAAGATG TTCATGAACA TCTTCTTCTG AGCAGAGCAA AAGAGGATAT TAATATTGCT 
TACAAAATAG TAAATAATAA CTTGGTAAAA GTAGCTATTC CGATTGTTTC AGAAGAGAGA 
TGTGAAGGTA TTTGTTTTTA TGGAATTGAA TGCAAAAGCA CTTCAAGCGA AGATGTTGAA 
TATTATATCA GCCTGTGCAA TTTTATTACT ATAGCCATAA AAAATGCCAT TTATTATTCA 
AATCTCAAAA AACAGAAATC AGAAATAGAA GATTTGTATG AGAAAAGCAC TTACATGAAC 
GAAAGACTGA AAGACACAAT TGAAGAATTA AATAAATCAA AGGCAGAACT TGAAAAGAAA 
AATCAAGAAA TTGAAAGGTT CTTCTATGAA ACAATCTTAT GCTTGTCCAA AGCGATTGAG 
TACAAAGATG TGTATACGAA AGGACATTGC GAAAGAGTGC AAAGTATTGC TTTAAAAATT 
GCTGATGAGC TTTCGCTTTC AGAGGAAGAA AAAAACGTTT TAAAGGTTGC GTGTTTGCTT 
CATGATATAG GAAAGATTGG TGTGAAAGAG GATATACTGA ACAAGAAAGG TTCTTTAGAA 
GATCATGAGT ATAAAGAAAT CCAAAAACAT CCTTTAATAG GTTACAACAT TTTAAAAGAT 
TTAGAGTTTA CGGACAGAAT TAAAAAGGTT GTGCTTCAGC ACCATGAAAG GGTGGATGGC 
AGAGGTTATC CGTTTGGATT GAAAGATGAA GAGATAGACC TTCTTGCAAA GGTTGTAGCT 
GTTGCAGATG CTTATGATGC AATGACTTCT GACAGACCCT ATAGAAAAGC TTTTGATAAA 
CAGGCGGCGT TGAGCGAAAT GAAAAGGTGT GCTGGAAGTC AGTTCGATAC TACTATAGTG 
GAAAAACTGA TTAATTTAGT CCAAAAAGGT TTAGTAATGT TTTTATAG

Protein sequence

MKLQKNLWMR IFEFFLFFLI CFPLAVQVAE IFIHIQKPVI EYLKIVTLFL AVAFFTVFYI 
LRYGSILKRY RVFEKKQKVI IKKLKEEKDS IEKNYIDSIR LNKEMTNIVK RLIETERDLR 
EKNEWFKNFF ELSTKIISLS NVENIVEVIG EYSHGSLKFS RISIYHDGDD KKFKILGQFG 
QKDVHEHLLL SRAKEDINIA YKIVNNNLVK VAIPIVSEER CEGICFYGIE CKSTSSEDVE 
YYISLCNFIT IAIKNAIYYS NLKKQKSEIE DLYEKSTYMN ERLKDTIEEL NKSKAELEKK 
NQEIERFFYE TILCLSKAIE YKDVYTKGHC ERVQSIALKI ADELSLSEEE KNVLKVACLL 
HDIGKIGVKE DILNKKGSLE DHEYKEIQKH PLIGYNILKD LEFTDRIKKV VLQHHERVDG 
RGYPFGLKDE EIDLLAKVVA VADAYDAMTS DRPYRKAFDK QAALSEMKRC AGSQFDTTIV 
EKLINLVQKG LVMFL