Gene Athe_2056 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Athe_2056
Symbol
ID	7408269
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anaerocellum thermophilum DSM 6725
Kingdom	Bacteria
Replicon accession	NC_012034
Strand	-
Start bp	2171070
End bp	2172833
Gene Length	1764 bp
Protein Length	587 aa
Translation table	11
GC content	31%
IMG OID	643716423
Product	putative sensor with HAMP domain
Protein accession	YP_002573906
Protein GI	222530024
COG category	[T] Signal transduction mechanisms
COG ID	[COG2972] Predicted signal transduction protein with a C-terminal ATPase domain
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	30
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAATAT GGCTGACAAA CCTTAAAATG CGTAAGAAGT TCATATTAGC ATTTATCATA 
TCAGCTTTTA TTCCCCAAAT TGTTTTGGGG ATTATTCTTT TTTTAAATCT TCATGCTATA 
GCACTGGAAA ATGCTATAAA CAATACAAAA AGAAATGTTC AGGACGTGAA GAAAAACCTT 
TTAGATGTTT TGCAAAATGC TGTAGATATT TCAAATAAGC TTTATCTTGA CAAAAAGCTT 
TTAGACATCC TTTCTACTGA ATACAGTGAT GTTTCAAAAT TATATGAAGA TTATACATCG 
TATAAAGAGT TTTCGAACTT GCTTTCTATT TATAATAAGA ATATTCATCT CATAAAAGTC 
TATACTTTCA ATCCAACATT ACTTGACACT GGGGAATTTG TAAAGGTAGA TAACTATATT 
AAGAAACAAA GATGGTTTAT CCACGCTTTA AAAGAGGACG GTAAAATATT ATGGGAGCTT 
ATATTTGACA ACAGCCCATT CAGACCTCAG TATTATTTTA GTTTGGTGAG GTTACTTAAA 
AATTCTTATG GCGAAAAAGT CGGAGTGATG GTAATTTACA TAAAAAAAGA GAAAATTGAT 
GAGATTCTTT CTCAAAATGA AAATACAATT GTTGTTACAG ATAAAGGAAC TGTAGTTGCA 
GCAAAAGATG AAAGTTTGAT TGGTAAAACA ATAGATATCA AAGCTTTTGA GGATGGCGAT 
AGATTAATAG AAAATGTGAA AATAAATCAG AGAAATCTTA TGGCTCTTGT TGGAACTATT 
GCACCAAATG AGACGGGAGG GAATTATCTA AAGGTTATTT CTTTCTTCTC TAAGAAGGAG 
ATTTTTAAAG TACCAAATAA GGTTTCATTT TTTGCTTTTG TGGTGATTAC AGTAAATTTA 
TTAATTTCGT TATTTCTGAT GCTTCTTTTT TCAAAGTTAA TTACTGATAG ACTAACTATA 
TTAAACGAAA AGGTAAATCA AATTTCTCAC GGAAAACTTG ATACCAGCAT AGAGATTTTG 
GGGAAAGACG AAATCGGACA GCTTGCAGAA AATGTCAAAG AAATGGCAAA AAATATCAAA 
AATCTTATTG AACAGGTTTA TTTAGCCGAG ATTCAAAAGC AGCAAATGAT CACCAAACAA 
CGAGAGATTC AGTTTGAGAT GCTCTGCAGC CAAATAAATC CCCACTTTAT ATTCAATACT 
CTTGAGGCTA TTAGGATGAA AGCATTTTGT AGTGGGCAAG AGGAAATTTC GCACATTGTA 
TATCTTCTAA GTAACTTATT AAGAAAAAGC ATAACAGTAA GTTCAGAGCT GATTTCACTA 
AAAGAGGAAA TTGAATTTGT TCAACAGTTT TTGGAGATTC AAAAATTCAG GTTTGGTGAT 
AGGATAGATT TTGATATTCA GATAGATGAA GACCTTTTCA ATCAAAAGAT ACTACCTTTT 
ATAATTCAGC CTCTTGTAGA GAATTCAATA AAACACGGAA TCGAACCGAA AGTTGGAAAG 
GGTTATATTA GTATCAGAAT TTTCAAAAGA GATGAAAAAA TTGTTATTAG AGTTGAGGAT 
AATGGAATCG GAATGAAAAA AGAGGAATGT GATAACTTAA TAACCTTACT CAAGTCAGAC 
CAAAAAGATG CTCATGTAGG TCTTAGAAAT GTATACACAA GATTGAAATT GTTTTATGGT 
AATGAATTTG AGTTTTTAAT CAAGAGTGAG TATGGAAGTG GAACAGTGGT TGAAATAACT 
GTTCCAAGCA AGGGTGGTGA ATAG

Protein sequence

MKIWLTNLKM RKKFILAFII SAFIPQIVLG IILFLNLHAI ALENAINNTK RNVQDVKKNL 
LDVLQNAVDI SNKLYLDKKL LDILSTEYSD VSKLYEDYTS YKEFSNLLSI YNKNIHLIKV 
YTFNPTLLDT GEFVKVDNYI KKQRWFIHAL KEDGKILWEL IFDNSPFRPQ YYFSLVRLLK 
NSYGEKVGVM VIYIKKEKID EILSQNENTI VVTDKGTVVA AKDESLIGKT IDIKAFEDGD 
RLIENVKINQ RNLMALVGTI APNETGGNYL KVISFFSKKE IFKVPNKVSF FAFVVITVNL 
LISLFLMLLF SKLITDRLTI LNEKVNQISH GKLDTSIEIL GKDEIGQLAE NVKEMAKNIK 
NLIEQVYLAE IQKQQMITKQ REIQFEMLCS QINPHFIFNT LEAIRMKAFC SGQEEISHIV 
YLLSNLLRKS ITVSSELISL KEEIEFVQQF LEIQKFRFGD RIDFDIQIDE DLFNQKILPF 
IIQPLVENSI KHGIEPKVGK GYISIRIFKR DEKIVIRVED NGIGMKKEEC DNLITLLKSD 
QKDAHVGLRN VYTRLKLFYG NEFEFLIKSE YGSGTVVEIT VPSKGGE