Gene Athe_2372 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Athe_2372
Symbol
ID	7407791
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anaerocellum thermophilum DSM 6725
Kingdom	Bacteria
Replicon accession	NC_012034
Strand	-
Start bp	2521508
End bp	2523295
Gene Length	1788 bp
Protein Length	595 aa
Translation table	11
GC content	32%
IMG OID	643716736
Product	histidine kinase internal region
Protein accession	YP_002574215
Protein GI	222530333
COG category	[T] Signal transduction mechanisms
COG ID	[COG2972] Predicted signal transduction protein with a C-terminal ATPase domain
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATAAGAA AAAATGGAGT TTATAAAAGC AAGATTTTCA AAAAGAATTT TGTGCAGATA 
GTTATTGTTC CCATTGTGAT AATAACTATT CTTGGGCTTT TCTCATGCAT CATTATAGAA 
CAATACGTTA AAAATGAAAT AAACAAAAAT TTAGAGACAA TGCTAATACA AAGCAAAAAC 
AATGTCGAGC TTATGCTCGG TGAGATAGAC TATCTTTATA TGGTATTTGG GATAAACAAA 
GATGTGACCC TTCAGATAAA GAGGATTTTG AACTCAATGT ATTTTTCTTT AGAAGATATC 
TGGCAGATTA ACATGGTCAA AAATGTTTTA AATTCAATCT CATATTCAAA GCCGTTCATA 
CATTCCATCT ATGTTTATTT CGAAAATCCT GAAGGGAATT TTATAGTTAC CCCAGATGGA 
ATGACTAATT TTCAGTATTT TTATGACAAA TGGTGGTTTG ATCAGTATAA AGAAAATAAA 
GCATTAATGT GGGTAGAGAG AAGAAAAATT CAACCTTACA ATTTTACTGG AGAATCAATT 
GATGTTTTGA CCATCTACAA AAGGATAAAA TCTGCATATT CTGATGTGAA TGAGGGTGTT 
ATTGTTCTTA ATCTGTATTA CGACCAGGTA AAAAAGCTCT TAAGCCTTAA AAGTTCGCTC 
CCTCAGCATG CAATGTACAT ATTAGATCAA AATGGAAATG TTTTGGTATC AAATGAATCA 
GATAACTCTA ATACCTCAAG TATGGCCCTC CTAAAAAAAG AAACAGACAA CTATCTCACA 
AAAAGATTAG AGTCAAAAAA ATACAACTTA ACCTTTGTTT CAGTAATTCC CAAAAATTAT 
CTTTACAGCA TCCCTATCAG ACTTTTCAAG GTGACACTGG TGCTACTTTT AATTTTTATA 
GTTATCGCTT TTGCTGCCTC ATACTACATT GCCAAAGTAA ATTACAGGAA TATTAAAAAG 
ATTATAGATA CAATAAATTC AGCAACAGAA GGAAAACCAC CAAAAGAAAT TAAAATTACT 
TCAAATGATG AATATGGGTA TATCATGTAC AATGTAATCA AGAACTTTAT TGAAAAACAT 
TATCTGACAA CACGCCTTCA AGCTTTGGAG CTTTTAGCAT TGCAGGCTCA GATTAACCCT 
CATTTTCTTT TCAATACTTT AGAACACATA TATCTTAAAA CTTTAGCACT TACAGGCACC 
CCAAACGAGA TTACAAAAAT GATAGAAAAC CTTTCGGCTA TACTCAAATA TTCTCTGAGC 
AATCCAAAAA TTACTATCTT CCTAAGGGAA GAAATTAAAG CTACACAGGC ATATATTGAG 
CTTGTAAAAG CAAGATATAA AGATAAGTTT GATGTGTTTT GGGACTATAG TGAAGATGTG 
CTTGAGATAA AAGTGATGAA GCTTTTATTC CAGCCGCTCA TAGAAAATTC AATCTATCAT 
GGGATAAAAC CTTGCGAAAA GAGATGTGGA ATAAAAATCA GGATAAGAAA ATTAAAAGAT 
ACCAGTGATT GGCTTTGTAT ATGGGTAATT GACAATGGAA TTGGGATGAG CAAAGAAAAG 
TTAGAGGAGG TACAAGGCAG GCTTTCACAG GATTTTGACT TTTCAGATCA TATTGGGCTT 
TTAAACACCA ATGAAAGGTT AAAGCTCAAC TATGGGGGTA ACTTTAAACT CAAGGTTTGG 
AGCAAGCTGG GTTTGGGGAC AATTGTAAAA ATAATTCTTC CTGTGAATTT TGAGGACCGA 
AAGGAGAATG AAATAGATGC TAAAAAGACA GGATATTTAT ATCCGTGA

Protein sequence

MIRKNGVYKS KIFKKNFVQI VIVPIVIITI LGLFSCIIIE QYVKNEINKN LETMLIQSKN 
NVELMLGEID YLYMVFGINK DVTLQIKRIL NSMYFSLEDI WQINMVKNVL NSISYSKPFI 
HSIYVYFENP EGNFIVTPDG MTNFQYFYDK WWFDQYKENK ALMWVERRKI QPYNFTGESI 
DVLTIYKRIK SAYSDVNEGV IVLNLYYDQV KKLLSLKSSL PQHAMYILDQ NGNVLVSNES 
DNSNTSSMAL LKKETDNYLT KRLESKKYNL TFVSVIPKNY LYSIPIRLFK VTLVLLLIFI 
VIAFAASYYI AKVNYRNIKK IIDTINSATE GKPPKEIKIT SNDEYGYIMY NVIKNFIEKH 
YLTTRLQALE LLALQAQINP HFLFNTLEHI YLKTLALTGT PNEITKMIEN LSAILKYSLS 
NPKITIFLRE EIKATQAYIE LVKARYKDKF DVFWDYSEDV LEIKVMKLLF QPLIENSIYH 
GIKPCEKRCG IKIRIRKLKD TSDWLCIWVI DNGIGMSKEK LEEVQGRLSQ DFDFSDHIGL 
LNTNERLKLN YGGNFKLKVW SKLGLGTIVK IILPVNFEDR KENEIDAKKT GYLYP