Gene Athe_2055 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Athe_2055
Symbol
ID	7408268
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anaerocellum thermophilum DSM 6725
Kingdom	Bacteria
Replicon accession	NC_012034
Strand	-
Start bp	2169507
End bp	2171066
Gene Length	1560 bp
Protein Length	519 aa
Translation table	11
GC content	30%
IMG OID	643716422
Product	two component transcriptional regulator, AraC family
Protein accession	YP_002573905
Protein GI	222530023
COG category	[T] Signal transduction mechanisms
COG ID	[COG4753] Response regulator containing CheY-like receiver domain and AraC-type DNA-binding domain
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	39
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

TTGTTTAAGG TGGTTCTAAT TGATGATGAG CCGATAATAA TTGAAGGACT TAAAAAGATA 
TTGGACTGGC ATGCGCTTGG GTTTGAAATA GTTGCAGTTG CATATGATGG AGTAGATGGT 
TTTTCCAAAT TGCTTGAACT AAATCCTGAT GTTGCTCTTA TTGACATACG TATACCTGGA 
ATTGATGGGC TTTTGTTAAT CCAAAGATTG AGAGAAAAAA ATATTTCAAC AAAAATTATT 
ATTCTTTCAG GTTACTCTGA GTTTGAATAT GCCCGAAAAG CTGTGGAACT TGGAGTGGAG 
AGTTATCTTC TAAAACCTAT TGACAAACAA CTTCTTGAAG AGAAACTTAT GGCAATCAGG 
GAAAAACTGG AGGAAGAATT TAAAATAAAC CGGGCATTTT CAGCTGCTAA GAAACTCACA 
AGGGAAAAAG TAGTTGAAAA ATTAGTATTG GGTACTTTGA AAGATACGGA GATAGAGTAT 
ATGAATAAAT TCTTTGAACT TCAACTTCCC TGGAAAAAGT ATCAGGTTGC CATAATTCAG 
CTGCTAAATG AAAATAGGAA TTCTTGTGAG ATAAATCAAA CAGTCTTGCA ATTAAAAGAA 
AAGGTGGATT TGTTTTTGAA TAAAAACTCT TGCGGTTTTT CGACAATTAT AAACAACAAT 
ATCTGCATAC TTTTCAAAGA CTTTTGGTAT CCCTTCAATA GTAGAAGCAT TAATATTTTA 
AAGGATATGC TCATGAAATA TACGGACGGT CAGATTATTA TTTCAATTGG AAGTGAAGTA 
GAAGACTATA GAAATATTAA AAAATCGTTT GAAGAAGCCA ATGAACTTTT AAAAAAGAGA 
TTTTTATTGG GCTACAAAGG TTTAATCTTT ATAAAAGAAG CTATTTTTCG ATATGATAAA 
ACTGAGAAAG AGTTTGATGA TAAGGAGAAT GCTTATGCAT TAGCAGTAGC AATTGAGTTT 
GAGAATTTTG AAAGGATTAA CAATATATTG GAAAATAAGG CAGATAACTT GATAAAGAAA 
AATGCATCTG AAGATGAAGC AAAAAGCAGT TTTTACAATT TCTTTGTTGA TGTTTTGTAT 
AAACTTTCTC AGAATCAAGA ATACAAACAA ATTGTCGAAA AGTATCTTAC ACAAGAAATT 
TTTAAAAACT TATTTACCCA GAAGACTTTA ACTGAGTTAA AAGGACTTAT AAAGTATTAT 
TTTACTTTAA TTGCAGAACA AATAAAAAAA CTTCATTCAG ACAATTTCAA AGTTCAGGTT 
GAAGAGTTTA TAAAAAGAAA TTATTTTATT GACTTAAAGC TTGAAACATT GGCAGAAATA 
TTTGGCTACA ATTCATCCTA TTTTAGTAAA CTTTTCAAAA AAACATTTGG TGAGAACTTT 
TCATCTTTTA TCGAAAAAGT CAGAATTGAG AAAGCAAAAG AGCTATTAGA AAATGGGAAG 
AAAGTTTCAG AAGTTGCCAA AAAGGTTGGA TATGAAGATA TGGACTACTT TTGTTTAAAA 
TTTAAAAAGT ATGTTGGATG TTCGCCTAAG AGCTATAAAG AAAGTTTAAA AAGAAAATAA

Protein sequence

MFKVVLIDDE PIIIEGLKKI LDWHALGFEI VAVAYDGVDG FSKLLELNPD VALIDIRIPG 
IDGLLLIQRL REKNISTKII ILSGYSEFEY ARKAVELGVE SYLLKPIDKQ LLEEKLMAIR 
EKLEEEFKIN RAFSAAKKLT REKVVEKLVL GTLKDTEIEY MNKFFELQLP WKKYQVAIIQ 
LLNENRNSCE INQTVLQLKE KVDLFLNKNS CGFSTIINNN ICILFKDFWY PFNSRSINIL 
KDMLMKYTDG QIIISIGSEV EDYRNIKKSF EEANELLKKR FLLGYKGLIF IKEAIFRYDK 
TEKEFDDKEN AYALAVAIEF ENFERINNIL ENKADNLIKK NASEDEAKSS FYNFFVDVLY 
KLSQNQEYKQ IVEKYLTQEI FKNLFTQKTL TELKGLIKYY FTLIAEQIKK LHSDNFKVQV 
EEFIKRNYFI DLKLETLAEI FGYNSSYFSK LFKKTFGENF SSFIEKVRIE KAKELLENGK 
KVSEVAKKVG YEDMDYFCLK FKKYVGCSPK SYKESLKRK