Gene Athe_0102 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Athe_0102
Symbol
ID	7408464
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anaerocellum thermophilum DSM 6725
Kingdom	Bacteria
Replicon accession	NC_012034
Strand	-
Start bp	123769
End bp	125328
Gene Length	1560 bp
Protein Length	519 aa
Translation table	11
GC content	30%
IMG OID	643714510
Product	two component transcriptional regulator, AraC family
Protein accession	YP_002572033
Protein GI	222528151
COG category	[T] Signal transduction mechanisms
COG ID	[COG4753] Response regulator containing CheY-like receiver domain and AraC-type DNA-binding domain
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	45
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACGTATA AAGTTTTAAT TGCTGACGAT GAAAAAATAG TTGTGGATTC TATTAAATTT 
ATACTTGAAA ATAATCTGAA TACAGATTTT GAAATTTCTA TATTTACATC AGGTAGAGAA 
GCACTTGAAA ACTTGCTTTT TTATTCTTAC CATATAGCTT TTATAGACAT TAAAATGCCA 
GACTTAGATG GACTTGAACT TATAGAAGAG TACAGAAAAA TGAAAAATTC AGAGTTTCCA 
ATTTTTATTA TTGTTTCTGC ATACGACAGG TTTGAGTTTG CCAAAAAAGC AATAAAGGAA 
AAGGCATTTG CATATATCCT AAAACCGTAT TCAATAGAAG ATATAATCTC AACTATGCAC 
TCTGCAATAG CTCAAGTAGA TAGCATTTTG GCAAGGACAA AAGAGAACAT AGAAAAAAAT 
GCACAGCTGA TTGTGATGAG AAACTTGCTT GAAAACAGTT TTATACCTAC CTTAATATTC 
AAAAATGCAT TCGATATTGT TGATGTAAAT CAATATGAAA AAATCTTTGG AATAAATCTT 
AAAAGCGGGT TTTTAATGGT TTTGACACTC AAAGACAAAA GTGATTTGGT CTCAAGCTTC 
AAAGAACTTG ACAATATCCG AAAAGACATA AAAATCTCAT TTGAACACAA AGCTTTAACA 
TCAATTGGCA TGGGTGAGTA TCTTATTTGT TTTTTCCCGT CTCAATCACA GAAAGAAGCA 
GAGGTTTTGC AAGAAAAAAT TCAAGAAATT CTAAAACAAA AACCTTACTG GAATAGTATC 
AAAATTGGAT TTAGTGACCT TTATTACTTA GAAGAAGGAT ATGAAAATGC ATTCTGGGAG 
GCATACTATT CAACCCTTGA CTTGGAATTC CCAGAAGAAA ATGAAGAAAA TGAGCATCTC 
CTTCTATTGA CAGAAAATTT AGAAGCAAAA CTGATTCATT CTATCAACAA CCCAACACAA 
ATTCCAATGA TAGAAAACTA TATAACCCAG CTTTGCAAAT TATACATTGA ACTTTTTGGG 
GAAAATAACC TAAAATACAA AGTGATAAAA CTTATTATAA TGTTATTGCT TGAAACTGGA 
ATAGCAACAA GCGATGAGTC TATTGATGTA GAAAAATTAA TTTCGCAAAT ACTTAATTCT 
TCTTATGAAC AGATTGTAGA AATATTTAAA AAAGCTGTGC TTTCACTTTT TAGCAAGGCA 
AAAACCAAGC ATGAACAGAT TATAAACAAT GATTCGATTA ACAAAGCAAT AGAATTTATA 
AACCAAAACT ACAGTGAGGA AATTACACTT TCACAGATAA GCTCAACTTT TAACTTTAAC 
CCATATTATT TCAGTAAATT GTTTAAAAAA TACACAGGTG TAAGTTTTAA GACATACCTT 
ACAAAGCTTA GAATTCAAAA GGCTTGTCAG CTTCTGAAAA ATACATCAAA GAGTATAAAG 
GAAATATCAT TTGCTGTTGG TTTTTCTGAC CCGAACTATT TTATCAAGGC TTTCAAAAAG 
TTCACTGGAA TGACACCCTC TGCATTTAGA AGCTCATCAG TAGATATAAA TTCAATATAA

Protein sequence

MTYKVLIADD EKIVVDSIKF ILENNLNTDF EISIFTSGRE ALENLLFYSY HIAFIDIKMP 
DLDGLELIEE YRKMKNSEFP IFIIVSAYDR FEFAKKAIKE KAFAYILKPY SIEDIISTMH 
SAIAQVDSIL ARTKENIEKN AQLIVMRNLL ENSFIPTLIF KNAFDIVDVN QYEKIFGINL 
KSGFLMVLTL KDKSDLVSSF KELDNIRKDI KISFEHKALT SIGMGEYLIC FFPSQSQKEA 
EVLQEKIQEI LKQKPYWNSI KIGFSDLYYL EEGYENAFWE AYYSTLDLEF PEENEENEHL 
LLLTENLEAK LIHSINNPTQ IPMIENYITQ LCKLYIELFG ENNLKYKVIK LIIMLLLETG 
IATSDESIDV EKLISQILNS SYEQIVEIFK KAVLSLFSKA KTKHEQIINN DSINKAIEFI 
NQNYSEEITL SQISSTFNFN PYYFSKLFKK YTGVSFKTYL TKLRIQKACQ LLKNTSKSIK 
EISFAVGFSD PNYFIKAFKK FTGMTPSAFR SSSVDINSI