Gene Athe_1802 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Athe_1802
Symbol
ID	7408589
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anaerocellum thermophilum DSM 6725
Kingdom	Bacteria
Replicon accession	NC_012034
Strand	-
Start bp	1874514
End bp	1875608
Gene Length	1095 bp
Protein Length	364 aa
Translation table	11
GC content	37%
IMG OID	643716179
Product	transcriptional regulator, CdaR
Protein accession	YP_002573668
Protein GI	222529786
COG category	[K] Transcription [T] Signal transduction mechanisms
COG ID	[COG3835] Sugar diacid utilization regulator
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	0
Plasmid unclonability p-value	0.00000000701672
Plasmid hitchhiking	No
Plasmid clonability	unclonable

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATGACAC AGAAGGTTAT TGATGTTTTA GAGCAGGCAA AAGACATCAT CGACGATGAA 
TTTGGATATA TTGAAGCTGA TGGTAGAGTT ATCTACAGCT CAAATCCACT TTCTCAAAAC 
AGAATCAACA CAGTTGCAAT TGACATGATA AAAACAGACA CTGACCTTGA GATATTTGAG 
GGTCGCACAT ACAAGGTTTA CAGAAGCCAG ACAGACACCT ATGTTCTTTA TATAAACAAC 
ACAGAACCTC ATGCTGAAAA GCTTTTGGAT ATGTTAAACC TTGTTGTGAT GAAGGCAAAA 
GAGCCGGCAT CTGCGTATGA TAAAAAGCTC TTTATAAAAA ATCTGTTGTA TGACAATATT 
CTGCCAGGGG AGATTTACAC AAAGGCAAGA GAACTTCACA TTGCAACAGG TGCAACAAGG 
GTTGTATTTG CTATCTATAT TCCAAATGCA AAAGAGATTA AAGACCTGAA TATCGGTGAG 
ATTTTGACAA GCATATTCCC AAAGAGCACA AAAGATTTTA TTATCCAGCT TGACAACAAT 
ATTCTGGTAT TCATAAAAGA GTTAAAACCA GGTTCAAATG ATGAGGATGC ATACAAGGTT 
GCAAGGATTA TACTTGACAC GCTCAACTCA GAGCTTTTGC TCAAAGCGTA TATTGGAATT 
GGATCTGTTG TTGATGACAT AAAAGAACTT TCGATGTCTT ATAAGGAGGC AGAAGCAGCG 
CTCAAAATAG GCTACATCTT TGAAAAGGAC AAGTATATTG TGAGTTATCA CAAGCTCGGC 
CTTGGAAGAC TTATATATCA GATGCCGACA AAACTTTGTG AGATGTTCTT GGAAGAGGTC 
TTCAAGGATG TAAAACTTTC TGATTTTGAC CCAGAACTCA TACAGACTGT TGAGATGTTC 
TTTGAATGCA ACTTGAATGT CTCAGAGACA GCAAGACAGC TTTATATTCA CAGAAATACC 
TTGGTTTACA GACTTGACAA GATAGAAAGA ATGATAGGGC TTGACCTTAG AAAGTTCGAA 
GATGCTATTA TCTTCAAAAT GGCTATGCTT GTAAATCAGT ATTTAGAGTA TACAAAGGGT 
AACATTACAT TTTAA

Protein sequence

MMTQKVIDVL EQAKDIIDDE FGYIEADGRV IYSSNPLSQN RINTVAIDMI KTDTDLEIFE 
GRTYKVYRSQ TDTYVLYINN TEPHAEKLLD MLNLVVMKAK EPASAYDKKL FIKNLLYDNI 
LPGEIYTKAR ELHIATGATR VVFAIYIPNA KEIKDLNIGE ILTSIFPKST KDFIIQLDNN 
ILVFIKELKP GSNDEDAYKV ARIILDTLNS ELLLKAYIGI GSVVDDIKEL SMSYKEAEAA 
LKIGYIFEKD KYIVSYHKLG LGRLIYQMPT KLCEMFLEEV FKDVKLSDFD PELIQTVEMF 
FECNLNVSET ARQLYIHRNT LVYRLDKIER MIGLDLRKFE DAIIFKMAML VNQYLEYTKG 
NITF