Gene Athe_1910 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Athe_1910
Symbol
ID	7407323
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anaerocellum thermophilum DSM 6725
Kingdom	Bacteria
Replicon accession	NC_012034
Strand	+
Start bp	2014440
End bp	2015828
Gene Length	1389 bp
Protein Length	462 aa
Translation table	11
GC content	34%
IMG OID	643716282
Product	transcriptional regulator, GntR family with aminotransferase domain
Protein accession	YP_002573771
Protein GI	222529889
COG category	[E] Amino acid transport and metabolism [K] Transcription
COG ID	[COG1167] Transcriptional regulators containing a DNA-binding HTH domain and an aminotransferase domain (MocR family) and their eukaryotic orthologs
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	32
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGTGTAT CGATACAGAT TGACAAGAAT TTAAAAAAGC CTCTTTACCT TCAGCTTTAT 
GAAGATATAA AGCAAAAGAT TTTGTCAGGT GAGATTAGTT ATATGCAGAG GCTTCCGTCT 
GTGAGAAATC TTTGCAAGAC GTTAAATGTG AATCTTTCAA CTGTTACAAA GGCGCTGAGC 
AAGCTTGAAA ATGAAGGCTA TATCAAAGCA ACCCCTGGAA GTGGTTATTA CGTTGTATAC 
AGTGAGTATC AAGATAAAAT CATTTTTGAG GAAGAAAACC TTGTAGATGC TCAAGGTTAT 
ATCAATTTGG CTTCATCAAA GCTTCCATAT AACCTATATC CTATCGAATG GTTCAAAGAT 
TCTTTAAACT GCGCAATCGA AGAGTATTCA CCACAGATTT TCGATTATAT CGAACATTTT 
AAAAATCCTC TAAAGGAGTA CTTGGTAGAG ACATATCTTA AAAAGCTTGG GATTGTTACA 
AGCCCTCAAG AGCTCACAAT TGTATCAGGT GCTCAGCAGG GAATTGAGAT TACAACAAAA 
AGTTTTTTAA AGCCCGGCGA TACAATATTT TTAGAAAATC CTTCGTATCT CGGTGCATAC 
CATATATTTA GCAATATGCA CCTGAACATT GTTAGTCTTG ACATTGACCA GATGCTAAAT 
ATAGAAGATT ACATTAAAAA GTTTTTACCA AAGGCCATAT ACATTATTCC TTTTTCGCAA 
AATCCAACCG GGATTTCATA CAGCAAAGAG TACAAGGAGT ATCTGTGTGA GATTTCACAA 
AAATATGACT TTTATATCAT TGAAGATGAT TTTTTAAGCG ATATAGGGGT GGATGAAGGA 
ATTTTACCAA TCAAAGCATA TGACAAACAC GACAGGGTGT TTTACATAAA GAGCTTTTCA 
ACCGTTACAA TGCCTGCACT GAGAATTGGA TTTGTTGTGG CACCAAGGCA TCTTTCCGAA 
GAGGTTGCAT ACTACAAGTC AATGGCAGAT ATCTCAACAT CGCTTTTGAT ACAGGTATCT 
TTTTATTATT TTTTGAAAAA CTTCTTTGAC AAGCACATAG AAAACTTGAA AGTATACATA 
AACCAAAGAC AAAAGCTATT TTTAAGATTG GCAAAAGACC TGCAAATAGA CGACAGACTA 
TTTACTCAAG ATGTTCAGGG AATATTTGTT TCTTTCTATC TTCCACCAAC GATATCATCT 
GCTACTGTTT ATAATAAACT TAAATCACAA AAGGTTTTAG TGCAGCCCCA TACATGTTTT 
TATCACAAAC CTGCCTCTAC AAACTTTTTT AGAATAAGTT TTTTAGATTG CAGTGAAGAT 
GAACTTCAAA TAGCTATGCA GAAAATTCAA AAGGTTTTGA ATTCAGCTTA CCAAAAAGAG 
GAGGTATGA

Protein sequence

MSVSIQIDKN LKKPLYLQLY EDIKQKILSG EISYMQRLPS VRNLCKTLNV NLSTVTKALS 
KLENEGYIKA TPGSGYYVVY SEYQDKIIFE EENLVDAQGY INLASSKLPY NLYPIEWFKD 
SLNCAIEEYS PQIFDYIEHF KNPLKEYLVE TYLKKLGIVT SPQELTIVSG AQQGIEITTK 
SFLKPGDTIF LENPSYLGAY HIFSNMHLNI VSLDIDQMLN IEDYIKKFLP KAIYIIPFSQ 
NPTGISYSKE YKEYLCEISQ KYDFYIIEDD FLSDIGVDEG ILPIKAYDKH DRVFYIKSFS 
TVTMPALRIG FVVAPRHLSE EVAYYKSMAD ISTSLLIQVS FYYFLKNFFD KHIENLKVYI 
NQRQKLFLRL AKDLQIDDRL FTQDVQGIFV SFYLPPTISS ATVYNKLKSQ KVLVQPHTCF 
YHKPASTNFF RISFLDCSED ELQIAMQKIQ KVLNSAYQKE EV