Gene Athe_1244 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Athe_1244
Symbol
ID	7409718
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anaerocellum thermophilum DSM 6725
Kingdom	Bacteria
Replicon accession	NC_012034
Strand	+
Start bp	1333783
End bp	1335120
Gene Length	1338 bp
Protein Length	445 aa
Translation table	11
GC content	34%
IMG OID	643715609
Product	cell envelope-related transcriptional attenuator
Protein accession	YP_002573117
Protein GI	222529235
COG category	[K] Transcription
COG ID	[COG1316] Transcriptional regulator
TIGRFAM ID	[TIGR00350] cell envelope-related function transcriptional attenuator common domain

Plasmid Coverage information

Num covering plasmid clones	4
Plasmid unclonability p-value	0.0000703915
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGAAAAAG CAAGGAAAAA AAAGATTATG ATTTCAATTA TAGCTTCGAT TTTGATTATA 
TGCATAGCTG TGTGTGGGTA TATTTACAAA GTTTTTGTTA TTGATGCAAA ACATATTGAG 
AGGGTTTTTA CGAAAAAATC ACAGGTGTCA AAAAACTCTT CTTTAAAATA TCCTTTTGAC 
GACAATAGTG TAAATATTTT GATTGTTGGA CTTGACAAGG CAAGCAACAG GACAGTGTAC 
GATATGCACA GAACAGACAC AATTCTGTTT ATAAACATTA ATTTCAAAGA TAAAAAAGTT 
AAAGGAATTT CTATTCCAAG AGATACACTT ACACAAATAT ACAAAGTTGA AAAATGGGAT 
AAGATTAACA GTGCATTTGG TTATGGAGGA GGAGAAAAAA AAGAAGGTTT TATATATACA 
ATGGAAACTG TGAGTAAGCT CTTGGGTGGG ATGCCGGTAG ATTATTATGT CGGATTTGAC 
CTTGATGCTA TAAGAAAAGT TGTAAACATA TTGGGAGGTG TTTATGTCAA TGTTGAAGTG 
CCAGTGAGGG TAAAGACAAA GTGGGTGGAC ATTGATTTAA AACCGGGGTA TCAAAAACTG 
AATGGCATAG AAACTCTTTA TTATGCTCTT TGGAGAAAAA CTCCAGGTGG TGACATTGAC 
AGAATAAGAA GAGACAAAGA ATTAATTCTT TCGGTTTTCC AACAGCTGAA AGAGAGTAAT 
AAGATAATAA AATTGCCAGA AATATATTGG AAGATAAGAA AACACTTTTT TACTAATCTT 
TCTCTTCAAC AGATAACATC GCTTGCTTAT TTTGCCCAGA GCATAAATAA AGAAGACATG 
GTATTTGAGA GTATTCCTGG CACTTATTTT AACTATGCGG GAGTGAGCTA CTGGAAACCA 
GATTATGAAG GGATAAAAAA GCTTGTAAAG GACCTACTTG GCTATGACAT TGAAATAGAC 
CTTCAGCTTC CTGAAAGGTT TAAATATGTA CCACGGATTG TAAAACATAA AAATACTAAT 
TCTTCCAAGA AAACTATAAA TCAAAATTTA CAGACTACCA ACCAAGAAAA CCAGAAAAAA 
ACAGAAGAAC AAACTCAACA AAGTAGTTCA ATTGATAATT CCTTGCCCGC ACAAAATTCA 
GAAAATCCTT CAACTGGGGA TACTACTGCT AAGGTTCAGC AATCTTCGCA AGTACTGGAA 
GGTCAGCAAA CTTTGCCACC CACAAATAGT CAACGAAGCT TGTACGAAAA TCAAGATCAG 
AATTCTTCAG TCCAAAGTGG TTTTTCATCG TCTGCAGCCT CAGATGTAAA CAGCGATGTT 
TATAGTCAGG GCAGATAG

Protein sequence

MEKARKKKIM ISIIASILII CIAVCGYIYK VFVIDAKHIE RVFTKKSQVS KNSSLKYPFD 
DNSVNILIVG LDKASNRTVY DMHRTDTILF ININFKDKKV KGISIPRDTL TQIYKVEKWD 
KINSAFGYGG GEKKEGFIYT METVSKLLGG MPVDYYVGFD LDAIRKVVNI LGGVYVNVEV 
PVRVKTKWVD IDLKPGYQKL NGIETLYYAL WRKTPGGDID RIRRDKELIL SVFQQLKESN 
KIIKLPEIYW KIRKHFFTNL SLQQITSLAY FAQSINKEDM VFESIPGTYF NYAGVSYWKP 
DYEGIKKLVK DLLGYDIEID LQLPERFKYV PRIVKHKNTN SSKKTINQNL QTTNQENQKK 
TEEQTQQSSS IDNSLPAQNS ENPSTGDTTA KVQQSSQVLE GQQTLPPTNS QRSLYENQDQ 
NSSVQSGFSS SAASDVNSDV YSQGR