Gene Athe_2289 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Athe_2289
Symbol
ID	7407708
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anaerocellum thermophilum DSM 6725
Kingdom	Bacteria
Replicon accession	NC_012034
Strand	-
Start bp	2421595
End bp	2422596
Gene Length	1002 bp
Protein Length	333 aa
Translation table	11
GC content	37%
IMG OID	643716653
Product	hypothetical protein
Protein accession	YP_002574132
Protein GI	222530250
COG category	[S] Function unknown
COG ID	[COG5464] Uncharacterized conserved protein
TIGRFAM ID	[TIGR01784] conserved hypothetical protein (putative transposase or invertase)

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.0492229
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGGAACAAA AACCTCCTCA CAACCAGTAT GATCTGACTT TCAAAAGGAT ATTTAGTTTC 
AAAGAAGTAT TCTTGAACTT TCTAAAATCA ACTATCAAAA GACCATGGGT TGATAAAATA 
GACCTGCAGA GTCTTGAGTT TGTAGACAGA AGCTTTGTAA AAGATGAGTT TGTTGAAAAA 
GAGGCAGATG TCATCTACAG GGCAAAGATT GAAGATACTG ACATATATTT TTACGTCCTT 
TTAGAAGCCC AGTCAACAAC AGACAAAACT ATGCCAAGAA GACTTTTTGA ATATATGAAC 
CTGATATGGC AAAGGCATAT TGAAGAGACC AAAGATGATC TTCTGTCCCC AATTGTCCCA 
ATAGTTTTGT ATAACGGCAG AAGCAATTGG AATGTACCAA CGCTTATATT CAAAGGCTGG 
GAAATTTTCA AAGATGACAT GTTCAACTAT TTTCTTGTTG ATGTGAACAA TATTGATGAT 
GAAACACTTA AAAATAGACT TGACCTTTTG AGTGTAATAT TGTATTTAGA TAGGTCAAGG 
AAAACAGCAA AGGAATTTAT AGAGAAGCTA AAAGAGGTGA CAGAGTACAT TAGTTGTTTG 
CCGACAGAAC AGGTGAAGGT ATTTGCGATG TGGCTTTTGA GGGTGATAAG ACCGCAGATG 
ATGGAAGAGG TGCAAGGGGA GATAGATGAG CTACTTAAAA GAATAGAACA GGAGGGGGTG 
ACTGATGTGG GTGATTTTGT ATTTAATGTT CAGCGACTGA TGCAGGAGTA TTACAAAGAA 
GCTGAAGAAA AAGGAAAAGA AAAAGGGTAT GAGGAAGGAA AGCTTGAAGG AAAACTTGAA 
GGAAAACTTG AAGGAGAACT TGAAGCTACA ATCAGAATAG CAAGAAACAT GATATTGGCA 
GGAGCAGAAG ACAGCTTTAT TTCAAAAGTC ACAGGACTTG ACATTGAGAA AATAAAAGAA 
TTGAGGCAAA ACATGACAGA TAAAGAATTT GGGCAATTTT GA

Protein sequence

MEQKPPHNQY DLTFKRIFSF KEVFLNFLKS TIKRPWVDKI DLQSLEFVDR SFVKDEFVEK 
EADVIYRAKI EDTDIYFYVL LEAQSTTDKT MPRRLFEYMN LIWQRHIEET KDDLLSPIVP 
IVLYNGRSNW NVPTLIFKGW EIFKDDMFNY FLVDVNNIDD ETLKNRLDLL SVILYLDRSR 
KTAKEFIEKL KEVTEYISCL PTEQVKVFAM WLLRVIRPQM MEEVQGEIDE LLKRIEQEGV 
TDVGDFVFNV QRLMQEYYKE AEEKGKEKGY EEGKLEGKLE GKLEGELEAT IRIARNMILA 
GAEDSFISKV TGLDIEKIKE LRQNMTDKEF GQF