Gene Athe_2307 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Athe_2307
Symbol
ID	7407726
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anaerocellum thermophilum DSM 6725
Kingdom	Bacteria
Replicon accession	NC_012034
Strand	-
Start bp	2444317
End bp	2445282
Gene Length	966 bp
Protein Length	321 aa
Translation table	11
GC content	35%
IMG OID	643716671
Product	hypothetical protein
Protein accession	YP_002574150
Protein GI	222530268
COG category	[S] Function unknown
COG ID	[COG5464] Uncharacterized conserved protein
TIGRFAM ID	[TIGR01784] conserved hypothetical protein (putative transposase or invertase)

Plasmid Coverage information

Num covering plasmid clones	5
Plasmid unclonability p-value	0.0000450312
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCAGCAGA AAGTACCGCA TAACCAGTAT GATTTGACGT TCAAAAGATT ATTTCAATTC 
AAGGAAGTAT TTTTAAACTT TTTAAGGAGC AATATAAATA GAGAATGGGT AAATAGAATA 
GATGCTGAGA GTTTAGAGTT TGTTGACAGG AGTTTTATTA AGGACGAGTT TGTAGAAAAA 
GAAGCAGATG TCATATATAG AGCAAGATTA GAAGATACGG ACATATACTT TTATGTGTTA 
ATAGAACCAC AATCCACTGC AGACAAAAGT ATGCCGAAAA GATTGTTTGA GTATATGAGC 
TTGGTATGGA AAAGACACAT GGAAGAGAAG GCAGATGAGT TATTACCGCC AATTGTTCCG 
ATAGTGTTGT ACAATGGTAG AAGCAGCTGG AACATACCGA CCCAGATATT TAAAGGTTTT 
GATATATTCA AGGATGATAT GTTTAACTAT ATCCTGGTTG ATGTAAATAG GCTTGATGAT 
GAAAAGCTAA GAAGTAGGTT AGACCTTTTA AGTATTATTC TTTATTTAGA AAAGTCAAGA 
AGAAATGCAG AGGAGTTTGT AGAAAAGCTC AGTGAAGTGT CAGAATATGT TTGTAAGTTA 
CCACAGCCGC AGCTAAAAGT GTTTTGTTCA TGGCTGCTCA GGATAGTAAA ACCGCAGGTG 
AGAGAGGAGA TGAAAAGCAG AATAGATGAA TTATTGGAGA AGATAGAAGC TGAGGGGGTG 
GAAGATGTGG GTGAGTTTAT ATTCAATGTT CAGCAGCTGA TACAGGAGTA TTACAAAGAG 
GCAGAAGAAA AAGGCAAAGA AAAAGGTTAT GAAGAAGGCA TACAGGAAGG TATACAGCGA 
AAAGAAGAAG AAATTGTTAG AAGGCTTATT CAAAAAGGGT TTGATAATAA TTTCATAGCT 
GAAGCAACAG GGGTTGAGAT TGATAGGATA AAGAAGATAA GAGAAGAATA TACGAAATAT 
TCTTAA

Protein sequence

MQQKVPHNQY DLTFKRLFQF KEVFLNFLRS NINREWVNRI DAESLEFVDR SFIKDEFVEK 
EADVIYRARL EDTDIYFYVL IEPQSTADKS MPKRLFEYMS LVWKRHMEEK ADELLPPIVP 
IVLYNGRSSW NIPTQIFKGF DIFKDDMFNY ILVDVNRLDD EKLRSRLDLL SIILYLEKSR 
RNAEEFVEKL SEVSEYVCKL PQPQLKVFCS WLLRIVKPQV REEMKSRIDE LLEKIEAEGV 
EDVGEFIFNV QQLIQEYYKE AEEKGKEKGY EEGIQEGIQR KEEEIVRRLI QKGFDNNFIA 
EATGVEIDRI KKIREEYTKY S