Gene Athe_2026 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Athe_2026
Symbol
ID	7408238
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anaerocellum thermophilum DSM 6725
Kingdom	Bacteria
Replicon accession	NC_012034
Strand	+
Start bp	2136913
End bp	2138091
Gene Length	1179 bp
Protein Length	392 aa
Translation table	11
GC content	34%
IMG OID	643716392
Product	integrase family protein
Protein accession	YP_002573876
Protein GI	222529994
COG category	[L] Replication, recombination and repair
COG ID	[COG4974] Site-specific recombinase XerD
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	33
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGGAAGGC GCGGTAAAGG TGAAGGTAGT ATTTTCAAAA GAAAAGATGG AAGATGGTGT 
GGCTTTATTA CTGTTGGCTA TGATGAAAAA GGAAATCAAA AAAAGAAATT CTTTTACGGC 
AAAACAAGGC AGGAAGTTGC TGAAAAAATA AATCAAGCAC TAAATGAAAT TAAACAAGGA 
ATTTTAATAA CTGACAATAA TATTACACTT GAAAATTGGC TTAACATCTG GCTGCATCAG 
TACAAAAAAA ATCAAATTAG TGAATCAACT TTTGATGATT ATGAAAGCAT AATAAAAAAT 
CACATAAATC CTGTACTTGA AAAATATAAC CTCAAAGATT TGCGTCCAGA ACATCTACAA 
ATGCTTTACA ATGAAAAACA TAAAGCAGGT CTTTCGACAA AAAGAATCAA GGATATTCAT 
GTCATCCTAC ATTCAGCTTT AAATCAAGCA ATTAAAAACG GACTCATTGT ACGAAATGTC 
AGTGAAGCAA CCACCTTACC AAAAAACACC AGAGAAAAGG AAATGAAAGT TTTGACAATA 
GAAGAACAGA AAAGATTTCT GCAGGTACTT GAAGGTGAAA GATTGAAACC TGCCTTTGTT 
CTTGCCTTGA GTACTGGAAT GCGACTGGGA GAAATTTTGG CTTTGAAGTG GCAAGATGTC 
GATTTAGAAA ACAAAAGAAT TACTATTAGA AATTCTGTCC GCAGGATAAA AAACAGGAAT 
GAGCAGTCAG AAATTAAAAC TAAAACTGTT CTTGTTCTTA AAGAACCTAA AACCGAAAAT 
TCTGGAAGAA TAATTCCACT GCCAGATGTT GCCTATCAAG AACTTGTTAA TTTCAAACTA 
TTGCAGGAAG AAGAAAAAAG ACAAGCAGGT AGTAGCTACG TAGATAGTGG TTTTGTCTTT 
ACAACCAAAG TTGGAACACC TATTGAGCCA AGAAACTTCC TGCGGACATT TTACCGTATT 
ACAGAAAAAG CAGGACTTAA TATTAACTTC CATGCTCTAA GACACACATT TGCAACAAGA 
CTTTTAGAAG CAAACACTAA CCCTAAAGTT GTTCAAGAGC TGCTGGGACA CAGTGATATA 
TCAACCACAT TGAATATTTA TTCGCATGTA TTGTTTGACA CAAAACAGAA AGCTATTGGG 
GAAATTAATG ATTTAATGAA AAATCTTACC AATGAATGA

Protein sequence

MGRRGKGEGS IFKRKDGRWC GFITVGYDEK GNQKKKFFYG KTRQEVAEKI NQALNEIKQG 
ILITDNNITL ENWLNIWLHQ YKKNQISEST FDDYESIIKN HINPVLEKYN LKDLRPEHLQ 
MLYNEKHKAG LSTKRIKDIH VILHSALNQA IKNGLIVRNV SEATTLPKNT REKEMKVLTI 
EEQKRFLQVL EGERLKPAFV LALSTGMRLG EILALKWQDV DLENKRITIR NSVRRIKNRN 
EQSEIKTKTV LVLKEPKTEN SGRIIPLPDV AYQELVNFKL LQEEEKRQAG SSYVDSGFVF 
TTKVGTPIEP RNFLRTFYRI TEKAGLNINF HALRHTFATR LLEANTNPKV VQELLGHSDI 
STTLNIYSHV LFDTKQKAIG EINDLMKNLT NE