Gene Athe_2087 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Athe_2087
Symbol
ID	7408796
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anaerocellum thermophilum DSM 6725
Kingdom	Bacteria
Replicon accession	NC_012034
Strand	+
Start bp	2210868
End bp	2212070
Gene Length	1203 bp
Protein Length	400 aa
Translation table	11
GC content	33%
IMG OID	643716454
Product	Integrase catalytic region
Protein accession	YP_002573937
Protein GI	222530055
COG category	[L] Replication, recombination and repair
COG ID	[COG4584] Transposase and inactivated derivatives
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.347453
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCAGAACT TAACAGCACA TTTAAACATG ATAAGGGCGA TGAAAATGAA ACCTAACTTT 
TCAGAACTTG CAAGAATATA TGGGATGGAT AGAAGAACAG TTAAAAAATA TTATGAGGGT 
TATGAAGGAA AACCTAAGAA TAGAAATAAA CCAAGTAAAT TGGACAAATA CTATGATGAG 
ATAAAATCAA AGCTTGCTAT CAAAGGAGTT ACAGTCAAGG GTGTTTATGA GTATTTAAAA 
TCAAAAGATG AGACAATAGG AACATATTCA AACTTCAATA AGTATGTTAA GAAAAAAGGA 
TTAAAGCCAG AGAAGAAAAT AAAAGGTCAC CCAAGATTTG AGACAGATCC AGGTGAGCAA 
GCGCAAGTTG ATTGGAAAGA GAATATAAAG CTTGTCTCAA GAAATGGAGA GGAGTTTATC 
ATTAATGTTC TTGATTTTAA ATTAGGTTAT TCAAGGTATT GCTGCTTTGA GATAAACAGG 
ACAAAAACTC AAGAAGAATT AATAGAAACT CTAATAAGAA TATTCAAAGA TATAGGCGGA 
GTACCGAGAG AGATTTTATT TGACAATACA GCAGCAGTTG TTGATATAAC AGGTGAGAAA 
ATTAAAGTAA ATTCAAGATT TAAAAGTTTT GCAAAAGACT TTGGGTTTGA AGTAAAACTG 
TGCAAACCAA GACATTCGTA CACAAAAGGA AAAGTTGAAG CAGCAAACAA GTTTATAGAT 
TGGATACTGC CATATCAGGG TGAATTTGAA ACAGAAGAGG ACTTAGTAAG GATAATAAAA 
GAGATAAACG CAAAGGTCAA TATGCAGCCA AATCAAACAA CTCAAGTTCC ACCTGCTCTT 
CTGTTTCAAA AAGAAAAAGA GTATTTACAA CCCTTGCCAG ACAAAAGGTT AATAGACAGT 
TACCTAAATT CCTACAAGTC AGTTAAAGTC CAAAAGGACT CTCTGATTTA CTACAAGGGA 
AGTAAATACT CTGTTCCACC CGAATACATA GGAAAGACAG TCCAAGTAAA GGAGGTGGAA 
AACAAAATTT ATATTTATTA TAACACAAAC CTGTTAAGGA TACATGTTAT TGATGAAAAA 
AATATCAATT ATCACGATGA AGATTACAAG CAGCTAATGC TAATGAGAGT TGGTCAAAGA 
GAAGAGCTTA ACAAGATATG TGAGGAAAAC CTAAAGAAAT TTGATAATCT GTTGAAAACC 
TAA

Protein sequence

MQNLTAHLNM IRAMKMKPNF SELARIYGMD RRTVKKYYEG YEGKPKNRNK PSKLDKYYDE 
IKSKLAIKGV TVKGVYEYLK SKDETIGTYS NFNKYVKKKG LKPEKKIKGH PRFETDPGEQ 
AQVDWKENIK LVSRNGEEFI INVLDFKLGY SRYCCFEINR TKTQEELIET LIRIFKDIGG 
VPREILFDNT AAVVDITGEK IKVNSRFKSF AKDFGFEVKL CKPRHSYTKG KVEAANKFID 
WILPYQGEFE TEEDLVRIIK EINAKVNMQP NQTTQVPPAL LFQKEKEYLQ PLPDKRLIDS 
YLNSYKSVKV QKDSLIYYKG SKYSVPPEYI GKTVQVKEVE NKIYIYYNTN LLRIHVIDEK 
NINYHDEDYK QLMLMRVGQR EELNKICEEN LKKFDNLLKT