Gene Athe_2443 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Athe_2443
Symbol
ID	7408067
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anaerocellum thermophilum DSM 6725
Kingdom	Bacteria
Replicon accession	NC_012034
Strand	-
Start bp	2586114
End bp	2587529
Gene Length	1416 bp
Protein Length	471 aa
Translation table	11
GC content	44%
IMG OID	643716806
Product	HNH endonuclease
Protein accession	YP_002574284
Protein GI	222530402
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

TTGGTAATCT TCACCGTTGA CAAACATGGA AGACCAGGAC ACCCAACAAG AAGATTTGAT 
ATGGTAAGAA AACTGGTAAA GCAGGGTAGA GCAAAAATCA TCGGTGGTGG AGCTTCTGGC 
AAACCACCGG TTGTGATGTT CCTCGACAGG GAGTTTGACT ACTCCAAAAC GATAGAAAGA 
CGTCTCTTTG TAGTACTTGA CCCGGGATAC CACCACATAG GCTTTGCAGT ATGCGAACTT 
CGCTGGGGCG TATTGATTGT CTACTGTATA GGGGTTTTAG AAACAAGAAT CCCTGAAATT 
AAGGACTTGA TGACTAAAAG AAGGGGATAC AGACGAAACC GCAGGTACCA CTCAAGGTGC 
AGAAAAAAAC GAATGTCCAA AAGACATAGT AGGGTCCTGA CAAAATTCAA AGCACCAAGA 
AATGTAAGGA CAAAGGATAG AACAAATGCA ACACTTAGAC ATGGCATAGA AACCCACCTC 
AACCTTTACA AAAAACTCTT AAAGTTCTTT CCATTCCCAG CAGAGCAGGT TGTGTTCGTT 
ATGGAAGACA ACATCTTTGA TGTCAGAACA ATGACATGGG GTAAAACATA TGGTACAGGG 
TATCAAAAAT CACCCAGAGT TCCAGCAGAG AAGAAGTGTA TTATCTGCGG TACAGAAGAC 
AATCTGCAGA AGCACCATTT GATACAGCGT AAATGTGGTG GTACAGACGT TCAGGAAAAC 
CTGGTGTACC TGTGCAGGGA CTGTCATGAA GATGTCCATG CTGGAAGAGT GTATATACCG 
GTGGAAGGTG TCAGGCAGTG GCGTGCACTG GGTACGATGA ATGCGATAAT AGGTCAACTG 
CGTGAAATAC CATGGCTGAA GTTCGTACCT GCATCTGACG CGGCACAGAT GAGAAAAAAA 
CTGGGTCTTA AGAAAGGACA TGCAAACGAC GCTCTGGCAA CAGCAGCGGT CTTTTGCAGC 
TGTACAGAAG CTGACAGAAC ACACATGATT GAGCTAACCC TGGTAAAGTT CAGAAGACAC 
AACAGGGCAA GAATACATGC TGTAAGAGAC AGACTGTACA AGGTTGATGG TAAGATTGTG 
GCGAAGAACA GACGTAAGAG GACAGACCAG AAAGAACCGT CCTTTGCAGA TATATCACCA 
TTGCCACCGG AAATTCAAAG AAAACTCAAG GTATATCCCG GTACAAAGAT TCTTAACCCG 
CTGCGAAAAG AAATGCCGAC TATAGCGGGT GATGTATGGA TTCACGAACC AACAGGCAAG 
AGGTTTGTAA CAACAGGTGT GGTATCCCAG AAGTATTTGT ATTCGCCACA GCTAAAAAAG 
ATAGTGGGAA AAATGTACGT TCAACCAGAA GAATGCAGGC AGGTACTCCA TAACGAAGGA 
ATGGTTGTTA TGTACAACAG TCTATACCAC AGTTAA

Protein sequence

MVIFTVDKHG RPGHPTRRFD MVRKLVKQGR AKIIGGGASG KPPVVMFLDR EFDYSKTIER 
RLFVVLDPGY HHIGFAVCEL RWGVLIVYCI GVLETRIPEI KDLMTKRRGY RRNRRYHSRC 
RKKRMSKRHS RVLTKFKAPR NVRTKDRTNA TLRHGIETHL NLYKKLLKFF PFPAEQVVFV 
MEDNIFDVRT MTWGKTYGTG YQKSPRVPAE KKCIICGTED NLQKHHLIQR KCGGTDVQEN 
LVYLCRDCHE DVHAGRVYIP VEGVRQWRAL GTMNAIIGQL REIPWLKFVP ASDAAQMRKK 
LGLKKGHAND ALATAAVFCS CTEADRTHMI ELTLVKFRRH NRARIHAVRD RLYKVDGKIV 
AKNRRKRTDQ KEPSFADISP LPPEIQRKLK VYPGTKILNP LRKEMPTIAG DVWIHEPTGK 
RFVTTGVVSQ KYLYSPQLKK IVGKMYVQPE ECRQVLHNEG MVVMYNSLYH S