Gene AnaeK_3550 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	AnaeK_3550
Symbol
ID	6784778
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anaeromyxobacter sp. K
Kingdom	Bacteria
Replicon accession	NC_011145
Strand	+
Start bp	4012301
End bp	4013551
Gene Length	1251 bp
Protein Length	416 aa
Translation table	11
GC content	73%
IMG OID	642765021
Product	HNH nuclease
Protein accession	YP_002135892
Protein GI	197123941
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	1
Plasmid unclonability p-value	0.00633328
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGACACCG CACTCGAGTT CACGAACCGC CTCGTCACCC TGCTCCGCTC CGAGCGCCAC 
GCCATGGCCG AGTTTCTGGT TGCCCTGGCC GAGTTCGAAC GGCGCGGGCT CTACCGGCAG 
CGGGGGCACA CCTCGCTGTT CTCGTTCCTG CATCGGGAGC TGAAGCTCTC GGCGGGCTCC 
GCTCAGCTCC GCAAGACGGC GGCGGAGCTC ATCAACCGTT TGCCGGCGGT CGAGGGCGCG 
CTCCGGGAGG GCAAGCTGTG CCTGTCCTCG GTCTGCGAGC TGGCGAAGGT GGTGACCACC 
GAGAACTGCG CGGAGATCCT GCCTCGGTTC TTCGGGCTGT CGAGCCGGGA TGCTGCCGCC 
GTGGTCGCTT CCATCCGGCC GGTGGAGAAC CCGCCCCGTC GCGAGGTCGT CGTGCCGATC 
CGGGCGACGT CTGCGCCGGC CGCGGTCACC ACCTCTGCCG CGGCTCCGGC GGCGGCCTCG 
CGCGACGCTG CATCGCCGGC GCCCGCGCGG GTCGCCTTGT TTCATGCGCA TGAAGTGAGA 
GCGCCGCCCT CCGGTCGCGC TGAGCCTGTA GAACGGCGAG CCTCCGAGGC CAGACCCGTC 
GCGAAGCCCA CCTCCGTCGA CTGGCTCGAC GCCGACCAGG CGCGGATTCA CCTCACCGTG 
TCCAAGGCGT TCCTGAAGAA GCTCGACGCG GGCCGTGATG CGCTCTCACA CTCCATGCCG 
GGCGCCTCCC GCGAGAACGT CCTCGAGGCC GCTCTCGACC TGCTCCTCGC CGAGCGCGCG 
CGTCGGAAGG GGCTCACCGC GAAGCCGCAG AAGACGGTTC GTCCTTCCCG GCCGGACCAC 
GTCCCGGCCC ACGTTCGCCG CGAGGTCTGG GCGCGCGACG GCGGGCGTTG CACCTTCCCC 
CTCCCGTCCG GCGAGCCGTG TGGCGCCACG CACCAGCTCG AGCTCGACCA CATCGTGCCG 
CGGGCGTGTG GAGGCGCCTC GACGGCCGAC AACCTCCGGA TCCGTTGCCG AGGGCACAAC 
CTGGAGGAGG CGCGACGGGT CCTCGGGGAC GAGGTGATGA ACGCGTACGC ACCGAGGAGC 
ACGGCCAGCA GGGAGGGGCC CCGGCCGCAG GCCGGGGAGG GACGCAATCC CTCCCCGCGG 
GGACCGCTCG CGCGCCCGCG CATGCGGGCG CGAGCGGTCA CGGGCCCCGC GACGCAGGAG 
TGGGGCCCCG ACGGCTCCGC CGGCGGGGGG AGGGCGCAGC CCTCGACCTA A

Protein sequence

MDTALEFTNR LVTLLRSERH AMAEFLVALA EFERRGLYRQ RGHTSLFSFL HRELKLSAGS 
AQLRKTAAEL INRLPAVEGA LREGKLCLSS VCELAKVVTT ENCAEILPRF FGLSSRDAAA 
VVASIRPVEN PPRREVVVPI RATSAPAAVT TSAAAPAAAS RDAASPAPAR VALFHAHEVR 
APPSGRAEPV ERRASEARPV AKPTSVDWLD ADQARIHLTV SKAFLKKLDA GRDALSHSMP 
GASRENVLEA ALDLLLAERA RRKGLTAKPQ KTVRPSRPDH VPAHVRREVW ARDGGRCTFP 
LPSGEPCGAT HQLELDHIVP RACGGASTAD NLRIRCRGHN LEEARRVLGD EVMNAYAPRS 
TASREGPRPQ AGEGRNPSPR GPLARPRMRA RAVTGPATQE WGPDGSAGGG RAQPST