Gene Anae109_1449 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Anae109_1449
Symbol
ID	5374050
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anaeromyxobacter sp. Fw109-5
Kingdom	Bacteria
Replicon accession	NC_009675
Strand	-
Start bp	1644355
End bp	1645530
Gene Length	1176 bp
Protein Length	391 aa
Translation table	11
GC content	74%
IMG OID	640842960
Product	HNH endonuclease
Protein accession	YP_001378640
Protein GI	153004315
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	0.964003
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	55
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCCGCGA TCGCCCCTTC CGCCCTCGAC TCGACCCTCC TCGCCCAGCG CCTGCGCGAG 
CTCGCAGGCC AGGAGCGCGA CGTCCAGGTC GAGTTCCTCC TCCACCTCGA GGTGTTCGAT 
CGCCGCCGCG CGTACGTGGA CGCCGGCTAC CCCTCGCTCT GGGCGTATTG CCTGGAGGTG 
CTCCACCTGC GCGAGGGCGC GGCCGGGCGA CGCATCCAGG CGATGCGGGT GCTGCGCCGG 
TTCCCCAGCC TCGAGGACGC CCTGCGAGAT GGCCGCCTTT GCATCTCCAC CGTCCAGCTG 
CTCGGCCAGG TGCTGACCGA GGAGAACCTG CCCGACCTCG TCGGCCGGGC CGCGTACCGC 
ACCAAGGCGG AGGTGGATCA CCTCGTCGCC TCGCTCCAGG CGCGCACCGC TCCGCGGGCG 
GGCCTGCGCA AGCTGCCCGA CCGCGCTGCA GCCGCGAGCG CCCCGGCGCT GCCGCTGGCG 
GCAGTGGATG CCGGACCTGC CGAGCCGCAG GAGTCGCCGC TCGCGCCGCC GTCGTCGGCC 
GCTGCTGCCG GGGTGTCCCC CGCCACGATG CCCGCGCCGT CCGACCCGTC TCGCCAGAGG 
ACGCGGGCGG TCACCCGTGC GGTGAGCGAG AGCGGCTGGT CGCTGCGGGT CACCATCGAC 
CGGGCCTGCA AGGAGGACCT CGAGACGCTC ACCGCGCTGC TCTCGCACAA GTTCCCGGAC 
GGCGATCTCG CGGGGGTGCT CCGGGAGGCC ATCCGCTGCG CCATCGAGAA GCACGGCAGG 
CGCAAGGGCG CGGTCGCGCC GCAGCGGCAG CGGGGGACCG ACCGGGAGCC ACGTCCCTCC 
GCCGAGTCCG CCGCGCCCAC GAGCACGATC CCGGCGATAG TGCGGCGCGA GGTCTGGAAG 
CGCGACGGCG GACGCTGCGC CTGGGTCGCT CCGGACGGGC GGCGCTGCAA CAGCCGCTGG 
CAGCTGGAGC TCGACCACAT CCACCCGCAG GCCCTGGGCG GACCCTCGAC GGTCGAGAAC 
CTCCGAGTCG CCTGCAAGTC GCACAACCTG TTGCACGCCG AACAGACCTA CGGGCGCGAG 
CACATGGATC GCTTCCGGCG TGAGAGCGTC TCCGAGCGGA CGGGGCATGC CGGCACCGCC 
CCAGCTGCCA TTCAGCAGGG CTTGTGGGCA ACGTGA

Protein sequence

MPAIAPSALD STLLAQRLRE LAGQERDVQV EFLLHLEVFD RRRAYVDAGY PSLWAYCLEV 
LHLREGAAGR RIQAMRVLRR FPSLEDALRD GRLCISTVQL LGQVLTEENL PDLVGRAAYR 
TKAEVDHLVA SLQARTAPRA GLRKLPDRAA AASAPALPLA AVDAGPAEPQ ESPLAPPSSA 
AAAGVSPATM PAPSDPSRQR TRAVTRAVSE SGWSLRVTID RACKEDLETL TALLSHKFPD 
GDLAGVLREA IRCAIEKHGR RKGAVAPQRQ RGTDREPRPS AESAAPTSTI PAIVRREVWK 
RDGGRCAWVA PDGRRCNSRW QLELDHIHPQ ALGGPSTVEN LRVACKSHNL LHAEQTYGRE 
HMDRFRRESV SERTGHAGTA PAAIQQGLWA T