Gene Anae109_1431 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Anae109_1431
Symbol
ID	5376333
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anaeromyxobacter sp. Fw109-5
Kingdom	Bacteria
Replicon accession	NC_009675
Strand	+
Start bp	1619086
End bp	1620252
Gene Length	1167 bp
Protein Length	388 aa
Translation table	11
GC content	74%
IMG OID	640842942
Product	HNH endonuclease
Protein accession	YP_001378622
Protein GI	153004297
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	0.535031
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	59
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCCGCGA TCGCCCCTTC CGCCCTCGAC TCGACCCTGC TCGCCCAGCG CCTGCGCGAG 
CTCGCCGGCC AGGAGCGCGA CGTCCAGGTC GAGTTCCTCC TCCACCTCGA GGTGTTCGAT 
CGCCGCCGCG CCTACGTGGA GGCCGGCTAC CCCTCGCTCT GGGCGTATTG CCTGGAGGTG 
CTCCACCTGC GCGAGGGCGC GGCCGGGCGA CGCATCCAGG CGATGCGGGT GCTGCGCCGG 
TTCCCCAGTC TCGAGGGCGC GCTTCGGGAT GGCCGCCTTT GCATCTCCAC CGTCCAGCTG 
CTCGGCCAGG TGCTGACCGA GGAGAACCTG CCCGACCTCG TCGCCCGGGC CGCCTACCGC 
ACCAAGGCCG AGGTGGATCA CCTCGTCGCC TCGCTCCAGG CGCGCACGGC TCCGCGGACG 
GGCCTGCGCA AGCTGCCCGA CCGCGCCTCA GCCGCGAGCG CCCCGGCGCT GCCGCTGGCG 
ACAGTCCATG CCGGACCTGC CGAGCCGCAG GAGGCGATCC CCGCGCCGGC GGCGGCTGGT 
GGGTCGCTGC CGCCCACGGT CTCCGCGCTG CCCGACGTTC CTCGCCCGAA GGCGCGGGCG 
GAGACCCGCG CCGTGAGCGA GAGCGGCTGG TCGCTGCGGG TCACCATCGA CCGGGGCTGC 
AAGGAGGACC TCGAGACGCT CACCGCGCTG CTCTCGCACA AGATCCCGGA CGGCGATCTC 
GCGGCGGTGC TCCGCGAGGC CATCCGCTGC GCCATCGAGA CGCACGGCAA GCGCAAGGGC 
GCGATCGCGC CGGAGCGGCA GCGGAAAGCG GACGGGGACC CACGGCCCTC TGCCGAGCGC 
GCCGCGCCCA CGGGCACGAT CCCGGCGATA GTGCGGCGCG AGGTCTGGAA GCGCGACGGC 
GGACGCTGCG CCTGGGTCGC TCCGGACGGG CGGCGCTGCA ACAGCCGCTG GCAGCTGGAG 
CTCGACCACA TCCACCCGCA GGCCCTGGGC GGACCCTCGA CGGTCGAGAA CCTCCGAGTC 
GCCTGCAAGT CGCACAACCT GTTGCACGCC GAACAGACCT ACGGGCGCGA GCACATGGAC 
CGCTTCCGTC GCATGGGCGT CGCCGGGGTG ACGCCAGATG CCAGCGGGGC GCCACCAGCG 
CCGCAGCAGG CCCTGTGGGG ACCGTGA

Protein sequence

MPAIAPSALD STLLAQRLRE LAGQERDVQV EFLLHLEVFD RRRAYVEAGY PSLWAYCLEV 
LHLREGAAGR RIQAMRVLRR FPSLEGALRD GRLCISTVQL LGQVLTEENL PDLVARAAYR 
TKAEVDHLVA SLQARTAPRT GLRKLPDRAS AASAPALPLA TVHAGPAEPQ EAIPAPAAAG 
GSLPPTVSAL PDVPRPKARA ETRAVSESGW SLRVTIDRGC KEDLETLTAL LSHKIPDGDL 
AAVLREAIRC AIETHGKRKG AIAPERQRKA DGDPRPSAER AAPTGTIPAI VRREVWKRDG 
GRCAWVAPDG RRCNSRWQLE LDHIHPQALG GPSTVENLRV ACKSHNLLHA EQTYGREHMD 
RFRRMGVAGV TPDASGAPPA PQQALWGP