Gene Anae109_4158 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Anae109_4158
Symbol
ID	5376315
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anaeromyxobacter sp. Fw109-5
Kingdom	Bacteria
Replicon accession	NC_009675
Strand	+
Start bp	4874520
End bp	4875686
Gene Length	1167 bp
Protein Length	388 aa
Translation table	11
GC content	73%
IMG OID	640845685
Product	HNH endonuclease
Protein accession	YP_001381320
Protein GI	153006995
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	36
Fosmid unclonability p-value	0.0493415
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCCGCGA TCGCCCCTTC CGCCCTCGAC TCGACCCTGC TCGCCCAGCG CCTGCGCGAG 
CTCGCAGGCC AGGAGCGCGA CGTCCAGGTC GAGTTCCTCC TCCACCTCGA GGAGTTCGAT 
CGCCGCCGCG CCTACGTGGA GGCCGGCTAC CCCTCGCTCT GGGCGTATTG CCTGGAGGTG 
CTCCACCTGC GCGAGGGCGC TGCCGGGCGA CGCATCCAGG CGATGCGGGT GCTGTGCCGG 
TTCCCCAGCC TCGAGGACGC CCTGCGCGAC GGGCGCCTGG GTTTGTCCAC CGTCCAGCTG 
CTCGGCCAGG TGCTGACCGA GGAGAACCTG CCCGACCTCG TCGGCCGTGC CGCCTACCGC 
ACCAAGGCCG AGGTGGATCA CCTCGTCGCC TCGCTCCAGG CGCGCACGGC TCCGCGGACG 
GGCCTGCGCA AGCTGCCCGA CCGCGCCTCA GCCGCGAGCG CCCCGGCGCT GCCGCTGGCG 
ACAGTCCATG CCGGACCTGC CGAGCCGCAG GAGGCGATCC CCGCGCCGGC GGCGGCTGGT 
GGGTCGCTGC CGCCCACGGT CTCCGCGCTG CCCGACGTTC CTCGCCCGAA GGCGCGGGCG 
GAGACCCGCG CCGTGAGCGA GAGCGGCTGG TCGCTGCGGG TCACCATCGA CCGGGGCTGC 
AAGGAGGACC TCGAGACGCT CACCGCGCTG CTCTCGCACA AGATCCCGGA CGGCGATCTC 
GCGGCGGTGC TCCGGGAGGC CATCCGCTGC GCCGTCGAGA AGCACGGCAA GCGCAAGGGC 
GCGATCGCGC CGGAGCGGCA GCGGAAGGCC GACCGGGAGA CACGTCCCTC CGCCGAGCCC 
GCCGCGCCCA CGAGCACGAT CCCGGCGATA GTGCGGCGCG AGGTCTGGAA GCGCGACGGC 
GGACGCTGCG CCTGGGTCGC TCCGGACGGG CGGCGCTGCG ACAGCCGCTG GCAGCTGGAG 
CTCGACCACA TCCAGCCGCT CGCTCTGGGG GGGCTCTCGA CGCTCGACAA TCTCCGGGTC 
GCCTGCAAGC CCCATAACCT GTTGCACGCC GAACAGACCT ATGGGCGCGA GCACATGGAT 
CGTTTCCGGC GTGAGAGCGT CTCCGAGCGG ACGGGGCATG CCGGCACCGC GCCAGCTGCC 
ATTCAGCAGG GCTTGTGGGC AACGTGA

Protein sequence

MPAIAPSALD STLLAQRLRE LAGQERDVQV EFLLHLEEFD RRRAYVEAGY PSLWAYCLEV 
LHLREGAAGR RIQAMRVLCR FPSLEDALRD GRLGLSTVQL LGQVLTEENL PDLVGRAAYR 
TKAEVDHLVA SLQARTAPRT GLRKLPDRAS AASAPALPLA TVHAGPAEPQ EAIPAPAAAG 
GSLPPTVSAL PDVPRPKARA ETRAVSESGW SLRVTIDRGC KEDLETLTAL LSHKIPDGDL 
AAVLREAIRC AVEKHGKRKG AIAPERQRKA DRETRPSAEP AAPTSTIPAI VRREVWKRDG 
GRCAWVAPDG RRCDSRWQLE LDHIQPLALG GLSTLDNLRV ACKPHNLLHA EQTYGREHMD 
RFRRESVSER TGHAGTAPAA IQQGLWAT