Gene AnaeK_2101 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	AnaeK_2101
Symbol
ID	6788106
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anaeromyxobacter sp. K
Kingdom	Bacteria
Replicon accession	NC_011145
Strand	+
Start bp	2359492
End bp	2361222
Gene Length	1731 bp
Protein Length	576 aa
Translation table	11
GC content	78%
IMG OID	642763561
Product	HNH nuclease
Protein accession	YP_002134457
Protein GI	197122506
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGGACGCGC TCGTTCGCCA GCAAATCCAG CCGCTTGACG CCCCGTCAGG GCTGGAGGCG 
CTCGCGGCGC AGGCCTGGGT GCTGGAGGTG CCCCGGCCGA CCGAGCGGCG GTTCATCCTG 
CGGCCGGAGG CGGCGGAGCT GGTGGACGGG CTGCTGGCCC GGGTGGCCCG CGGCGCGGGG 
GCACTGGACG TGGCGCTGGG CCGTGGCCTG CGCGCGGTCG AGAAGGCCGG CGGTCCGCTT 
CGCCTGGGGT ACTCGAGCCT GGGCGACTAC GCGCGCGAGC GGCTGGGGCT CCCGGAATCG 
ACCTCCCGGC GGCTGGCGCG GCTCTCGGCG GGTCTGGACG AGCGGCCGCT GCTCGATGCG 
GCGGTCCGGG CGGGCGAGGT GAGCCTGCGG AAGGCGCAGG TCATCCTCGG CGTGGCCCGG 
GGGGCGGACG AGGCGCGCTG GGTGGCGCAG GCGCGGGACG CGACGGTCCG GGCGCTCGCC 
GCCGCGGTGC GCGCGGAGCG GGGCGGCGAT GGCGGGACGG CGGACGCGGG CGAGGGCGCC 
GAGCCGCTGG TGCCGCTCGA GCTGGAGATC TCCGAGGACG ATCGGGTGGC GCTGCGCGAG 
GCGCTGTCGC TGGCGGGCAC GACGCTGGGC GCGACGGCGC CGCCCTGGCA GCGGCTCGAG 
GCGCTCTGCC AGGAGTACCT CGCCTCGCAC CCGGAGCCGG AGCGGCTCCG GCTCGAGGAC 
CTCGACGCGG ACGCGGCGAC GGCCGCGGGC GCGCTGGAGG GCGCGCCGCG GGGGCGGGGC 
AGCGAGTGGT GGGACGCGGC GCGGCTCGCG CTGGAGGAGG AGACGGAGCG CTGGAGCTAC 
CTCGAGCGGC TCGAGCCGCT CCCGGCGCCG GATCCGGCGG GCGGGCTCGC GCCAGGCGAC 
CTGCAGGCCC TCGATGCGCG TCTGTGCGAG CTCGCCGCGA TGCGCGCGCG CTGGGACGAG 
CTGGTGGGCC ACCTGGGCCT GCTCATGCGC TCCCTTGGCC TCTGGCGGGA GGCGGGCTTC 
GCCTCCTTCG GCCACTACTG CGCCGAGCGC CTGGGCCTCT CGCTCCGGGC GGTCGAGCAG 
CGCATCGCGC TGGAGCGACG CCTTCACGAG CTGCCGCCGC TCCGCGCGGC GCTGGCGTCG 
GGGCGGGTCT CCTACGGCAA GGCGGTCGTG GTGGCGGCGG CTGCGGACGA GGACACGGTC 
GAGGCCTGGA TCGCGCGCGC GGAGACCACG CCGTGCGCGG CGCTCCGGCG CGAGGCGGAG 
TCGGCGGAGG ACGCGCAGAT GTGTGCGCGG CGCGCGTGGA AGGCCCGGCT GCCCGCGCGG 
GTGGTGAACC TGCTCGACGC CGCCCTGGGC GCGGCCCGCC TGGCCGCGGG GAGGCCGGTC 
CGGGACGGCG AGTGCCTGGG GATCATCGCG CGGCACTTCA TCGACACCTG GAAACCGTCG 
TTGCGCGGCC GGCGCACGCT GGCCCACCGG GTCCTGGAAC GCGACGGCGG GCTCTGCCTT 
GCGCCGGGGT GCACCCGCGC GGCGGACCAC GCGCATCACC TGTGGCAGCG CGCGCACGGT 
GGACCGGACG TTCCGTGGAA CCTCGCCTCG CTGTGCGCGC CGCACCACCT CGTCGCGATC 
CACGGGGGCT TCCTGCGCGT GCGCGGGAGG GCGCCGCACG CGCTGGAGTG GAAGTTCGCG 
GGGTCGGCGC CGGTGGGGAG CGGGCGCGGC GGAGGCGTCG GGTCCGGCTA G

Protein sequence

MDALVRQQIQ PLDAPSGLEA LAAQAWVLEV PRPTERRFIL RPEAAELVDG LLARVARGAG 
ALDVALGRGL RAVEKAGGPL RLGYSSLGDY ARERLGLPES TSRRLARLSA GLDERPLLDA 
AVRAGEVSLR KAQVILGVAR GADEARWVAQ ARDATVRALA AAVRAERGGD GGTADAGEGA 
EPLVPLELEI SEDDRVALRE ALSLAGTTLG ATAPPWQRLE ALCQEYLASH PEPERLRLED 
LDADAATAAG ALEGAPRGRG SEWWDAARLA LEEETERWSY LERLEPLPAP DPAGGLAPGD 
LQALDARLCE LAAMRARWDE LVGHLGLLMR SLGLWREAGF ASFGHYCAER LGLSLRAVEQ 
RIALERRLHE LPPLRAALAS GRVSYGKAVV VAAAADEDTV EAWIARAETT PCAALRREAE 
SAEDAQMCAR RAWKARLPAR VVNLLDAALG AARLAAGRPV RDGECLGIIA RHFIDTWKPS 
LRGRRTLAHR VLERDGGLCL APGCTRAADH AHHLWQRAHG GPDVPWNLAS LCAPHHLVAI 
HGGFLRVRGR APHALEWKFA GSAPVGSGRG GGVGSG