Gene Anae109_3988 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Anae109_3988
Symbol
ID	5378134
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anaeromyxobacter sp. Fw109-5
Kingdom	Bacteria
Replicon accession	NC_009675
Strand	-
Start bp	4654793
End bp	4657741
Gene Length	2949 bp
Protein Length	982 aa
Translation table	11
GC content	62%
IMG OID	640845515
Product	hypothetical protein
Protein accession	YP_001381150
Protein GI	153006825
COG category	[L] Replication, recombination and repair
COG ID	[COG1743] Adenine-specific DNA methylase containing a Zn-ribbon
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	37
Fosmid unclonability p-value	0.172712
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGTTAACG GGCACCAGCC GAGGCGGCTG ATCGAGGTTG ATCTCCCTAT TCGTGTCATC 
TCGCAGCACG CCCGTCACGA AAAGTCGATC CGCCACGGTC ACCTATCGAC GCTACACATC 
TGGTGGGCAA GGCGTCCTCT CGCCGCCTGC AGAGCAGTCG CGTTGGCAGC GCTCCTTCCC 
GATCCTGCGG ACGAGTATTG CCCCAAGGAA TTCAGGGAGG AGGCGGCCGC AGCGCTGTCG 
TGCCTTCGCG ACGCCGTCGG AGGTCCGAGG GTTGATTGGA ATTCGGAAAC CGAGCTCCGA 
AAAGCATTGC TACGCTTCGT TGGAGATATC GCCGCGCACG AAAACGCATC GTCGGGTCCC 
GTGCTTGATG CGGCGCGACG CATGGTTCTG TCGGCACAGT TGAGTCTGCA CCCCGGTCGT 
ACTGACAGAC CGCTTATCGT TGATCCGTTC GCCGGTGGCG GGGCGATCCC AGTTGAGGCG 
CTACGGCTTG GGGCCGACGT GTTTGCGTCG GACCTCAATC CGATCGCCGT ACTTCTTAAC 
CGGCTGAGTG CGGAGCTTCT GCCAAAGTTC GGGGCACAGT TGGCTGACGA ACTCGAGCGC 
TGTGGCGAAT GGGTGGCGTC ACGAGCTGAG CAAGAGTTGC GTCGCTTCTA TCCGGCCGGT 
TCTGATGGGA GTGCTCCCAT TGCCTACCTA TGGGCGCGCA CGATCAGGTG TGAGGGGCCG 
GGGTGTGGTG TTGAGCTGCC GCTGATCCGC TCCACGGTTA TTGCGCGGAA GTCGGGTCGG 
TCCATGTTCC TCAAGTTGCG CGTCGTTAAG AGCGCTAATC GAATAGATTT CGCAATCGAG 
GAGGGCACAC CATCTGCGGC AGAGGCGCTG GGAACCATTA AGCGCGGGTC AGCCACCTGC 
CCGTTATGTG GGTTCACTAC GGCGAACGCG AGGTTGCGAG CGCAGCTATC GGAACGCCGC 
GGCGGTGCAG CAGACGCTCG GCTTCTGGCC GTAGTCTCGA CTAAACGGGG AGAGCAAGGA 
AGGAAGTACA GGCTCCCGAC AACCAAAGAT GTCGAGGCAT TCGCCCAAGC GCAGAACGAG 
CTACGAAAGC GCCAGTCCTC GTTCGAGGGG GCCATTCCGC TAGTACCTGA TGAGCTAGTC 
CCGGCGGAGC GGCCGTCCCC TAATGCGAGA GGGCTGTCCG CGGTTACACG TATGGGAGTT 
CGGACCTTCG GCGACCTGTT CACGCCACGG CAACTCCTCG CTCATACGAC GTTCGTGCGT 
TTGTGCCGCG AAGCGGGTGC GGACATCGGC TCGCCTGAAA TGAGGAAGGC GGTCCGCCTT 
TGTCTGGCGT TGTCTCTCTC GAAGGCGACA GATCTAGGGA ATTCGTGCAC TCGATGGAAG 
CCGGATGCGG AATGCCCCGT TAACCTGTTT GCGCGGCAAG CCATCCCGAT CGTGTGGGAT 
TTTGCGGAAA CGGTTTCGCT GTCCGATGCG AGTGGGTCCT GGCGAAGCAT GTTCGAGCGA 
ACCGCATACG CACTTCGGCA GTGCTCGTTC GAGGCGCCTG GAAAAGCGAC AGTGCAATCG 
GCTTCGGCGG CTGAACACCC GCTGCCGGAT GACGCCGCGG CTGCGCTTGT TACGGACCCT 
CCTTACTACG ACGCTGTCCC GTACGCCGAT CTTTCTGACT TCTTCTATGT CTGGCTGCGG 
CGTGTCCTCT TCGACGACGC CCCTGACCTC TTCAGTTCCC GGACAACGCC GAAGGACGAG 
GAAGCGATTT GGAACCCGAC TCGCAAGTAC GGGCCGACCG GACGTCAGAA GGATCAGGCC 
TTTTATGAGG AGCAGATGTA TCGGTGCCTC GCGGAGGCAA GGCGCGTTAC GGCCCCCGAT 
GGCATCGGGG TCGTGGTGTT CGCGCACAAG AGCACGGAGG GATGGGAGGC AATTCTCGGC 
TCGCTGATCC GCGCAGGTTG GGTCGCGACG GCCTCTTGGC CGATCGATAC GGAGATGGGA 
AGCCGGGTCA ATGCGATGGG GACCGCATCG CTGGCGTCTT CTGTTCACAT CGTGTGCAGG 
CCCAGGGGAG TTGATCAAGC ACACGTCGGT GAATGGAAGG TCGTCCTAGC TGAGCTCCCT 
GAGCGTATCC ACCAATGGCT TCCGCGCCTA GCTCACGAGG GAGTTGTGGG TGCAGATGCG 
ATTTTCGCGT GTCTCGGGCC AGCATTGGAG ATCTTCTCTC GCTACTCGCG TGTCGAGAAG 
GTGAACGGCG AGGCGGTGCC GCTTCGCGAG TACCTGGAGC ACGTCTGGGC AGCAGTAGCT 
CGCGAGGCGC TCGCGTCGAT CTTTCGAGAC GCGGACACTG CCGGCCTCGA GGCAGATGCG 
CGCCTGACTG CGATGTGGCT GTGGACTCTT GCTGGACCCG AGCCGAGCGG TGACTCGGGC 
GATGAGCAGG ATCAGGTGCC CGACGAGGAT GAGGATGACG ATCAGGGGGA CAGGGGCGGA 
TCTGGGGGTG CGGTTCTTCC GTTCGACACC GCGAGGAAGA TCGCGCAGGG ACTCGGTGTC 
CGATTCGATG AACTTCAGCA AGTAGTCGAA ATCAAGAAGG ACAAGGCTCG CCTTATTGCA 
GTAGCCGAAC GCGCGAAATA CTTGTTCGGC AGGCACGAAG GCGTGCCTGC CGGCAAGAAG 
GCGGCCGCCA AGAAACAGGC GGTGCTATTC ACGGACCTCG AGCGACCTGC CGGCGAGGAG 
GCGTGGGGAG AGGGCGGCGC GCCAAAGGCT GGAACGACGA CTCTCGACCG CGTGCATCAA 
GCGATGCTTC TTTTTGGGGG CGGGCGCAGT GATGCGCTGA AGCGCTTCCT TGTGGAAGAT 
CGCATCGGCA TGCAGGCGCA ATTCTGGAAG CTAGCGCAGT CGCTGTCGGC TCTTTATCCG 
AGCGGTTCCG ACGAAAAGCG GTGGGTCGAC GGCGTCCTTG CTCGAAAGAA GGGACTTGGC 
TTCGGATGA

Protein sequence

MVNGHQPRRL IEVDLPIRVI SQHARHEKSI RHGHLSTLHI WWARRPLAAC RAVALAALLP 
DPADEYCPKE FREEAAAALS CLRDAVGGPR VDWNSETELR KALLRFVGDI AAHENASSGP 
VLDAARRMVL SAQLSLHPGR TDRPLIVDPF AGGGAIPVEA LRLGADVFAS DLNPIAVLLN 
RLSAELLPKF GAQLADELER CGEWVASRAE QELRRFYPAG SDGSAPIAYL WARTIRCEGP 
GCGVELPLIR STVIARKSGR SMFLKLRVVK SANRIDFAIE EGTPSAAEAL GTIKRGSATC 
PLCGFTTANA RLRAQLSERR GGAADARLLA VVSTKRGEQG RKYRLPTTKD VEAFAQAQNE 
LRKRQSSFEG AIPLVPDELV PAERPSPNAR GLSAVTRMGV RTFGDLFTPR QLLAHTTFVR 
LCREAGADIG SPEMRKAVRL CLALSLSKAT DLGNSCTRWK PDAECPVNLF ARQAIPIVWD 
FAETVSLSDA SGSWRSMFER TAYALRQCSF EAPGKATVQS ASAAEHPLPD DAAAALVTDP 
PYYDAVPYAD LSDFFYVWLR RVLFDDAPDL FSSRTTPKDE EAIWNPTRKY GPTGRQKDQA 
FYEEQMYRCL AEARRVTAPD GIGVVVFAHK STEGWEAILG SLIRAGWVAT ASWPIDTEMG 
SRVNAMGTAS LASSVHIVCR PRGVDQAHVG EWKVVLAELP ERIHQWLPRL AHEGVVGADA 
IFACLGPALE IFSRYSRVEK VNGEAVPLRE YLEHVWAAVA REALASIFRD ADTAGLEADA 
RLTAMWLWTL AGPEPSGDSG DEQDQVPDED EDDDQGDRGG SGGAVLPFDT ARKIAQGLGV 
RFDELQQVVE IKKDKARLIA VAERAKYLFG RHEGVPAGKK AAAKKQAVLF TDLERPAGEE 
AWGEGGAPKA GTTTLDRVHQ AMLLFGGGRS DALKRFLVED RIGMQAQFWK LAQSLSALYP 
SGSDEKRWVD GVLARKKGLG FG