Gene Ava_1159 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ava_1159
Symbol
ID	3683354
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anabaena variabilis ATCC 29413
Kingdom	Bacteria
Replicon accession	NC_007413
Strand	-
Start bp	1419380
End bp	1420930
Gene Length	1551 bp
Protein Length	516 aa
Translation table	11
GC content	42%
IMG OID	637716495
Product	N-6 DNA methylase
Protein accession	YP_321678
Protein GI	75907382
COG category	[V] Defense mechanisms
COG ID	[COG0286] Type I restriction-modification system methyltransferase subunit
TIGRFAM ID	[TIGR00497] type I restriction system adenine methylase (hsdM)

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.000301602
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGTGAAC GTAATGGTAA TGGGGACAAA TCCCTAGAAA ATTGGATATG GGATGCTGCT 
TGTAGTATTC GCGGAGCGCA GGAAGCAGCG AAGTATAAGG ATTTTATTCT GCCGTTGATT 
TTTACTAAAC GACTCTGTGA TGTATTCGAT GATGAACTAA ATCGGATTGC TGAGAAGGTA 
GGTTCTCGTG CCAAGGCGTT TAAGTTAGTG GCAATGGATC ATAATTTAGT GCGGTTTTAT 
TTGCCACTGC AACCACAGAA TCCTGATGAT CCGGTTTGGT CAGTGATTCG CAAGCTTTCA 
GACAAGATTG GGGAGAAGTT AACAGACTAT TTGCGAGAAA TTGCTAAGGC GAATCCTTTG 
TTGAATGGGA TTATTAATCG AGTTGATTTT AATGCCACAA CTCATGGACA GCGTGACCTT 
GATGATGATC GCCTCTCGAA CCTGATTGAA AAAATCTCGG AGAAGCGTCT AGGGTTAAAG 
GATGTAGAGC CAGATATCAT TGGGCGCAGT TATGAGTATT TGATTCGCAA GTTTGCTGAA 
GGTTCAGGAC AGTCAGCAGG AGAATTTTAC ACCCCGAAGG AAGTAGGGCT AATCATGGCG 
AAGATTATGC AACCAGAACC AGGGATGACG ATTTATGATC CCTGTTGTGG TTCGGCAGGT 
TTGTTGATTA AGTGTCAGTT GGTATTGCAA GAATCACAAG GTGCAACGGA AAAGTTTGCA 
CCGTTGCAAC TGTATGGACA GGAATACACT CCGAATACTT GGGCAATGGC AAACATGAAC 
ATGATTATCC ATGATATGGA GGGAAAAATC GAAATTGGGG ATACCTTTCG CCATCCGAAA 
TTCATGCAAG CAGGGAAATT AGCTCAGTTT GAGCGAGTGG TGGCTAATCC CATGTGGAAT 
CAGAAATGGT TCACAGAGAA AGATTATGAC GGTGATGAGT TAGGACGTTT CCCCAAAGGA 
GCAGGTTATC CAGGTTCATC AGCTGATTGG GGTTGGGTAC AACATATTTT GGCATCCTTA 
GATAAAACGG GAAAGGCAGC GATCGTTTTA GATACAGGTG CAGCGTCACG GGGTTCAGGG 
AATGCTAATA AGAATAAGGA GAAGGAAGTT AGGAAGTGGT TTGTAGAACA GGATTTGATT 
GAAGGGGTGA TTTATCTACC ACAAAATCTG TTCTATAACA CTTCTGCCCC AGGTATTCTT 
TTATTTTTGA ATAGAGCTAA ACCGAAAGAA CGACAAGGTA AGCTATTTTT CATCAATGCA 
AGTTTGGTAT TTGCTAAAGG CGATCCGAAA AATTATATTC CTGATGAGGA AATTGAGCGC 
ATTGCCAACA CGTTTTTAAC TTGGCGGGAG GAGGAGAAAT TCAGCCTCAT TGTCTATAAG 
GATAAGATTG CCCATAATGA TTATAATATT TCGCCATCTC GTTATATTCA TATAACAGAA 
GAGGAGGATT TCAGACCCAT TGCGGAGATT TTGGAGGAGT TAGAGGTTTT AGAGAAGGAA 
GCTGCGGAAA CGAATAAATT ATTAATGAAA GTTTTAGGGA GATATCAATG A

Protein sequence

MGERNGNGDK SLENWIWDAA CSIRGAQEAA KYKDFILPLI FTKRLCDVFD DELNRIAEKV 
GSRAKAFKLV AMDHNLVRFY LPLQPQNPDD PVWSVIRKLS DKIGEKLTDY LREIAKANPL 
LNGIINRVDF NATTHGQRDL DDDRLSNLIE KISEKRLGLK DVEPDIIGRS YEYLIRKFAE 
GSGQSAGEFY TPKEVGLIMA KIMQPEPGMT IYDPCCGSAG LLIKCQLVLQ ESQGATEKFA 
PLQLYGQEYT PNTWAMANMN MIIHDMEGKI EIGDTFRHPK FMQAGKLAQF ERVVANPMWN 
QKWFTEKDYD GDELGRFPKG AGYPGSSADW GWVQHILASL DKTGKAAIVL DTGAASRGSG 
NANKNKEKEV RKWFVEQDLI EGVIYLPQNL FYNTSAPGIL LFLNRAKPKE RQGKLFFINA 
SLVFAKGDPK NYIPDEEIER IANTFLTWRE EEKFSLIVYK DKIAHNDYNI SPSRYIHITE 
EEDFRPIAEI LEELEVLEKE AAETNKLLMK VLGRYQ