Gene Avin_52350 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Avin_52350
Symbol
ID	7764070
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Azotobacter vinelandii DJ
Kingdom	Bacteria
Replicon accession	NC_012560
Strand	-
Start bp	5349866
End bp	5351548
Gene Length	1683 bp
Protein Length	560 aa
Translation table	11
GC content	53%
IMG OID	643808048
Product	adenine specific DNA methylase N-4/N-6
Protein accession	YP_002802282
Protein GI	226947209
COG category	[L] Replication, recombination and repair
COG ID	[COG2189] Adenine specific DNA methylase Mod
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGTAAAC AAAAACTCGA ACTCACATGG GTTGGAAAGG ATAAGCGGCC CAAGCTAGAG 
CCGCGCATCC TACTTGAAGA TCCCGAAAAA TCTTACCATG CCAAGCAGCG TGTTTCAGAG 
AACGACTTCT TTGATAATCA GCTGATTTTC GGAGATAACC TGCTGGCGTT GAAGGCGCTG 
GAGCAGGAGT TTTCTGGAAA GGTAAAGTGC GTTTTTATTG ACCCGCCTTA CAACACTGGG 
AGTGCCTTCA CGCATTATGA CGACGGGTTG GAGCACTCCA TCTGGCTGGG ACTAATGCGG 
GATCGACTGG AGATCATCAA GCGGCTATTG TCGGACGATG GTTCATTATG GATCACCATT 
GACGATAATG AATGTCATTA TCTCAAGGTG CTATGCGACG AAGTATTTGG AAGAAATAAC 
TTTGTTAGTA ATTTGATTTG GGAGAAAGCG GATTCACCTA GGAATTCTGC CCGTCAATTT 
TCGACCGATC ATGACCATAT TTTAATTTTT TCCAAGAACC CTGATTGGAT TCCTAAAAAA 
CTTCAACGCA CGGAACAAGC CAACTCCATA TATTCGAACC CAGATAACGA TCCACGTGGC 
CCTTGGCTTC CCGGCGACCC CTACGCAAAC AAGCCGTACT CCAAAGGCCA ATACACAGTT 
ACTGGGCCTA CAGGGAGGGA TTTCTCACCA CCTCCTGGAA GATATTGGCG TATTTCAGAG 
GAAAAACTTC AAGAGTTAAA CACCGATGGC AGAATTTGGT GGGGGCCAAA TGGATCTGCT 
CGACCAAGCA TTAAACGATA TCTTTCTGAG GTAGGGGATC TTGTCCCAAG AACCTTATGG 
TCCAAAGAGG ATGTTGGAAG CAACCGTACA TCCAAGAATG AAATGCGGCT CCTTTTTCCA 
GGAGATAGCT CCTTCGATAC GCCCAAACCT GAGCGCCTCA TAGAGCGAGT ATTGAATATT 
GCCACCAGTC CCGGCGACCT AGTCCTTGAC TCATTCGCCG GTTCCGGCAC CACCGGCGCA 
GTTGCCCACA AAATGGGCCG CCGCTGGATC ATGGTCGAAC TCGGCGAGCA CTGCCATACC 
CACATTATTC CACGTCTGAA AAAGGTCATC GACGGCGAAG ACCCGGGCGG CATCACCAAG 
GCAGTGGACT GGCAAGGTGG CGGTGGCTTC CGCTACTACC GTCTCGCCCC TAGCCTGATC 
GTGGAGGATC GCTGGGGCAA TCCGGTCATC AACCCGGAAT ATAACGCCGC TCAATTGGCC 
GAGGCATTGT GCAAGTTGGA AGGTTTTGCC TATGCGCCAT CGGAAACCCG CTGGTGGCAG 
CAGGGACATT CCAGTGAACG GGACTTTCTC TACATCACCA CGAAAAACCT GTCTGCCGCC 
CAGTTGCAGG CTTTGTCGGA TGAAGTGGGC ACCGAACAAA GCCTGCTGGT GTGCTGCTCG 
GCCTTCCACG GTATCAGCGC AGCAGCGGCC GCTGCGCGCT GGCCGAACCT GACGTTGAAA 
AAGATTCCGA AGATGGTACT GGCCCGTTGC GAATGGGGCC ATGACGACTA CAGCCTGAAT 
GTGGCGAACC TGCCGCTGGC CGAGTCGTCG CCGCCAGCAC CTGCTGCGAA GGCAGCCAAG 
TCCGGCAGAA AGTCCAGCGA TAGTCGGACG ACGGACATGT TTGGCGATGG AGGGGACGCC 
TGA

Protein sequence

MSKQKLELTW VGKDKRPKLE PRILLEDPEK SYHAKQRVSE NDFFDNQLIF GDNLLALKAL 
EQEFSGKVKC VFIDPPYNTG SAFTHYDDGL EHSIWLGLMR DRLEIIKRLL SDDGSLWITI 
DDNECHYLKV LCDEVFGRNN FVSNLIWEKA DSPRNSARQF STDHDHILIF SKNPDWIPKK 
LQRTEQANSI YSNPDNDPRG PWLPGDPYAN KPYSKGQYTV TGPTGRDFSP PPGRYWRISE 
EKLQELNTDG RIWWGPNGSA RPSIKRYLSE VGDLVPRTLW SKEDVGSNRT SKNEMRLLFP 
GDSSFDTPKP ERLIERVLNI ATSPGDLVLD SFAGSGTTGA VAHKMGRRWI MVELGEHCHT 
HIIPRLKKVI DGEDPGGITK AVDWQGGGGF RYYRLAPSLI VEDRWGNPVI NPEYNAAQLA 
EALCKLEGFA YAPSETRWWQ QGHSSERDFL YITTKNLSAA QLQALSDEVG TEQSLLVCCS 
AFHGISAAAA AARWPNLTLK KIPKMVLARC EWGHDDYSLN VANLPLAESS PPAPAAKAAK 
SGRKSSDSRT TDMFGDGGDA