Gene Avin_36050 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Avin_36050
Symbol
ID	7762499
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Azotobacter vinelandii DJ
Kingdom	Bacteria
Replicon accession	NC_012560
Strand	-
Start bp	3672551
End bp	3674056
Gene Length	1506 bp
Protein Length	501 aa
Translation table	11
GC content	53%
IMG OID	643806472
Product	C-5 cytosine-specific DNA methylase
Protein accession	YP_002800727
Protein GI	226945654
COG category	[L] Replication, recombination and repair
COG ID	[COG0270] Site-specific DNA methylase
TIGRFAM ID	[TIGR00675] DNA-methyltransferase (dcm)

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAGCATC GGAGGAGAAC AGCCATGGAA AGCAATGAGA AATTGGCGAA GTGTAAGCTC 
GAAAGGCTGG CATCCGGAGC GATTCCGAAG GTACTCGAAT TATGCTCGGG TTGCGGTGGG 
CTGTCGCTAG GTTTGAAAAC TGCAGGCTTT GAGCTTGCAG CTCATGTAGA GAGCAACGAT 
GAGGCCAATG CCACATACGC ACTGAATTTC GCTCCGGAAA ATCCTGCGCA GACGAAGCAG 
TGGGCTATCT CCCGTGACAT GGTGGCTCAA TCAATGAGTG ATCTCATCAC GGATTTCGGA 
TTGGCCGGAG GCCCGCGCGA AGCTTTCGAT GTCCTGGCTG CAGGGCTGCC ATGTCAGGCA 
TTTGCCCGTA TAGGAAGATC CAAGCTTCGA TCAGTGACGG GAGATGAGGA TGCATTCAAG 
AACGATCCAC GCGCATCCCT TTATCGCCGC TTTCTGGAAA TTGTGGACGA AACTCGTCCT 
CTGGCCATTC TCGTTGAGAA TGTTCCGGAT ATCATGAATT TTGGCGGCCA CAATGTACCT 
GAGGAAATCG CAGAAGGGCT CAGGGTTCGT GGCTATGTTA CTCGCTACAC CCTGCTTAAT 
GCAGCGTTCT ATGGTGTGCC TCAACTTAGG GAAAGACTCT TTCTTGTTGC TGTTGACGCC 
ACTCTTGATG TGATTCCGCA GTTCCCTTCG CCTACCCACT TCATGGAGTT ACCGCGTGGC 
TATGAAAGTA GCCGTGCTGT AGCTCTCAAA CACGTCAAGG ATGTGGGTTC GCACTTCTCG 
CCCATCCCTT CCCCTGCAGG CGGGCTGCCT TCTTCGATAG GTACCGAATC GGCATTGGCT 
GACCTTCCCT TCATTTCTGA CCATCTGAGG GATACGGCGA TCATCAGGAA GCGGAAGGTT 
GCAGACAAGC TGCCGTATCG TGAAGGCATT ACACCTTCCA CGTATGCTCA CCTGATGCGC 
GACTGGCCCG GATTTTCTGC TTCCGAAAAT GTGAGCGGCA ATGTCGTGCG CATTACCACG 
CGTGACTTTC CGATTTTTGG TCGCATGCCC CGTGGAGCAG ACTATCCTGT TGCACTCCGC 
ATTGCACAGC AACTCTTGGA AGAAAAACTA CAGCGGGAAA ATTTTCCGCC ACGGCCAGGA 
ACTATTCGTT ACAAGGCTCT GGAGAAGGCG ACGATTCCTC CTTACGACGC AAGCAAGTTT 
CCCAACAAGT GGTGGAAGCT TGATCCGGAC GCTCCCTCTC GAACCCTGAC GGCCCACCTT 
GGCAAGGACA CGTATTCGCA CATCCACTAT GACGGACGCC AGAAGCGCAT GATATCTGTC 
CGCGAAGCAG CACGACTTCA GTCATTTCCC GATGGATTCG AGTTTGCTGG AGCCATGAAT 
GCGTCTTTCC GTCAAATTGG CAATGCGGTT CCTCCGATGC TTGCACTCGC CGTCAGCAAG 
GCACTTATGG AGACTATTGA GCAGGCGATT GCAGGACGGG ATTCTGCCAA TCGTCGAGTA 
GCCTGA

Protein sequence

MKHRRRTAME SNEKLAKCKL ERLASGAIPK VLELCSGCGG LSLGLKTAGF ELAAHVESND 
EANATYALNF APENPAQTKQ WAISRDMVAQ SMSDLITDFG LAGGPREAFD VLAAGLPCQA 
FARIGRSKLR SVTGDEDAFK NDPRASLYRR FLEIVDETRP LAILVENVPD IMNFGGHNVP 
EEIAEGLRVR GYVTRYTLLN AAFYGVPQLR ERLFLVAVDA TLDVIPQFPS PTHFMELPRG 
YESSRAVALK HVKDVGSHFS PIPSPAGGLP SSIGTESALA DLPFISDHLR DTAIIRKRKV 
ADKLPYREGI TPSTYAHLMR DWPGFSASEN VSGNVVRITT RDFPIFGRMP RGADYPVALR 
IAQQLLEEKL QRENFPPRPG TIRYKALEKA TIPPYDASKF PNKWWKLDPD APSRTLTAHL 
GKDTYSHIHY DGRQKRMISV REAARLQSFP DGFEFAGAMN ASFRQIGNAV PPMLALAVSK 
ALMETIEQAI AGRDSANRRV A