Gene RoseRS_3562 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RoseRS_3562
Symbol
ID	5210540
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus sp. RS-1
Kingdom	Bacteria
Replicon accession	NC_009523
Strand	+
Start bp	4457051
End bp	4458418
Gene Length	1368 bp
Protein Length	455 aa
Translation table	11
GC content	65%
IMG OID	640597157
Product	adenine-specific DNA methylase
Protein accession	YP_001277869
Protein GI	148657664
COG category	[L] Replication, recombination and repair
COG ID	[COG1743] Adenine-specific DNA methylase containing a Zn-ribbon
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGATTTG CCCTACAAGC CGATGCCCAA ACCCAGACCA TCAGCGCGAA CAAACTCATC 
TCCACCGACC CGCCCTACTA CGACAACATC GGCTATGCCG ACCTGTCGGA CTTCTTCTAC 
GTCTGGCTGC GCCGCACGCT CAGACCGATC TTTCCCGACC TCTACGTCAC CCTGTCCACC 
CCCAAGGCTG AGGAGCTGGT CGCGACCCCC TACCGTCACG GCAGCAAACA GGCCGCCGAG 
CGTTTCTTCA TGGAAGGCAT GACCCGCGCG CTGCACAACC TGGCTGTACA GGCCCACCCC 
GCCTTTCCGG TCACCATCTA CTACGCCTTC AAGCAGCAAG AAGTGAGGGA AGAGAAGAGA 
GAAGAGAGAG AAGAGAAAAG AGAAGAGAGA GCGACGGGCG AACCGCGTAA TCCCGACTCT 
CACTCCTCAC TCCTCTCCAC TCACTTCTCT CACTCCTCAC TCCTCTCCAC TCACTCCTCC 
ACCGGCTGGG AAACCTTCCT GGAAGCGGTC ATCCAGGCCG GCTTCGCTAT CACCGGCACC 
TGGCCCATGC GCACGGAGTT GGGAAACCGT ATCCTTGGGC AAGGCGCCAA CGCCCTCGCC 
TCCAGCATCG TGCTGGTCTG CCGACCACGC CCGGCAGATG CCCCCATCGC CACCCGCCGC 
GAGTTTGTCG CCGCGCTCAA AGCCGAACTG CCGGCGGCGC TGGCGGCGTT GCAACGCGCT 
AACATCGCGC CGGTCGACCT GGCGCAGGCG GCGATCGGTC CGGGGATGGC GGTCTATACC 
CGCTATGCCC GCGTGGTGGA CGCGCAGGGC AATCCGGTGC GGGTGCGCGA GGCGCTGGCG 
CTGATCAATC AGGTGCTCGA CGAGGCGCTG AGTGAGCAAG AGGGTGATTT CGACGCCGAC 
ACCCGTTGGG CGCTGGCCTG GTTCGAGCAG TATGGCTTTG CCGAAGGCGA GTACGGCGTG 
GCCGAGACGC TCTCGAAAGC CAGGAATACG AGCGTCGAGG GGCTGGTCGC CGCCGGGATG 
GTCGAAGCGA AACGGGGCAA GGTGCGCCTG CTCACACCGG CGGAACTCCC GGCCGCCTGG 
GACCCGGCCG GTGATAGCCG GGTCACGCAT TGGGAAGCGG TCCATCACCT GATCCGGGTG 
CTGGAGACCG GCGGTGAAAT GCAGGCGGCG GATCTGGCGG CGAAGCTGGG CAGTCGGGCT 
GATGTGGCCC GCGAGCTGGC GTACCGGCTC TACACCATCT GCGAGCGCAA GAAGCGCCCG 
GATGAAGCCT TTGCCTACAA CGCCCTGGTG CAGAGCTGGG GGGAGATTGC GCGGCTGGCG 
TGGGAGCGGC GCAGTGATGC GCCGGTTCAG ATGAGTTTTG AAGAGTGA

Protein sequence

MGFALQADAQ TQTISANKLI STDPPYYDNI GYADLSDFFY VWLRRTLRPI FPDLYVTLST 
PKAEELVATP YRHGSKQAAE RFFMEGMTRA LHNLAVQAHP AFPVTIYYAF KQQEVREEKR 
EEREEKREER ATGEPRNPDS HSSLLSTHFS HSSLLSTHSS TGWETFLEAV IQAGFAITGT 
WPMRTELGNR ILGQGANALA SSIVLVCRPR PADAPIATRR EFVAALKAEL PAALAALQRA 
NIAPVDLAQA AIGPGMAVYT RYARVVDAQG NPVRVREALA LINQVLDEAL SEQEGDFDAD 
TRWALAWFEQ YGFAEGEYGV AETLSKARNT SVEGLVAAGM VEAKRGKVRL LTPAELPAAW 
DPAGDSRVTH WEAVHHLIRV LETGGEMQAA DLAAKLGSRA DVARELAYRL YTICERKKRP 
DEAFAYNALV QSWGEIARLA WERRSDAPVQ MSFEE