Gene Haur_5275 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Haur_5275
Symbol
ID	5737233
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Herpetosiphon aurantiacus ATCC 23779
Kingdom	Bacteria
Replicon accession	NC_009974
Strand	-
Start bp	60738
End bp	62609
Gene Length	1872 bp
Protein Length	623 aa
Translation table	11
GC content	45%
IMG OID	641282439
Product	N-6 DNA methylase
Protein accession	YP_001548030
Protein GI	159901785
COG category	[V] Defense mechanisms
COG ID	[COG0286] Type I restriction-modification system methyltransferase subunit
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCAGATA TTGCAGCAGG GTTGAACGAG ATATGGAAGA TCTTTCGAGC AAAGGGGATC 
GTTGATGATC TCCTAATTAT CGATCATATC GCGACGTTAC TGCTTGAGCA AAACAGCCTG 
TCGCCTCCTT CAGGTTTACA AGGTGAGCCA GTTCTACTTC CTAAGGTTGA TGAAATTAAA 
ACGCGGCTGA GCGCTCTTTC AACTCTACTA GAGGGAGGAG CAGCTGAACT CTTCGACCGT 
TATATTCTCT TTCGCCTCGA CCAAACCCAT CTTGGCGGAC GTTATCCTAC TCCACGCCAT 
CTAGTAAAAT TTATGCGTAC TATTGCTCAT GTGACAGCCA ACGATAGCCT GCTTGACTTG 
GCCTGTGGTA GTGGTGGCAT GCTTGCAGGG CGTGCTCAAT CAGCAGAGCA TCCGACCCTT 
ACCAACGGAC TTGAAATCTC GCCCCAATGG GCACGATTAG CCTGGGCCAA CTGTGCACTC 
CATGGACTCA AAGATTTTAC GATTGAAATA GCTGATGCTT TAACTTATCC GCAAGCCATT 
TCCGTTAATC GAATACTTAT GAATCCTCCA TTTGGCACAC AAGTATCCAC AGAAGGTTTA 
TCCGGTCGGA GTGAAACCCG TCTGATAGAA CAGGCGATCA AATGGCTAGC TGACAATGGT 
CGGCTTTGTG TTCTGGCTCC AGCTGGAATC CTGTTTGGTG GAGGAAGGGA AAAAGAGCTA 
AGAAAGAATC TATGCACAAA TCAACAAATT AATGCGATTA TTGCCCTACC GAAAGACACC 
TTTCAACCTT TCAGTACACT CCAAACCTAT CTGCTGCTTA TTACGAAATC AGTGCCTCAA 
GCTGGAACGT GGTTTATCCG CGCCGAACGT GATGGTTATA TGCGTGGGCG TGGGCGAGAT 
CTAACTAAGC AACCGACTGA TGCGAGTGAT TTTCCATTAA TCGAAAGCAT ACTTGGGTGG 
GATAACACAT GGAATCTTAC TGACGATCAG CAATTATTAT CATATCGGCA ACTTACTATT 
GATGAAGAGC GTGTTTTAAT TATTGGTGCA CCCGCTGGGA GTATATTCAC ACAGGTAGAG 
CGTTACAGTC AAGGTTCTAA GCATATCTTT TTAATCAATG TTGGTTTAGA TGCGCAGCGT 
AAAAGTTACA TTGTAGATCT TAATGATCCT ATCCCAATTA AATTAATGAC ACAGCAACGT 
GAAGATATAA TTACAGAGAA GTTTAGCAAA TCAAAAGAGG AGAAACCAAA ATTAGTAACA 
CTTTTGAACG GAGACCATTA TAGTTCAGCC ATTGCAATCA CAACAAGTGG CCGTTTGCTA 
GGCACTCGTG TTCTTCAAGA TCAGATTATT AAGCAGGCAG ACTATACATT TAAAATCGAT 
CGTTACTTGC CAGCCGAAGA GATGGCGGTT GTCAATCGCC CACCGAGTGA ACTGCTTGTT 
GAGATTCGGG CCAATCAAGG TCGTATGGCG CAGTATATTG ATAGTCTTTT AAGAAAACTT 
GAAGCACCCC AAATTGGCGA TGGCAGGTTG ATGGCGCAGG TGTGGCAGCT AGAACCGACC 
GCGATTGATG TACTTAGTAG AGAACAGCGC CAGATTTGGG ATAGTATCAA GAGCCTAACC 
CTGACCGTAC ACTCAGAAAG TGCTAGTACT GGTTTTGAAA CCCCAAACTA CTTTGATGTG 
GCATCACTGC ATCAACAACA ACCAAATTTG CCTGAATCAG AACTGGCAAG CATGCTTGAA 
TTATTTGAGA AGCTGGGGCT GATCGTTGCC GTAACGCTGA TAGATTCGCA AGACCAGCAT 
CTATCTGCCT ATCGATTGTT GAGCGAACGA GATATTTGGC GGGAGCTTCC TAGCTCTGGG 
GTTAGCTCAT GA

Protein sequence

MADIAAGLNE IWKIFRAKGI VDDLLIIDHI ATLLLEQNSL SPPSGLQGEP VLLPKVDEIK 
TRLSALSTLL EGGAAELFDR YILFRLDQTH LGGRYPTPRH LVKFMRTIAH VTANDSLLDL 
ACGSGGMLAG RAQSAEHPTL TNGLEISPQW ARLAWANCAL HGLKDFTIEI ADALTYPQAI 
SVNRILMNPP FGTQVSTEGL SGRSETRLIE QAIKWLADNG RLCVLAPAGI LFGGGREKEL 
RKNLCTNQQI NAIIALPKDT FQPFSTLQTY LLLITKSVPQ AGTWFIRAER DGYMRGRGRD 
LTKQPTDASD FPLIESILGW DNTWNLTDDQ QLLSYRQLTI DEERVLIIGA PAGSIFTQVE 
RYSQGSKHIF LINVGLDAQR KSYIVDLNDP IPIKLMTQQR EDIITEKFSK SKEEKPKLVT 
LLNGDHYSSA IAITTSGRLL GTRVLQDQII KQADYTFKID RYLPAEEMAV VNRPPSELLV 
EIRANQGRMA QYIDSLLRKL EAPQIGDGRL MAQVWQLEPT AIDVLSREQR QIWDSIKSLT 
LTVHSESAST GFETPNYFDV ASLHQQQPNL PESELASMLE LFEKLGLIVA VTLIDSQDQH 
LSAYRLLSER DIWRELPSSG VSS