Gene Haur_0114 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Haur_0114
Symbol
ID	5732007
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Herpetosiphon aurantiacus ATCC 23779
Kingdom	Bacteria
Replicon accession	NC_009972
Strand	-
Start bp	146839
End bp	147900
Gene Length	1062 bp
Protein Length	353 aa
Translation table	11
GC content	51%
IMG OID	641277236
Product	DNA methylase N-4/N-6 domain-containing protein
Protein accession	YP_001542894
Protein GI	159896647
COG category	[L] Replication, recombination and repair
COG ID	[COG0863] DNA modification methylase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGATCGGT TGCTTTGGTT TCGCAAACCA CGTTTGCTCA ATCTTCTGGC TGGTTGGCGT 
GATCTCACAG CCCTCGTCGC ACTCCGCGCT AGTATTCTTG CTACGACCTC GCACTTAGCC 
GATTATGCCG ATGGGATCGC TGATCAGGCT GAGAGTGTCG CGTTTGATTA TGCTTTTTTG 
CTTGGTGAGT TGCAGCAAAT TAGCGAGGCC CAGACCCTCG AACGAGCGCA TTACTATATC 
GAGCGGCTGG CTCGGAGCAT TGCCACCGTG CGCACCACCG CGATCAACGA TATTAACCTC 
AATCGTTGGA AGGAATACGA CGATATTAAC ACTGATAGCC TGTGGATGAT CGATCGCCGC 
GATGGCTCGG GAGTGCATTC GGCGGGCTAT TGGGGCAATT TTGTACCGCA AATTCCCAAT 
CAGCTGATGC GGCGTTATAC CAAACAGGGC GATTGGGTAA TTGATACCTT TGCAGGCTCA 
GGCACAACGT TAATCGAAGC CCAACGCTTG GGTCGCAATG TGCTGGGCGT TGAGTTACAG 
CCGCATATGG TCGAGTATGC CAACCAAGCC GTCGAGCGCG AGCCAAATCC GCTGGCGATT 
GTGGCGCGTT CAGTCCATGG CGATTGCACT ACAATCAATT GGCAAGCACT TTTAGCAGAT 
TATGGTCAGT GCCATGTACA GTTGGCGATT ATGCACCCGC CCTATTTCGA TATTATCAAC 
TTCAGCGACG ATGAACGCGA TTTATCCAAT GCACCTTCAG TCGAGGATTT TCTGGGCCAA 
ATGGCGGCGG CGGTGGCTCA GGTTAAGCCT GTTTTGCAAC GCGGTCGGCA TCTGGCGGTA 
ATTATCGGCG ATAAATATAT GCATGGCGAG TGGGTGGCTC TTGGATTTCG CACCATGGAA 
GTTGTACAGC AGCAAGGCTT TCAACTCAAA AGCATCATCG TCAAAAATTT TGAAGATACC 
ACTGGCAAGC GCCATCAAAA AGAGCTATGG CGCTATCGCG CCTTGGTCGG CGGCTTTTAT 
ATCTTCAAGC ACGAATATAT TTTTCTATTT CGCAAGAAGT AA

Protein sequence

MDRLLWFRKP RLLNLLAGWR DLTALVALRA SILATTSHLA DYADGIADQA ESVAFDYAFL 
LGELQQISEA QTLERAHYYI ERLARSIATV RTTAINDINL NRWKEYDDIN TDSLWMIDRR 
DGSGVHSAGY WGNFVPQIPN QLMRRYTKQG DWVIDTFAGS GTTLIEAQRL GRNVLGVELQ 
PHMVEYANQA VEREPNPLAI VARSVHGDCT TINWQALLAD YGQCHVQLAI MHPPYFDIIN 
FSDDERDLSN APSVEDFLGQ MAAAVAQVKP VLQRGRHLAV IIGDKYMHGE WVALGFRTME 
VVQQQGFQLK SIIVKNFEDT TGKRHQKELW RYRALVGGFY IFKHEYIFLF RKK