Gene Noca_1085 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Noca_1085
Symbol
ID	4599565
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardioides sp. JS614
Kingdom	Bacteria
Replicon accession	NC_008699
Strand	+
Start bp	1143851
End bp	1145473
Gene Length	1623 bp
Protein Length	540 aa
Translation table	11
GC content	64%
IMG OID	639775682
Product	DNA methylase N-4/N-6 domain-containing protein
Protein accession	YP_922289
Protein GI	119715324
COG category	[L] Replication, recombination and repair
COG ID	[COG2189] Adenine specific DNA methylase Mod
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGACTCGTC TCGAACTCGC GTGGCCCAAC AAGGACCGCT TTCTGCTCGT TCCGAAAGAC 
GACGATGGCA AACCGATCTG GGTTGAGCGG GACCATCCGG CAGCCGCCGA GGTCCGAGTT 
TCGGACTTCA GCAGTTCCAT CGGCGACGTG GACGAGTCGA ATCCCTATGC AGGCAACTTG 
CTTTTCACCG GCGACTCGCT AGATGTCCTC CGCATCTTGA CGACAGTGCC GGAGTACGCA 
CGGCACTACA AAGGCAAAGT GCGGCTTGTC TACATCGACC CGCCATTCAA CACCGGGCAG 
GCATTCGAGC ACTACGACGA CTGGCTCGAA CACGCGACGT GGCTCTCCTT CATGCGCGAT 
CGTCTTCGAC AGATCCGCGA GTTGCTCACC CCGGACGGTT CGGTGTGGGT GCACTTGGAC 
GACGCCGAGG CTCACCACAT GCGTGTGTTG CTCGATGAGG TGTTCGGCCC TGCCAACTTC 
CTAGGCAACG TCGCGTGGAA GCGCCGCAAC GACCCCCGGA ACACCGCGCA GTTCATCTCC 
GCAGACCACG ACCAGCTACT GATCTACGGA CGGGACGCCG CACGAGCGCG GTTTAACAAG 
CTGGAGCGCA CCGAGGCGAT GGACTCGGCC TACACGAATC CCGACAACGA CGAGCGCGGC 
CCGTGGAGAC GAGGAGATCT CGCCGCGCGC AACTTCTACT CACGTGGCAC TTATGCGATC 
ACTACCCCGA GCGGGCGCGT AGTCGATGGA CCCCCCAGCG GGTCGTACTG GCGCGTCTCC 
GAGGAGGAAC TGGCTCGACT CGATTCCGAT GGGCGCATCT ATTGGGGGCC GAGCGGAGAC 
TCGCGGCCGT ACCTGAAGAG GTTCCTCACC GAGGTTCAGG GAGGGCGGGT TCCGTCATCG 
GTCTGGCACC CTGAGGAAGT CGGATTCGTA CGGAACGGCA AGGAGGAAGT CCGCGCCCTC 
GTGGGCGATG TCTTCGCCAC ACCGAAGCCA GAACGGCTGC TCGAACGCGT GCTACACATC 
GGCTCGGACC CCGGCGACGT CGTGCTCGAT TGCTTCGCCG GGTCGGGCAC CACGGCGGCG 
GTGGCGCACA AGATGGGACG ACGCTGGATC ACCGCCGAAG TGCTGGGGGA GACCGTCAAG 
GAGTTCACAC GCCCGCGGCT TGAACTGGTC GTGAAGGGTG AGGATCCGGG CGGGATCACA 
GGCGCAGTTG GCTGGAAGGG TGGCGGCGGG TTTCGCTGCG TTGAAGTGGG TCCGTCGATG 
TACGTCGATA CACCGTTCGG CGTGCTGCTC TCAGACGAGG CGACGAACGG CACCTTCGCC 
AAGGCCGTCG CGGGTCAATT GGGTTACGAC TTTCAGCCCG ACGCAGCCCC ACTCTGCGGC 
GCTCAGGGAC GCATGCGTCT GGCTGTGCTC GACGGCACGG TAGGCGCCGA AGAAGTACAG 
GCCGTCGTCG CCGCTCTCGC TGACGGCGAA CAAGTTGAGA TTGTCGGCCG TTCCGTACTG 
GACGGTGCTG CGGCGACGTT GCGCACGATC GCGAAAGGCT CCAAGATCAC GAAGGCGCCC 
CGCGACCTTC TGACGGCGGC CCGCCGTATC CGTCGCCACG CCGACCGGGG GGGTGGCGAG 
TGA

Protein sequence

MTRLELAWPN KDRFLLVPKD DDGKPIWVER DHPAAAEVRV SDFSSSIGDV DESNPYAGNL 
LFTGDSLDVL RILTTVPEYA RHYKGKVRLV YIDPPFNTGQ AFEHYDDWLE HATWLSFMRD 
RLRQIRELLT PDGSVWVHLD DAEAHHMRVL LDEVFGPANF LGNVAWKRRN DPRNTAQFIS 
ADHDQLLIYG RDAARARFNK LERTEAMDSA YTNPDNDERG PWRRGDLAAR NFYSRGTYAI 
TTPSGRVVDG PPSGSYWRVS EEELARLDSD GRIYWGPSGD SRPYLKRFLT EVQGGRVPSS 
VWHPEEVGFV RNGKEEVRAL VGDVFATPKP ERLLERVLHI GSDPGDVVLD CFAGSGTTAA 
VAHKMGRRWI TAEVLGETVK EFTRPRLELV VKGEDPGGIT GAVGWKGGGG FRCVEVGPSM 
YVDTPFGVLL SDEATNGTFA KAVAGQLGYD FQPDAAPLCG AQGRMRLAVL DGTVGAEEVQ 
AVVAALADGE QVEIVGRSVL DGAAATLRTI AKGSKITKAP RDLLTAARRI RRHADRGGGE