Gene Saro_0350 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Saro_0350
Symbol
ID	3918234
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Novosphingobium aromaticivorans DSM 12444
Kingdom	Bacteria
Replicon accession	NC_007794
Strand	+
Start bp	376858
End bp	378921
Gene Length	2064 bp
Protein Length	687 aa
Translation table	11
GC content	65%
IMG OID	640443079
Product	McrBC 5-methylcytosine restriction system component-like
Protein accession	YP_495632
Protein GI	87198375
COG category	[V] Defense mechanisms
COG ID	[COG4268] McrBC 5-methylcytosine restriction system component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	30
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCTTGCCG AGATGGCCTA TTCGCGGGCC GACGAAGCAG CGGGTGCGTC TAACCCGAGT 
GCAATTGATC TCAGCGGATC GTTCTACGCC AATCTTTCCG CATGCCGTGC AGCTGCCCGG 
GCCTATTTCC GCTTCTGCAA TTCTGAGGCT CGTCCACAGG GCAGGTTTGG CGAGCTCGAC 
CGGGAGGCAG TTCTCGAGGC GGTGGCCGCA TGTGACGCCG TTGGCGACGT CGCCCAGTAT 
GTCGCTGATC TCGATCTCGG GCAGCCGACC AGATACTGGC TCGTTCTGGA CGGCAAGCGC 
TACCCCAGCA AAGCCGTCGT ACGCGATGCT TTGGCGAGAC GCGGCAGTGA CTGGCTGCCT 
GGCGGCGGTG AATGCAAGAC CGCGCTCGAG CGCCTCGGCT TTGTCGTCAT CGACTGGCCC 
GAACTCAACC GCGCTCGCGA TGCATTCCTG CGCCAGATGC CGGATTTCAG CGATTTCCGT 
GCCGCTGCCG GCGCCTACTG GGATGTGGAA CGCGCCTACA AGAACGGACT GATCGAGCAG 
GCCAAGGCAA TCATTGCACG GCAGGATGAC GACCGCGCGG TTGGCGAAAG CCTCTACCGG 
CTGCTTTCGG TGGGCGGTTC GGGCCTGCCG CTGAGCTGGC GGACACTGTC CGAAGTCCAG 
AACGCCGATC CCGAGCTGCG CGACCGTTTC TACACCTCGC TGGGGGTGCT TGCTCGCAGC 
GATGGCCCGC TCGAAGAAGC TGTCCCGGCC GCGGCGCGCG AGCTCGAAGC CCTGCGTGAA 
GCGGGCATTG CAGGGCTGCG CCGGGGCGAG GTGCTCTCCA TTCCGATTAC CGTCTGGGCC 
ACTTTGCACC CCGACCAGGC GAGTTGGTTC AAGATCGCCA AGATCGACGA GATGGGGCGG 
CGGTTGTTCG GTCGCAGGCT GTTCCCGCAA ACCGAGTTCC GCGACGCTGA TCTTGCCGAA 
TGGCTGCAGT TGATGCGGGC GCTGCTCGGG TTGCTCGATA AGGAATTCGG GTGGCACCCG 
CATGACCTGT TCGATGTGCA GGGGTTCATC TGGGTGGTCG GCAATCCGGA TTCCCCCCGC 
GAACTCGATC CGGTGCCCGT CTGGATGGTG ACCTCGCTGT GGGGGCAAGA GGACGGCTTG 
CCGCGCTTCG TCGAGCGGGC AGAGTGGAGT TTGCTCACTG ACACCGGCAG CGCGAACAAC 
CGCCGCGTCC GCGAGATGCA GGTCGGTGAC CGGATCTTCC TCAAGGATTT CGTGCCGCGC 
GCCCGCGATC TGCCCTTCGA TGCCGGAACG GGGATCATGG CGGCGGCGAC CGTGTTCCTG 
GCCCGTCACA CCCGCTCGCT CGCCACCCGG CGCACGCTTG ACGAGTTGAG ACATGCTCTG 
GCCGATATCC CGCTGATGCC AATCACGCGG CTGCCGTGGC AAGCGGTGCG GATTGATCGC 
ACCAACCGGC GCTGGGAGGC GCTGTTCCGG CTCGCCCGCC TGCTGCTTCA GCGCGACTGG 
CAGGCTACTC ACCATCACGC CAAGGCCCCT GATGGTCTGA CCCTGCTTTT TCCAATGAAC 
GACCTGTTCG AGAAATACAT CGCTGTGCTG CTTCGCCGGG CGCTGGCGGG GAGCGGGATC 
GAGGTGATCG ACCAGGGCGG CCACCGCGCC TGCCTTGGCT CCTTTACTGG CGGGCATCTC 
GAGACCGGCG AGGTGTTCCG CACCAAACCT GACATCATGT TGCGCCGTGG TCGCGAAATT 
GTGGCCATCA TCGATACCAA GTGGAAGAAG CTCAGCCTCG ACCCGCTCGA CCGCAAGCAC 
GGGGTTAGCC AGGCTGATGT CTATCAGCTC ATGGCCTATG CGCGGCTCTA CCAGACGGCC 
GAGCTGATGC TACTTTACCC GGCGCGACCG GGGCAGGTGT GCGCAGAGCG CGCACAGTTC 
GGCATGGCGG GCGGGAGCGA GCGCCTCAGA ATCGCGATGG CTGACGTCTC GCTGGACGAG 
AAGGCTCTGG CAGAGGCTCT CGGAGTGCTG GTGATGGCGC CCGCCGTCAC CAAGGCTTCG 
CCATTGCCGC AGGCGGTGGG GTAG

Protein sequence

MLAEMAYSRA DEAAGASNPS AIDLSGSFYA NLSACRAAAR AYFRFCNSEA RPQGRFGELD 
REAVLEAVAA CDAVGDVAQY VADLDLGQPT RYWLVLDGKR YPSKAVVRDA LARRGSDWLP 
GGGECKTALE RLGFVVIDWP ELNRARDAFL RQMPDFSDFR AAAGAYWDVE RAYKNGLIEQ 
AKAIIARQDD DRAVGESLYR LLSVGGSGLP LSWRTLSEVQ NADPELRDRF YTSLGVLARS 
DGPLEEAVPA AARELEALRE AGIAGLRRGE VLSIPITVWA TLHPDQASWF KIAKIDEMGR 
RLFGRRLFPQ TEFRDADLAE WLQLMRALLG LLDKEFGWHP HDLFDVQGFI WVVGNPDSPR 
ELDPVPVWMV TSLWGQEDGL PRFVERAEWS LLTDTGSANN RRVREMQVGD RIFLKDFVPR 
ARDLPFDAGT GIMAAATVFL ARHTRSLATR RTLDELRHAL ADIPLMPITR LPWQAVRIDR 
TNRRWEALFR LARLLLQRDW QATHHHAKAP DGLTLLFPMN DLFEKYIAVL LRRALAGSGI 
EVIDQGGHRA CLGSFTGGHL ETGEVFRTKP DIMLRRGREI VAIIDTKWKK LSLDPLDRKH 
GVSQADVYQL MAYARLYQTA ELMLLYPARP GQVCAERAQF GMAGGSERLR IAMADVSLDE 
KALAEALGVL VMAPAVTKAS PLPQAVG