Gene Ndas_3520 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_3520
Symbol
ID	9247389
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	+
Start bp	4228777
End bp	4229949
Gene Length	1173 bp
Protein Length	390 aa
Translation table	11
GC content	76%
IMG OID
Product	Sarcosine oxidase
Protein accession	YP_003681427
Protein GI	297562453
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGACGGCAC CGTTGGAGAC CGACACCGTC GTGGTCGGAC TGGGAGCCAT GGGGGCGCAG 
GCCCTGTGGC GCCTGGCCCG GCGCGGTGTG GACGTGATCG GGGTCGAGCA GTTCACGCCC 
GGGCACGACC GGGGCTCCAG CCACGGCGAG TCCCGCATCA TCCGCACCGC CTACATGGAG 
GGCGCCGCCT ACGTGCCGTT CGTGCGGTCG GCCTGGCGCG CCTGGTCGGA GCTGGAGGAG 
GCCTCCGGAA CCCGGCTCGT GGTGCGCACC GGCGCCCTGA TGCTCGGCGC GCCGGACAGC 
CCCGCCGTCA CCGGGTCGGT CGCCGCCGCC GAACACCACG GTCTCCCCCA CCAGGTGCTC 
TCCCGCGACC AGGTCGCCGA GCGCTTCCCC CAGCACGTGC TGCGCCCGGG TGAGGTGGGC 
GTCTTCGAGG AGGACGCCGG TGTGGTCCTG CCCGAGGCCG CGATCACGGC GGCCGTGCGG 
CTCGCGCGGG AGGCGGGCGC GCGGGTGCTC ACCGGCGCCC GGGCGTCCCG TGTCGTCCCC 
GACCCGGACC GCCCCCGTGT GGTGGTCGGG GACACCGTGA TCCGGGCCCG CCGGGTGGTC 
GTGACCGCCG GGTCCTGGCT GCCGCGGCTG GTGCCCGAGG TGGCGGAGCT GGGCGGCGGC 
CTGCGGGTGG AGCGGCGGGT GCTGGGCTGG TTCCGCACCA CGCGGGACCC GTCCCCGCAC 
GCGCACGGAC CGGTGTTCGC CCGGGACGAG GACGACTGCA CGTGGTACGG GTTCCCCAGC 
ATGGACGGCG GCCTGACCGT CAAGATCGGT GTGCACGCCG AGGCTCCGGG GAACAGGGGC 
GAGGGCGCCC AGTGGGGCGA ACCGGTCGAC CCCGACGCGG GGCCGCGGGA GCCCGACGCC 
GCCGACGCGC GGCGGCTGGG ACGGCTGGCC GCCGGACTGA ACGGTGTGGC CCCGCTGCCC 
GAGCGGATGG CGTCGTGCAT GTACACGATG ACGCGGGACG AGCACTTCGT CATCGGGCAG 
CGCCGCGAAC TGCCCGGACT GGTGCTGGCG GGGGGCTTCT CGGGGCACGG CTACAAGTTC 
GCCTCCGCGG TCGGGGAGGC GCTGGCCGAC CTGGCCCGGC ACGGGCGCAC GGACCTGGCC 
GTGGACCTGT TCGACCCGCA CCGCTGGGAC TGA

Protein sequence

MTAPLETDTV VVGLGAMGAQ ALWRLARRGV DVIGVEQFTP GHDRGSSHGE SRIIRTAYME 
GAAYVPFVRS AWRAWSELEE ASGTRLVVRT GALMLGAPDS PAVTGSVAAA EHHGLPHQVL 
SRDQVAERFP QHVLRPGEVG VFEEDAGVVL PEAAITAAVR LAREAGARVL TGARASRVVP 
DPDRPRVVVG DTVIRARRVV VTAGSWLPRL VPEVAELGGG LRVERRVLGW FRTTRDPSPH 
AHGPVFARDE DDCTWYGFPS MDGGLTVKIG VHAEAPGNRG EGAQWGEPVD PDAGPREPDA 
ADARRLGRLA AGLNGVAPLP ERMASCMYTM TRDEHFVIGQ RRELPGLVLA GGFSGHGYKF 
ASAVGEALAD LARHGRTDLA VDLFDPHRWD