Gene Ndas_3116 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_3116
Symbol
ID	9246972
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	+
Start bp	3730521
End bp	3731702
Gene Length	1182 bp
Protein Length	393 aa
Translation table	11
GC content	77%
IMG OID
Product	glycine oxidase ThiO
Protein accession	YP_003681031
Protein GI	297562057
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.248059
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGAAGCCA CAGCCGTGCG CACCTCCAAC GATCCCCACC GCGACCGCGT CGTCGTGGTC 
GGCGGCGGCC TGGTCGGCCG GGTCACCGCC TGGCGCGCCG CCCAACGCGG ACTGAGCGTC 
ACCCTGGTCG AGTCCGACCC CGCCCGCGCC GCCTCCACCG TGGCCGCGGG CATGCTGACC 
CCCGCCACCG AGGCCGCGTT CGGCGAGGAG CCCCTCATGG AGCTGGGCAT CCGCTCGGCC 
CGCATGTACG CGGACTTCGT CGCCGAACTG GAGGAGGCCA GCGGCCTGGA CGTGGGACAC 
CGCGCCACCG GCACGCTGCT GGTCGCCTTC GACCGCGACG ACCTGGCCGT CCTCACCGAA 
CTGCACGCGC TCCAGCGGAG GCTGGGCATC GCCGCCGAGC GCCTCACCGG ACGCGAGTGC 
CGCCGTCTGG AGCCCATGCT CGCCCCGTCC GTGCGCGGCG GCGTCCTGGC CCCCGACGAC 
CACTCCGTGG ATCCGCGGCG GCTGCTGCGC GCCCTGACCG CCGCGGGCGC ACGCGCGGGC 
GTCACCGAGG TCCGCGGGCG GGTCGGGGAG GTCCTCTCCC CCGGCCCCGG GGGCTCCCGG 
CTGGGCGTGC GCCTGGCCGG GGAGGCCGAG GCGGGGCGGA CCCTGCCCGC GCACCAGGTG 
GTGCTGGCCG CGGGCTGCTG GGGCAACGGC GTCGTGGTCC CCGAACCCGT CGTCCCGCCG 
CTGCGCCCGG TCAAGGGACA GCTGCTGCGC GCCCGGGTGC CCGAGGGCGA GCCGCCGCTC 
GTCAGCCGGA CCGTCCGCGG CCTGGTCCGG GGCTTCCCGA CCTACCTGGT GCCGCGCGCC 
GACGGCGAGG TCGTCATCGG CGCCACCCAG GAGGAGCTGG GCTACGACAC CTCGCTCACC 
GTCGGGGGGC TCTGGCAGGT GCTGCGGGAC GCGCTCGAAC TCGTCCCCGG GGTGAGCGAG 
CTGGAGGTCA CCGAGACCTG CGTCGGGCTG CGCCCCGGCT CGCCCGACAA CGAGCCCCTC 
CTGGGGCCCA CACGGGTCCC GGGACTGCAC CTGGCCGCCG GGCACTTCCG GCACGGGGTC 
CTGCTGACCC CGGTGACCGG GGAGGCCATG GCCCGGGCCC TGACCGACGG AGACCTGCCC 
GAGTACGCCC GCCGTTTCAC GGCACGACGC GCAAGTAGGT AG

Protein sequence

MEATAVRTSN DPHRDRVVVV GGGLVGRVTA WRAAQRGLSV TLVESDPARA ASTVAAGMLT 
PATEAAFGEE PLMELGIRSA RMYADFVAEL EEASGLDVGH RATGTLLVAF DRDDLAVLTE 
LHALQRRLGI AAERLTGREC RRLEPMLAPS VRGGVLAPDD HSVDPRRLLR ALTAAGARAG 
VTEVRGRVGE VLSPGPGGSR LGVRLAGEAE AGRTLPAHQV VLAAGCWGNG VVVPEPVVPP 
LRPVKGQLLR ARVPEGEPPL VSRTVRGLVR GFPTYLVPRA DGEVVIGATQ EELGYDTSLT 
VGGLWQVLRD ALELVPGVSE LEVTETCVGL RPGSPDNEPL LGPTRVPGLH LAAGHFRHGV 
LLTPVTGEAM ARALTDGDLP EYARRFTARR ASR