Gene Namu_4885 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Namu_4885
Symbol
ID	8450515
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nakamurella multipartita DSM 44233
Kingdom	Bacteria
Replicon accession	NC_013235
Strand	-
Start bp	5445678
End bp	5446832
Gene Length	1155 bp
Protein Length	384 aa
Translation table	11
GC content	76%
IMG OID	645043923
Product	glycine oxidase ThiO
Protein accession	YP_003204148
Protein GI	258654992
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0665] Glycine/D-amino acid oxidases (deaminating)
TIGRFAM ID	[TIGR02352] glycine oxidase ThiO

Plasmid Coverage information

Num covering plasmid clones	48
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCGCGG GCCGCGCGGC TGCGCCGGAC GTGCTCGTCC TCGGTGCCGG GGTGATCGGG 
CTGTCCATCG CCTGGCGGTG TCTTGGTCGC GGACGGTCGG TCGCCGTGGT CGACCCGGCG 
CCCGGCTCCG GGGCGTCGTG GACGGCGGCC GGGATGCTGG CGCCGGTCAC CGAACTGCAC 
TACGGCGAGC AGCCGTTGCT GGCCCTGAAC CTGGCCTCGG CCGCCCGCTA CCCCAGCTTC 
GCGGCCGAGC TGACCGCGGC GACCGGCCGG GACATCGGCT ACCGCCGCAC CGGCACCGTG 
GTGGCCGCCT GGGACGGCGC CGACCTGGCC GCCCTGCGGG ATCTGGCCGC CTTCGCCGCG 
ACCCTCGACC AGAGCATGCA GCCGTTGACC TCCCGCGAGC TGCGCGGGCT GCTGCCGGGC 
ATCGCGCCGG GCCTGCCCGG TGGCCTGCTG GCCGCCGACG ACCACCAGGT CGACAACCGG 
CTGCTGCACG CCGCGCTGCT GGCCGCGGTG GTCGGCGCCG GGGGTGAACT GGTCGCCGAG 
ACGGTCGCCC GGATCGAGGT CGTCGACGGT CGGGCCACCG GCATCACCAC CGCCGACGGC 
ACCGTCCGGT CGGCCGGGGT GCTGGTGCTG GCGGCGGGCG CGCACTCGGG CCGGATCGCC 
GGTCTGCCGG CCGCCGCGCG GCCCCGGGTG CACCCGGTGA AGGGCCAGAC CCTGCGCCTG 
CGGATGGACC CGGACGCGCT GCCGCCGCGG ATCCTGCGGG GCAGCGTCAA GGGGTCCCCG 
GTCTACCTGG TGCCGCGGGC CGGCGGCGAG CTGGTGATCG GCGCGTCCAC CGAAGAGGCC 
GGGTTCGACT GCACAGCCCG GGCCGGCGCG GTGTACGAGC TGCTGCGCGA CGCCCAGTCG 
TTGCTGCCGG CGGTGTCCGA GGCCGAGCTG GTCGAGGTGA GCACCGCGCT GCGGCCGGGC 
TCACCGGACA ACGCCCCGCT GCTCGGCCCG TCCTGGGTGG ACGGGCTGAT CCTGGCCACC 
GGGCACTACC GCAACGGCAT CCTGCTCACC CCGATCACCG GCGACGGCAT CGCCGACCTG 
ATCACCGACG GCCGGGTGCC GGCCGCCCTG GCTCCCTTCG CCCCGCACCG CACTGCCCCC 
CAGGAGGTTC GATGA

Protein sequence

MSAGRAAAPD VLVLGAGVIG LSIAWRCLGR GRSVAVVDPA PGSGASWTAA GMLAPVTELH 
YGEQPLLALN LASAARYPSF AAELTAATGR DIGYRRTGTV VAAWDGADLA ALRDLAAFAA 
TLDQSMQPLT SRELRGLLPG IAPGLPGGLL AADDHQVDNR LLHAALLAAV VGAGGELVAE 
TVARIEVVDG RATGITTADG TVRSAGVLVL AAGAHSGRIA GLPAAARPRV HPVKGQTLRL 
RMDPDALPPR ILRGSVKGSP VYLVPRAGGE LVIGASTEEA GFDCTARAGA VYELLRDAQS 
LLPAVSEAEL VEVSTALRPG SPDNAPLLGP SWVDGLILAT GHYRNGILLT PITGDGIADL 
ITDGRVPAAL APFAPHRTAP QEVR