Gene Rcas_3393 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rcas_3393
Symbol	solA
ID	5540892
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus castenholzii DSM 13941
Kingdom	Bacteria
Replicon accession	NC_009767
Strand	+
Start bp	4423906
End bp	4425051
Gene Length	1146 bp
Protein Length	381 aa
Translation table	11
GC content	64%
IMG OID	640895511
Product	N-methyltryptophan oxidase
Protein accession	YP_001433461
Protein GI	156743332
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0665] Glycine/D-amino acid oxidases (deaminating)
TIGRFAM ID	[TIGR01377] sarcosine oxidase, monomeric form

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	29
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGTGATG TCATTGTCAT CGGATTAGGC GGGATGGGCA GCGCCGCAGC ATATCATCTG 
GCGCGGCGTG GCTGGCAGGT GATCGGGCTG GAACGTTTCA CACCCGCGCA TAACCGTGGA 
TCGAGCCATG GCAGATCGCG GATCATTCGC CAGGCGTATT TCGAGGACCC TGCGTATGTG 
CCTTTACTGC TCCGCGCGTA TGAATTGTGG GAAGACCTTC AGCGCACAAG CAGCGAACCG 
CTGTTGACGA TCACCGGCGG TCTAATGATT GGTCGAGCGG AGAGCAGCGT CGTGCGCGGC 
GCACTGCACA GCGCCCAAAT GCACCACCTG CCTCACGAAC TACTCGATGC CGCCGACATT 
CGTCGCCGTT TCCCGCCGTT CAATGTTGGC GACGATGAGG TCGCGCTGTA CGAAGCGCGC 
GCCGGTTTTC TCGATCCCGA AGCGACTGTT CGGGCGCACC TCGACCAGGC GGCGCGCCAT 
GGCGCCGATC TGCACTTCGA TGAGCCGGTC ACTGCGTGGG AGTCGACCCC TGGCGGCGGC 
GTGCGTGTCA CCACGCCGGC GGGAGTCTAC GAAGCCGAAC GCGCCGTGAT TGCGCCGGGC 
GCATGGGCGC CGCGCCTGCT CGCCGATCTG TCGCTGCCGC TGACCGTCGA GCGTCAGGTC 
CTCTACTGGT TCGAGCCGGT TGGAGGGCGT GAGCCATTCA GCATCGGGCG ATTCCCCATT 
TATATCTGGG AAGACGCGCG TGGTGACGCA CTCTACGGCT TTCCGGCACA GGGCGGACCG 
CCGGGCGGCG TCAAGGTCGC CTTCTTCTAC CGCGGGCATC CGACCGACCC GGATCGGGTG 
GATCGCTCAG TGCACCCCGA GGAGATCGCC GAAATGCGCA CCGCTCTGGC GCAGCGCATT 
CCTGCTCTGA ACGGTCCGCT CGTGGCAACG GCCACCTGTC TCTACACCCT TACGCCTGAT 
CACCACTTCA TCATTGCGCC ACACCCGCGT GCGCCGCAGG TCATCATCGC ATCGCCCTGT 
TCGGGTCATG GGTACAAATT CGCCAGTGTG ATCGGCGAAA TCCTGGCAGA CCTTGCAATT 
GACGGCAGCA CCCGCCACTC GATTGCGCTC TTCGATCCGG CGCGGTTCAG AGCAACGGAC 
GCATAG

Protein sequence

MGDVIVIGLG GMGSAAAYHL ARRGWQVIGL ERFTPAHNRG SSHGRSRIIR QAYFEDPAYV 
PLLLRAYELW EDLQRTSSEP LLTITGGLMI GRAESSVVRG ALHSAQMHHL PHELLDAADI 
RRRFPPFNVG DDEVALYEAR AGFLDPEATV RAHLDQAARH GADLHFDEPV TAWESTPGGG 
VRVTTPAGVY EAERAVIAPG AWAPRLLADL SLPLTVERQV LYWFEPVGGR EPFSIGRFPI 
YIWEDARGDA LYGFPAQGGP PGGVKVAFFY RGHPTDPDRV DRSVHPEEIA EMRTALAQRI 
PALNGPLVAT ATCLYTLTPD HHFIIAPHPR APQVIIASPC SGHGYKFASV IGEILADLAI 
DGSTRHSIAL FDPARFRATD A