Gene Arth_0077 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Arth_0077
Symbol
ID	4447479
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Arthrobacter sp. FB24
Kingdom	Bacteria
Replicon accession	NC_008541
Strand	+
Start bp	78923
End bp	80023
Gene Length	1101 bp
Protein Length	366 aa
Translation table	11
GC content	70%
IMG OID	639687872
Product	sarcosine oxidase
Protein accession	YP_829578
Protein GI	116668645
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0665] Glycine/D-amino acid oxidases (deaminating)
TIGRFAM ID	[TIGR01377] sarcosine oxidase, monomeric form

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGAAGTTG ACGTCGTCGT GGTCGGCGGA GGGGCGATGG GGTCCGCTGC TGCGTGGCAG 
CTTGCACGCC GCGGCAGGTC CGTTGTTCTC CTGGAGCAAT TCGAACAGGG GCATCACATC 
GGCGCCTCCC ACGGCGCGAC CCGCAATTTC AACATGGCCT ACGCCGAGGG CGATTACCTG 
GACCTGGTCA CCGAGGCCAA GGATCTCTGG GACGAGCTCG AGGGTGCAAC GGGCATGCAG 
CTCCTGGACC TCGTGGGCCT GGTGAACCAC GGCAACGTCC GGCGGCTGCG GGACGTCCGG 
TCGTCACACG CCGAGCGCGG CATTGAGAGC CACTTCCTTC CCGCAACAGA GGCCGCAGAG 
CGCTGGCGGG GGATGAACTT CAGGGGTGAC GTCCTGGTGG TGCCCGGCTC CGGACGGGTC 
CGTGCCGCTG ACGCGCTGCT GGCGCTTCGC CACGCCGCCG AGGCGCACGG CGCCCGCTTT 
GAATACTCGA CGCCGGCCCG CGACATCCGC GTTGAGGGCG ACCGCGCCGT CGTTGTCATT 
GACTCCGGCG AGATCACCGC GCGCCGTGTG GTGGTCACCG CCGGCGCATG GACCAGCAAG 
CTTCTCGGGA GCACGGTCCC GCTCCCGAGG CTCGTGGTCA CGCAGGAGCA GCCGGCGCAC 
TTCACGCCCT TGGACGACTC GCTGACCTGG CCCAGCTTCA ACCACAACCC CGATCCGGAC 
GACCCCCGCG ACGCGTACTG GTACGGCCCC GTCTATGGCA TGCTCACCCC GGGCGAGGGC 
ATCAAGGCAG GCTGGCACGG CGTGGGGCCG GTGACGGACC CGGACGGGCG CAGCTTCACG 
CCCGAACCTG TCCAGCTGGA GGCGCTGGTG CGCTACGTCC GGGAGTGGCT GCCGGGCGTG 
GATGCGGAGT CAGCGGCTCC CATGAGTTGC ACGTACACCA GCACCGCCAA CGAGGACTTC 
GTGCTGGACC GTTTCGGTCC CGTAGTGGTG GGGGCCGGCT TCTCCGGCCA CGGGTTCAAG 
TTCACCCCGG CCGTTGGCCG GGTGCTTGCA GACCTGGCCG ACGGCGGGGG CGCACCCGCC 
CGTTTCACCG CCCGGCGCTA G

Protein sequence

MEVDVVVVGG GAMGSAAAWQ LARRGRSVVL LEQFEQGHHI GASHGATRNF NMAYAEGDYL 
DLVTEAKDLW DELEGATGMQ LLDLVGLVNH GNVRRLRDVR SSHAERGIES HFLPATEAAE 
RWRGMNFRGD VLVVPGSGRV RAADALLALR HAAEAHGARF EYSTPARDIR VEGDRAVVVI 
DSGEITARRV VVTAGAWTSK LLGSTVPLPR LVVTQEQPAH FTPLDDSLTW PSFNHNPDPD 
DPRDAYWYGP VYGMLTPGEG IKAGWHGVGP VTDPDGRSFT PEPVQLEALV RYVREWLPGV 
DAESAAPMSC TYTSTANEDF VLDRFGPVVV GAGFSGHGFK FTPAVGRVLA DLADGGGAPA 
RFTARR