Gene Xaut_4702 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Xaut_4702
Symbol
ID	5423721
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Xanthobacter autotrophicus Py2
Kingdom	Bacteria
Replicon accession	NC_009720
Strand	+
Start bp	5213303
End bp	5216272
Gene Length	2970 bp
Protein Length	989 aa
Translation table	11
GC content	70%
IMG OID	640883966
Product	sarcosine oxidase alpha subunit family protein
Protein accession	YP_001419578
Protein GI	154248620
COG category	[E] Amino acid transport and metabolism [O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0404] Glycine cleavage system T protein (aminomethyltransferase) [COG0492] Thioredoxin reductase
TIGRFAM ID	[TIGR01372] sarcosine oxidase, alpha subunit family, heterotetrameric form

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.272798
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	0.7148
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCCGCC TCGCCCATGA CGGCCTCATC GACCGCAGCC GCACCCTCTC TTTCGCCTTC 
GACGGCAAGA CCTTCACTGG CCATCCCGGC GATACACTGG CCTCGGCGCT GCTCGCCAAC 
GGCGTGCGGC TCGTCGGCCG CTCGTTCAAG TATCACCGCC CGCGCGGCGT GGTGACGGCG 
GGCTCCGAGG AGCCCAACGC TCTGGTGGAG CTGCGCACCG GCGCCCGGCG CGAGCCCAAC 
ACCCGCGCCA CCACGGTGGA GCTTTACGAC GGCCTCGAAG CCGCGAGCCA GAACCGCTGG 
CCCTCGCTCG ACCACGACGT GCTGAGCGTG AACCGGCTGG TGTCGCCCTT CCTCGGCGCG 
GGCTTCTACT ACAAGACCTT CATGTGGCCC GCCGCGTTCT GGGAGAAGGT CTACGAGCCG 
GTCATCCGCC GCGCCGCGGG CCTCGGCCGC GCCGCCAACG CGCCGGACCC GGACCATTAT 
GAGAAGGCCA CCGCCTTCTG CGACGTGCTC GTCATCGGCT CCGGCGCGGC CGGCCTGGCG 
GCGGCGCTGG CGGCAGCGCG TTCCGGCGCG CGGGTGATCC TCGCGGACGA AGACTTCCGC 
CTCGGTGGCC GGCTGCTCTC CGAGCGCGCG GTGATCAATG GCGGTTCCGC CCTCGATTTC 
GTGGCGAGCG CGCAAGCCGA GCTTTCGAGC CTGCGCAATG TGCGGCTCAT ACCGCGCACC 
ACCGTGTTCG GCGCCTATGA CGGCAGCGAA TATGGCGCCG TCGAGCGGGT GAGCGATCAC 
CTTCCCGCCC CCCTGCCCTT CCAGCCGCGC CAGCGCCTGT GGCGGATCGT GGCCAAGCGC 
TGCGTGCTGG CGGCGGGTGC CTTCGACCGG CCCATCGTGT TCCCCGGCAA CGACCGGCCG 
GGTGTCATGT CGGCGCTGGC ATTGGCCACC TACGCCACCC GCTACGGCGC GGGCGCGGGG 
GCAAATGCTG CCGTCTTCTC CACCAATGAC CATGCGGTGG CCGCCGCCCT CGACGCGGCG 
GACGCGGGCC TGAAGGTCGA CGCCGTCATC GACGTGCGCC CCGCTTTGCC CGAACCGCTC 
GCGGCGCGGG CCAAGGCGCT GGGCGTGCGC GTCATCACCG AAGGCGAGGT GGTGGCGACC 
TCCGGCAAGT GCCTGAAATC CGTCACCGTG CGCACCCCGC GCGGCAGCGA GACGCTGGCG 
GTGGAAGCCC TCGGCGTGTC GGGTGGCGCA ACGCCCAACC TCAACCTCAC CTGCCATCTG 
GGTGGAAAGC CCGTGTGGCG CGAGGACATC GCCGCCTTCG TCCCTGGCGC GGTGCCGCCC 
GGCATGGCAG TGGCCGGCGC GGCGGCGGGC ACCTTCGGTC TTGCCGATAT CCTCGCCGAA 
GGCACCCGCC TCGGCGCATC GGCCGCGTCC GACGCCGGCT TCGCCGCATC CCCGGCGCCG 
GCTCCGCAGG CAGAGGGCGC GCCCACCGGC TTCAAGGCGG TCTTCCATGT GAAGGGCAAG 
GGGTCAAAGG GCGGTCCAGC CTTCGTGGAC CAGCAGAACG ACGTGACCGC CAAAGACGTG 
GCCCTCGCCC ACCGCGAAGG CTTCCGCGCG GTGGAATTGC TGAAGCGCTA CACCACGCTG 
GGCATGGCCA CCGATCAGGG CAAGACCTCC AACATGGCCG GTCTCGCGGT GATGGCGGAG 
CTGACCGGAA AAGGCATTCC CGCCACCGGC ACCACCGTGT TCCGCCCGCC CTACACGCCG 
GTGGCGCTGG GCGTGCTGGC CGGCCACCAT CGCGGCATCG ACTTCAAGCC GGCCCGTCCC 
ACCCCGACCC ACGCGTGGGC GCAAGCGCAG GGCGCGGTCT TCGTGGAAAC CGGCCTGTGG 
ATGCGCGCCG CCTATTTCCC CAAGCCCGGT GAAAAGGACT GGCTGGAAAG CGTGAACCGC 
GAGGTGAAAG CCACGCGTGA AAGCGTGGGC GTCATCGACG TATCCACCTT CGGCAAGATC 
GACCTTCAGG GCCCGGACGT GGGCATGCTG CTCGATCGCG TCTACATCAA CATGTTCTCG 
ACGCTGGCCG TGGGCAAGGC GCGCTACGGC GTGATGCTGC GCGAGGACGG CCTGGTCATG 
GACGACGGCA CCACCGCACG CCTCGCCGAC GACCATTATG TGATGACCAC CACCACGGCC 
AACGCCGCCA AGGTCTACCA GCATCTGGAA TTCTGCCTGC AGGTGCTGTG GCCGGAGCTG 
GATGTGTGCC TCGCCTCGGT GTCTGAGCAA TGGGCGCAGA TCGCCGTGTC CGGGCCGCGC 
TCCCGCGAGG TGCTGGCCAA GATCGTGGAT GGGTTGGATG TGTCCAATGC CGGCCTCCCC 
TTCATGGGGG TGGCGCAGGG CACGGTGATG GGCGGCGTTC AGGCGCGCAT CTTCCGCCTC 
TCCTTCTCCG GGGAGCTGGG CTACGAGATC GCGGTGCCGG CCCGCCACGG CCCGGCGCTC 
ATGCAGGCGC TGATGGCGGC GGGCGCGCCC TTCGGCATCA CGCCCTATGG GGTGGAGGCG 
CTGGGCGTGC TGCGCATCGA GAAGGGCCAT GTCTCCGGCA GCGAGCTGAC GGGCCAGACC 
TCGGCGCGCG ATCTCGGCCT CGGCAAGATG GCGTCCACCA AGAAGGACTA TATCGGCCGG 
GTGATGGCCG GGCGGCCCGC CTTCACCGAC CCGGACCGGC CCAGCTTCGT CGGCTTCAAG 
CCGGTGGACC GCACCGCGCG GCTGCGCGCC GGCGCCCATT TCCTGAAAGC CGGCGCGGCG 
GCGTCGACCG AGAACGACGA GGGCTACATG ACCTCGACCG CCTTCTCACC CACCCTCGGC 
CACTACATCG GCCTCGGCCT TTTGAAACGC GGGCCGGAGC GCATGGGCGA GAAGGTGCGC 
GCCTATGACC CGCTGCGGGG CGGTGACATC GAGGTCGAGG TGTGCTCTCC CGCATTCATT 
GACCCGCAAG GGGAGAAGCA GCGTGTCTGA

Protein sequence

MTRLAHDGLI DRSRTLSFAF DGKTFTGHPG DTLASALLAN GVRLVGRSFK YHRPRGVVTA 
GSEEPNALVE LRTGARREPN TRATTVELYD GLEAASQNRW PSLDHDVLSV NRLVSPFLGA 
GFYYKTFMWP AAFWEKVYEP VIRRAAGLGR AANAPDPDHY EKATAFCDVL VIGSGAAGLA 
AALAAARSGA RVILADEDFR LGGRLLSERA VINGGSALDF VASAQAELSS LRNVRLIPRT 
TVFGAYDGSE YGAVERVSDH LPAPLPFQPR QRLWRIVAKR CVLAAGAFDR PIVFPGNDRP 
GVMSALALAT YATRYGAGAG ANAAVFSTND HAVAAALDAA DAGLKVDAVI DVRPALPEPL 
AARAKALGVR VITEGEVVAT SGKCLKSVTV RTPRGSETLA VEALGVSGGA TPNLNLTCHL 
GGKPVWREDI AAFVPGAVPP GMAVAGAAAG TFGLADILAE GTRLGASAAS DAGFAASPAP 
APQAEGAPTG FKAVFHVKGK GSKGGPAFVD QQNDVTAKDV ALAHREGFRA VELLKRYTTL 
GMATDQGKTS NMAGLAVMAE LTGKGIPATG TTVFRPPYTP VALGVLAGHH RGIDFKPARP 
TPTHAWAQAQ GAVFVETGLW MRAAYFPKPG EKDWLESVNR EVKATRESVG VIDVSTFGKI 
DLQGPDVGML LDRVYINMFS TLAVGKARYG VMLREDGLVM DDGTTARLAD DHYVMTTTTA 
NAAKVYQHLE FCLQVLWPEL DVCLASVSEQ WAQIAVSGPR SREVLAKIVD GLDVSNAGLP 
FMGVAQGTVM GGVQARIFRL SFSGELGYEI AVPARHGPAL MQALMAAGAP FGITPYGVEA 
LGVLRIEKGH VSGSELTGQT SARDLGLGKM ASTKKDYIGR VMAGRPAFTD PDRPSFVGFK 
PVDRTARLRA GAHFLKAGAA ASTENDEGYM TSTAFSPTLG HYIGLGLLKR GPERMGEKVR 
AYDPLRGGDI EVEVCSPAFI DPQGEKQRV