Gene Smed_4213 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_4213
Symbol
ID	5319223
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009620
Strand	+
Start bp	695936
End bp	697285
Gene Length	1350 bp
Protein Length	449 aa
Translation table	11
GC content	64%
IMG OID	640776018
Product	putative nitrilotriacetate monooxygenase component A protein
Protein accession	YP_001312951
Protein GI	150376355
COG category	[C] Energy production and conversion
COG ID	[COG2141] Coenzyme F420-dependent N5,N10-methylene tetrahydromethanopterin reductase and related flavin-dependent oxidoreductases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	33
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCAGAC AGATAAAGCT CGGAGCCTTT CTCCCCGGCG GCGGCCAGCA TATTGCCGCC 
TGGCGGCATC CCGACGCTCC CGCAGACGGT GCCACGAATT TCCAATTCCA CAGAAGGCTT 
GCCGAGACTG CGGAGCGCGG CCTGTTCGAC GCCTATTTTC TTGCCGACAA CCTCTCCGTC 
GGACTTGGCG GCCGCGAAGG CGGCAATGCG AAAATCGCCG GTTTCGAGCC CGTCACCCTC 
TTTGCAGCAC TCGCGCCGCT GACGACCCAT CTCGGCTTCA TAGCCACGGC ATCGACGACC 
TACGAAGAGC CATACACGCT CGCCCGCAAG TTCGCCTCGC TCGACCTTCT TTCCGACGGG 
CGGGCAGGCT GGAACGTGGT CACATCCGCC GGCGACGAGA CGGCGCGCAA CTTCAACAGG 
GAATCGCAGC CGAGCCACGC CGAACGGTAC CAGCGCGCAC ACGAGCATGT CGAGACCGTC 
AAGGCTCTAT GGGACAGCTG GGAAGACGAC GCTTTCATCA GGGACAAGAC GACTGGCCGC 
TTCTTCGATG CCGGGCGTGT TCACGACATC GATCACAGGG GCAAGCATTT CAGCGTCAAA 
GGACCGCTGA ACGCGCCACG TCCGGTTCAG GGACACCCGG TCGTGGTGCA GGCGGGTCAA 
TCCGAAGACG GGCGCAAGCT TGCGGCGGCA AGCGCCGAGG TGATCTTCAC CGCCCATCAG 
AGCCTCGCTT CGGCCCAGGA ATTCTACCGC GACATCAAGG CGCGTGTGAA GCGCGCCGGG 
CGGAACCCAG AACATGTGCT GATCATGCCG GGGGTGGCTC CTTTTGTCGG CCGGACTGAG 
GAAGAGGCCC GCTCCAAATA TGAAGAACTG AATGCGCTGA TCGTGCCGGA GGACGGCGTG 
GCGCTGCTGA ACGGCCTGAC CGGCGGCACG CTCGACCTGA CGGGATATCC GCTGGACGAG 
CCCTTGCCCG TCAGCGATGA GACGGAGGGG ATGAAAAGCC GGCAGGCGCT GATCCGGAAG 
ATCGCGGACG AGCATGGCTT CACCATACGC CAGCTCTATC AGTGGATCGC GACCGCACGG 
GGTCACTACA CCGTCGTCGG CAGCGCCGAG CAGGTCGCCG ATCAGCTCGA GGAGTGGTTC 
CTCAGCGACG CCGCCGACGG GTTCAACATC CTGCCGCCAT GGCTTCCGGG TGCGCTCGAC 
GATTTCGTCG ATCTGGTCAT CCCGATACTG CAGAAGCGCG GTCTGTTTCG GACCGCTTAC 
GAGGGCCGGA CCCTGCGGGA AAATCTCGGT CTTCCCCGTC CGGCGAACCC ATGGACTTTG 
GGACGCGCGA CCGTTCAGGC GGCCGAGTGA

Protein sequence

MTRQIKLGAF LPGGGQHIAA WRHPDAPADG ATNFQFHRRL AETAERGLFD AYFLADNLSV 
GLGGREGGNA KIAGFEPVTL FAALAPLTTH LGFIATASTT YEEPYTLARK FASLDLLSDG 
RAGWNVVTSA GDETARNFNR ESQPSHAERY QRAHEHVETV KALWDSWEDD AFIRDKTTGR 
FFDAGRVHDI DHRGKHFSVK GPLNAPRPVQ GHPVVVQAGQ SEDGRKLAAA SAEVIFTAHQ 
SLASAQEFYR DIKARVKRAG RNPEHVLIMP GVAPFVGRTE EEARSKYEEL NALIVPEDGV 
ALLNGLTGGT LDLTGYPLDE PLPVSDETEG MKSRQALIRK IADEHGFTIR QLYQWIATAR 
GHYTVVGSAE QVADQLEEWF LSDAADGFNI LPPWLPGALD DFVDLVIPIL QKRGLFRTAY 
EGRTLRENLG LPRPANPWTL GRATVQAAE