Gene Smed_5538 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_5538
Symbol
ID	5319840
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009621
Strand	+
Start bp	502456
End bp	503550
Gene Length	1095 bp
Protein Length	364 aa
Translation table	11
GC content	62%
IMG OID	640777289
Product	2-nitropropane dioxygenase NPD
Protein accession	YP_001314221
Protein GI	150377626
COG category	[R] General function prediction only
COG ID	[COG2070] Dioxygenases related to 2-nitropropane dioxygenase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.485511
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	0.0535988
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGAACGT GGCATGACCG CCGAATCCTC GACCTTCTGG GAGTGGAGAT TCCCGTCATT 
CAGGCGCCGA TGGCCGGAGC GACGACGGCA GAAATGGTGA TTGCCGCTTC TGAAGCTGGC 
GGCTTGGGTT CGTTGCCGAG CGCGCAATAT TCGGTCCACC AATTGCACGA GGCGCTCTCG 
CAGATTACTG CGAGAACAAC CAGGTCAATC AATGTAAATT TCTTCAGCCA CGTGAAACCT 
GATGCTGATC CTGCTGGTCA GATGAGGTGG CGGGCACTCT TGGCGCCGTA TTTCGTCGAA 
CTTGGCCTTG ACCCCGCTGC CCCGATCAGC GGCCCCGGAC GTGCGCCCTT CGACAACGAG 
TTCTGCGAGG TCGTCGAAGA GTTCCGCCCC AAGGTGGTGA GCTTCCATTT CGGTCTTCCC 
GATCGAAGAC TCGTTGATAG GGTAAAGGCC GCGGGGGCCA AAGTGCTGTC GTCCGCGACG 
ACCGTCGCCG AGGCCGTCTG GCTCGAGGCA CATGGTGTTG ATGCCGTGAT CGCAATGGGT 
TTCGAGGCTG GCGGGCATCG CGGAAACTTT CTTACGCAGG ACATGACAAC CCAAGTGGGA 
ACGATGGCGC TCATTCCGCA GGTCGTGGAC GCGGTTAAGG TTCCGGTCAT TGCTGTCGGG 
GGTATCGCAG ATGGCCGCGG AGTTGCGGCG GCGTTGATGC TTGGAGCGTC AGCGGTGCAG 
ATCGGTTCTG CTTACCTTCT AACTCCAGAG GCCAAAATTC CGGATCTGCA CGCCGATGCT 
CTGGGTCGTG CCGGCGACGC CAGTACCGCC ATCACCAATG TCTTTACAGG AAGGCCCGCG 
AGAGGCGTCG TAAACCGACT GATGCGAGAA CTAGGTCCGC TTTCGGACGT GGCGCCCGCC 
TTTCCGACCG CCGGAGTGGC GCTCGCCGCG ATCCGCGCGA GGGCGGAGGA GGAGGGACGC 
GATGACTTCA CCAACCTCTG GGCGGGGCAG GCCCTTGGTT TGGCGAGGCG GCTTCCCTCA 
GCGGAACTCA CCGTGAAGTT GTTCGAGGAC GCGATGGCAG CCCTGGGGGC GGGTTCGGCG 
ATCAGGCGAC TGTAG

Protein sequence

MRTWHDRRIL DLLGVEIPVI QAPMAGATTA EMVIAASEAG GLGSLPSAQY SVHQLHEALS 
QITARTTRSI NVNFFSHVKP DADPAGQMRW RALLAPYFVE LGLDPAAPIS GPGRAPFDNE 
FCEVVEEFRP KVVSFHFGLP DRRLVDRVKA AGAKVLSSAT TVAEAVWLEA HGVDAVIAMG 
FEAGGHRGNF LTQDMTTQVG TMALIPQVVD AVKVPVIAVG GIADGRGVAA ALMLGASAVQ 
IGSAYLLTPE AKIPDLHADA LGRAGDASTA ITNVFTGRPA RGVVNRLMRE LGPLSDVAPA 
FPTAGVALAA IRARAEEEGR DDFTNLWAGQ ALGLARRLPS AELTVKLFED AMAALGAGSA 
IRRL