Gene Smed_4037 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_4037
Symbol
ID	5318337
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009620
Strand	-
Start bp	498798
End bp	499769
Gene Length	972 bp
Protein Length	323 aa
Translation table	11
GC content	65%
IMG OID	640775845
Product	putative dehydrogenase protein
Protein accession	YP_001312778
Protein GI	150376182
COG category	[C] Energy production and conversion
COG ID	[COG2141] Coenzyme F420-dependent N5,N10-methylene tetrahydromethanopterin reductase and related flavin-dependent oxidoreductases
TIGRFAM ID	[TIGR03557] F420-dependent oxidoreductase, G6PDH family

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.122035
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	31
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCGAGGA TCGGCTATCA CGCATCGCAC GAGCAATTTA CGCCGCTCGA CCTGTTGGGC 
TGGGCGCGGG CGGCGGAAGA GGCCGGCTTC GATTGCACCA TGTCGTCCGA CCATCTCGCG 
CCCTGGAGCG AGCGGCAGGG GCAAAGCGGC TTTGCCTGGG CGTGGCTCGG CGCCGCCCTA 
CAGGCGACAG AGAAGAGCTT CGGCCTCGTC ACGGTTCCTT GCGGCTGGCG CTATCACCCC 
GCGATAACGG CGCAGGCAGC TGCAACCCTT GCGCAGATGT TCCCGCGGCG GCTTGCCTGG 
CTGGCGTTGG GCAGTGGGGA GGCGCTGAAC GAACAGGCTG TCGGTGGGGT CTGGCCCGAA 
AAGGCGGAGC GAAGGGCCAG ACTCCTCGAG GCGGTCGAGG TCATCCGCGA GCTTTGGGCC 
GGCCGGACGG TTAACCGGCA AGCACCCATT GCCGTGTCGG AGGCCCGCCT TTATACGCTC 
GCCGAGCACC CGCCGGCGCT GATCGCCGCG GCTCTAACGC CTGAAACGGC CGAAACGGCC 
GGAGAATGGG CGGACGGTCT CATCACCGTC AATCAGTCGT CGACAAAGCT TGCCGCCATT 
GCCGAGGCCT TCAGGCGCGG CGGCGGCGAC GGCAAGCCTC TCTGCCTTCA GGTCCATGTC 
TCCTATGCAC AGACGGACGA GGAGGCGCGG CAAAATGCTT TCGATCAGTG GAGGAGCAAC 
GTGCTCAGCC CCGGTCAGTC GGAGACGCTG AGGACGCCGG GTGAAATCGA GTCAGCCACG 
AAGAGCGTTC GTCCCGAGGA TCTCGACAAG CATGTCAGGA TCTCCTCGGA TCCGGGGCGG 
CACGCCGCCT GGATCGAGGA GGATATCGCC GCCGGCTTCG ACGAGATATA TCTTCACAAT 
GTCGGTCGCA ATCAGCTTGA GTTCATCGAT GTCTTTGGCA GATCGGTTCT GCCGCGTGTG 
CGCGCCTTCT GA

Protein sequence

MARIGYHASH EQFTPLDLLG WARAAEEAGF DCTMSSDHLA PWSERQGQSG FAWAWLGAAL 
QATEKSFGLV TVPCGWRYHP AITAQAAATL AQMFPRRLAW LALGSGEALN EQAVGGVWPE 
KAERRARLLE AVEVIRELWA GRTVNRQAPI AVSEARLYTL AEHPPALIAA ALTPETAETA 
GEWADGLITV NQSSTKLAAI AEAFRRGGGD GKPLCLQVHV SYAQTDEEAR QNAFDQWRSN 
VLSPGQSETL RTPGEIESAT KSVRPEDLDK HVRISSDPGR HAAWIEEDIA AGFDEIYLHN 
VGRNQLEFID VFGRSVLPRV RAF