Gene Smed_4040 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_4040
Symbol
ID	5318340
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009620
Strand	-
Start bp	501806
End bp	503035
Gene Length	1230 bp
Protein Length	409 aa
Translation table	11
GC content	62%
IMG OID	640775848
Product	FAD linked oxidase domain-containing protein
Protein accession	YP_001312781
Protein GI	150376185
COG category	[C] Energy production and conversion
COG ID	[COG0277] FAD/FMN-containing dehydrogenases
TIGRFAM ID	[TIGR01679] FAD-linked oxidoreductase

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.7202
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	32
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCAAACA CACCCTGGAG TGCAACCTCA AAAAACCTGG ACCAGGATTG CCACAACTGG 
TCGGGCGGTC TGCGCTTTCG TCCAGCGCGT CTGGAGGTGC CGGAGCATGA AGAGGCCGTG 
GCAGCGCTCG TGCGCGCGGC CGGCAGGCAG GGCCGAACCA TACGGCCGGT GGGCTCGGCA 
CATTCTTCGA GCGAGATTTA CGTCACGGAC GATGTCCTGG TTTCTCTGGC CAATATCTGT 
GGTCTGCATG AGCATGACTC TCGATGTCAC CGAGCCGCGG TCGGTGCCGG CTCACAACTG 
ACGGAGCTTA GCAAGGAGCT GCAGTCGGCG GGCATGACGC TCTCAAATTT CGGCGACGTC 
GCAACCCAGA CCGTCGGGGG CGCGATCGGA ACCGGCACGC ATGGCTCCGG ACGAAACTTC 
CCCAACCTTT CGATGATGCT TGTCGGCGGC CGCCTGGTCA CCGCCCGGGG AGAGATCACC 
ACCTTCGGCG TCGAAGAGGA CCTGGATTTC GTGCGAGCCT TGCGTGTTTC CTTCGGGACG 
CTCGGCATTC TCACCTCAGC CACTCTCCAG CTCGAACCCT TGCACGATCT CCGCCGTCAG 
GAATGGTGCC TTGGCTTCGA GCCCTGCATG GAGGCACTCG ATCGGCTTTC CCGGGAAAAT 
CGGAACTTCG ACTTCTATTG GTATCCCCGC TCCGATGAGG TGAAGATCCG TTGCCTCAAC 
CCGCCGGGCG AGGAAAAGAC TTATGGCGCC TTCGCCCGGC TGGCGAAGGA CGAGACCGGG 
CCGCCGCACG AGGTCATTCC GCAGCACAGC GATCTTCCTT ATCGCTTCGA GGAAATGGAA 
TATTCCATGC CGGCCGAGGC CGGACCGGAT TGCATGAGAA AGCTGCGCAC GCGCATCAAG 
GAAAAATGGC GCCGCTCGGT CGGCTGGCGC GTGCTCTACC GTTACATCAA GCGTGACGAC 
ACCTGGCTGA GCGAAGCCTA TGGCCGGGAC TCTGTGAGCA TATCGCTCCA TCAGAACGCG 
ACGCTGCCCT ATTGGGACTT CTTTCTCGAC CTCGAACCGG TGATGCGGGA CCATGGCGGC 
CGGCCGCACT GGGCGAAAAA GCACAGTCTT CGCGCGACCG AACTCAAGGC CCTCTACCCG 
ATGTGGGATC GTTTTCTTGC CCTTCGGCAG GAGCTGGACC CGGAGGGGCG GTTTCTAACG 
CCTTATTTGC GCAGACTTCT CGGGTGCTAG

Protein sequence

MANTPWSATS KNLDQDCHNW SGGLRFRPAR LEVPEHEEAV AALVRAAGRQ GRTIRPVGSA 
HSSSEIYVTD DVLVSLANIC GLHEHDSRCH RAAVGAGSQL TELSKELQSA GMTLSNFGDV 
ATQTVGGAIG TGTHGSGRNF PNLSMMLVGG RLVTARGEIT TFGVEEDLDF VRALRVSFGT 
LGILTSATLQ LEPLHDLRRQ EWCLGFEPCM EALDRLSREN RNFDFYWYPR SDEVKIRCLN 
PPGEEKTYGA FARLAKDETG PPHEVIPQHS DLPYRFEEME YSMPAEAGPD CMRKLRTRIK 
EKWRRSVGWR VLYRYIKRDD TWLSEAYGRD SVSISLHQNA TLPYWDFFLD LEPVMRDHGG 
RPHWAKKHSL RATELKALYP MWDRFLALRQ ELDPEGRFLT PYLRRLLGC