Gene Smed_3999 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_3999
Symbol
ID	5319246
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009620
Strand	+
Start bp	452531
End bp	453904
Gene Length	1374 bp
Protein Length	457 aa
Translation table	11
GC content	62%
IMG OID	640775807
Product	UbiD family decarboxylase
Protein accession	YP_001312740
Protein GI	150376144
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0043] 3-polyprenyl-4-hydroxybenzoate decarboxylase and related decarboxylases
TIGRFAM ID	[TIGR00148] UbiD family decarboxylases

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.428522
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	38
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGAGTTCG GCAGCCAGGA CGTCCGCTAC TTTCTCCGGG AATACCAGAA GGCGTACCCG 
GAAGACGTAC TCACCATCGA GGACCACATC ACCGACGACC AGGACGCGAC GGCATTCATC 
TGGAGGCTCA ACCAGCAGGG CAAGGCGCCG CTCCTGCATT TCCGGAATGT CGAGGGTATC 
GCCTGCGAAG TGATCGCCAA CACCTTCGGT TCGCGCGAGC GTATCGCCCG TATGTTCGGG 
ACCTCCCAGG ACCGGTTGCA CGAAGCTTAC CAGGCACGCT CTCGAAAGGC TCTGCCGCCG 
CGTCTGCTCG ACAGCGGACC GGTGACCGAA TGCGTCGAAG AAGGCGACAT CGACCTGAAC 
ACGCTGCCGA TGCTGAAGCA TTTCGCGACC GACAGGGCGA AATACATTAC CAGCGGCATC 
ATCATCGCTG AGCATCCGGA AACCGGGGCC GGCAATCTCA GCTATCACCG CGCCATGATC 
CATTCGAAGA ACGAGCTGGC GACGAGCCTG CATTCGCGCG GCCATCTGTG GCGTCTGCTC 
AACATGGCAA AGGACCGCGG CGAGAAACTG AGGGTCGCCA TGGTCATAGG CGCACATCCC 
CTCTTCATGA TTGCGGCATC GGCGCGCCTT GCATTCGGTG AAGACGAGCG CGACGTCGCC 
GGCGGCCTGC TCGGCGAGCC GCTGGAGGTC GTACGGACTC CCAGATATGG CATCCGGGTT 
CCAGCCTATG CCGAGATGGT CCTTGAAGGA GTGATCGAGC CCGAAGCCCA GGTTGCCGAA 
GGACCCTTCG GAGAGTTTAC CGGCTACTCT TCCGACCGGT CGACAAACAA TCTCTTCCGT 
GTCGAAACGT TCCTGCGCCG CAAGGACGCA ATCCTGGTCA GCGTCGCCGG CGGCAACTCG 
TCCGAACATC TCAATCTCGG CCGCGTTCCG CGCGAGGCGG AGATGGTCGA AAAGCTGAAG 
CAGCGTTTCC CGAGCGTAAC GGCGGTCCAC TATCCTGCAT CCGGCACGCA TTTTCATGCT 
TATATCGCCC TCAACCAGAC AAGGCCCGGC GAGGCCCGCC AGATCATGCT CGGCCTGCTC 
GGCTGGGACG CCTATCTGAA GACCGTCATT GCCGTCGACG CCGACGTCGA CATCACGCAG 
GACTCCGAAG TTCTCTGGGC CATGTCGGCT CATTTCCAGC CGCACAGGGA TGTCGTCATC 
ATCGAGGGGC TGCCCGGCAA CGCGCTCGAT CCCTCGGCAA CCGGCATCGG CACGACGTCC 
CGCATGGGTC TCGACGCGAC ACGCGGGCCT GATTTCCATG GCGTGCTCGC CAGGATCGAC 
GACGCCGCCT TCGGCCGCGT TTCTTCGATC CTGGCGAAAC TCGCTCGTCC ATAG

Protein sequence

MEFGSQDVRY FLREYQKAYP EDVLTIEDHI TDDQDATAFI WRLNQQGKAP LLHFRNVEGI 
ACEVIANTFG SRERIARMFG TSQDRLHEAY QARSRKALPP RLLDSGPVTE CVEEGDIDLN 
TLPMLKHFAT DRAKYITSGI IIAEHPETGA GNLSYHRAMI HSKNELATSL HSRGHLWRLL 
NMAKDRGEKL RVAMVIGAHP LFMIAASARL AFGEDERDVA GGLLGEPLEV VRTPRYGIRV 
PAYAEMVLEG VIEPEAQVAE GPFGEFTGYS SDRSTNNLFR VETFLRRKDA ILVSVAGGNS 
SEHLNLGRVP REAEMVEKLK QRFPSVTAVH YPASGTHFHA YIALNQTRPG EARQIMLGLL 
GWDAYLKTVI AVDADVDITQ DSEVLWAMSA HFQPHRDVVI IEGLPGNALD PSATGIGTTS 
RMGLDATRGP DFHGVLARID DAAFGRVSSI LAKLARP