Gene Smed_4151 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_4151
Symbol
ID	5319200
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009620
Strand	+
Start bp	622883
End bp	623959
Gene Length	1077 bp
Protein Length	358 aa
Translation table	11
GC content	62%
IMG OID	640775956
Product	phenylacetate-CoA oxygenase/reductase, PaaK subunit
Protein accession	YP_001312889
Protein GI	150376293
COG category	[C] Energy production and conversion
COG ID	[COG0633] Ferredoxin [COG1018] Flavodoxin reductases (ferredoxin-NADPH reductases) family 1
TIGRFAM ID	[TIGR02160] phenylacetate-CoA oxygenase/reductase, PaaK subunit

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.522682
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	0.83112
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCACGTT TTCACCCCCT ACAAGTCACC GAAGTCCGGC GCGAGACGCG CGATGCGGTC 
GTCGTCACGC TCGAGCCGCG CGATGAGGAC CGCGCCGCTT TCGATTTCAC GCAGGGGCAA 
TACCTGACCT TCCGCCGCAT ATTCGACGGC GAGGAACTGC GCCGTTCCTA TTCGATCTGC 
TCCGGCCTCG GCGAGGGCGC CTTGAGGGTA GGCATCAAAC GCGTCGACGG AGGTTGCTTT 
TCCAACTGGG CGAATGAGGT GCTCAAGCCC GGCGACACGC TTGAAGCGAT GCCGCCGATG 
GGGACTTTCT TCGTGCCTGT CGAACCGGAG GTGTCCAGAC ACTATCTCGG TTTCGCCGGC 
GGCAGCGGCA TCACGCCGGT GCTTTCGCTC GTCAAAACGG TGCTCGCGCG CGAACCGCGG 
TCCGCATTCA CGCTGGTCTA TGCCAATCGC CACTTCAGCT CGATCATGTT TCGCGAGGAA 
CTGGACGACC TCAAGAACCT CTATCTCGGC CGCCTCTCGG TGCTGCATAT TCTCGAGAGC 
GAAGCCCAGG ACATCGATCT TTTCAGCGGG CGGCTCGATT TGGAAAAATG CACTGCCCTG 
TTCCGGCACT GGATCGACGT GAAGTCAGCC GATATCGCCT TCATCTGCGG CCCCGAACCG 
ATGATGCAGG CGGTCGCCGC AACCCTTCGC GCGCACGGTG TGAGCGACAG CCGGATCAGG 
TTCGAACTGT TCGGTTCGTC CCAGCCTGGC CGCGCCCGCC GAAGGACGGC AAGCCCCGCC 
GGCACCGATG GAGGGTCGCG CTGCGAAGCG ACCGTGACTC TCGACGGAGC CACGCGCAGC 
TTCACCCTTC CGAAACGGGG GCAGAGCCTC CTCGAAGCGG CGCTCGAAAA CAGGATGGAT 
GCACCTTATG CCTGCAAGGC TGGGGTCTGC TCGTCATGCC GCGCAAAGGT GCTCGAAGGC 
GAGGTGGAAA TGGAGAGCAA CAACGCGCTC GAGGATTACG AGGTAGAGCA GGGCTATGTG 
CTGATGTGCC AGTCCTATCC GCTGAGCGAT CGCGTCGTCG TCAGCTACGA CGAGTGA

Protein sequence

MARFHPLQVT EVRRETRDAV VVTLEPRDED RAAFDFTQGQ YLTFRRIFDG EELRRSYSIC 
SGLGEGALRV GIKRVDGGCF SNWANEVLKP GDTLEAMPPM GTFFVPVEPE VSRHYLGFAG 
GSGITPVLSL VKTVLAREPR SAFTLVYANR HFSSIMFREE LDDLKNLYLG RLSVLHILES 
EAQDIDLFSG RLDLEKCTAL FRHWIDVKSA DIAFICGPEP MMQAVAATLR AHGVSDSRIR 
FELFGSSQPG RARRRTASPA GTDGGSRCEA TVTLDGATRS FTLPKRGQSL LEAALENRMD 
APYACKAGVC SSCRAKVLEG EVEMESNNAL EDYEVEQGYV LMCQSYPLSD RVVVSYDE