Gene Smed_4453 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_4453
Symbol
ID	5318605
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009620
Strand	+
Start bp	937679
End bp	938869
Gene Length	1191 bp
Protein Length	396 aa
Translation table	11
GC content	62%
IMG OID	640776255
Product	carboxymuconolactone decarboxylase
Protein accession	YP_001313188
Protein GI	150376592
COG category	[S] Function unknown
COG ID	[COG0599] Uncharacterized homolog of gamma-carboxymuconolactone decarboxylase subunit [COG1917] Uncharacterized conserved protein, contains double-stranded beta-helix domain
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.0765828
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	31
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAGTACA TTGCCGCAAG CATTGCTATC TCGGCTCTCG CCGCCACCGC TGTGGAGGCG 
CAGGAAGAGC GGCGAAAGAT CGCTCCACCG GCCGTCTATG ACGTCGCGCC GGGTCTCGGC 
CACTTCACCG ACGATGTTCT GTTCGGCGAA GTCTGGGAAC GAACAGAGCT CCCGTCTCGC 
GACCGGAGCC TCGTAACCCT TTCGGCGATC GTCTCGACGG GCAAGACGGC GCAGATTGGC 
GCCCATGTGA GCCGGGCCCT GGACAACGGT GTGAAGCCTG GAGAGATCGG CGAACTCATC 
ACTCATCTTG CATTCTACTC CGGTTGGCCA AACGCGATCT CCGCCGTGAC GGAGACGAAG 
AAGGTTTTCG ATGAGCGCCA GATTGCACCC GTCAAGAACA GCGAGGCGGC GCGCATAGAA 
TTGGAAGCCG CAGCCGAGGC GGCTCGGAGC GAGACGGTCA GCACCACGGT TGCACCAACG 
GCGGCAGCAC TGGCCGACCT TACCAACCGC GTGCTCTTCG GCGATCTGTG GCAGCGCCCG 
GATCTGTCGG CGCGCGACCG TAGCTTGGTG ACGATCGCCG CTCTGATCGC GGTTGGTCAG 
CCGGAACAAC TGCCGTTTCA TGCCAACCGC GCGATGGACA GCGGCTTGAC GCCGTCAGAA 
GCTTCAGAAG TACTGGCGCA TGTCGCTTTC TACGCCGGTT GGCCGAGAGC CATGTCCGCC 
GTGCCCGTTC TCAAGCAGGT TCTCAATAAC AGGCAAGGAA CTCAGGTGAG CGCTTCCCAG 
GCAGATCTGA AGATTACTCC AGCCGGAATT GGTTCTGCGT CAGCTCCGGA GGAGTACTTC 
ACAGGTACCG TCCAGATCTC GGGCCGTTAT CAAGCCGACG CTCCCGCGCG CATTGGCGGG 
GCAACCGTCT CCTTCTCCGC CGGCGCTCGC ACGGCCTGGC ACACACATCC TCTCGGCCAG 
ACCTTGTTCA TCGTGAGCGG GCGCGGCCTG GTTCAGAAGG AAGGTGAGGC AGTTCAGGAA 
GTAGGTTCGG GAGACGTGGT ATGGATCCCA CCGCTGATCC GGCACTGGCA TGGCGCCTCC 
AGCACCGGGC CGATGACGCA TTTCGCAGTG GCCGAGGCGC TCGATGGAAG CTCAGTCACG 
TGGATGGAAA AGGTGTCCGA CGAGGACTAC GGCAAGGGTG TTCGAGAGTA G

Protein sequence

MKYIAASIAI SALAATAVEA QEERRKIAPP AVYDVAPGLG HFTDDVLFGE VWERTELPSR 
DRSLVTLSAI VSTGKTAQIG AHVSRALDNG VKPGEIGELI THLAFYSGWP NAISAVTETK 
KVFDERQIAP VKNSEAARIE LEAAAEAARS ETVSTTVAPT AAALADLTNR VLFGDLWQRP 
DLSARDRSLV TIAALIAVGQ PEQLPFHANR AMDSGLTPSE ASEVLAHVAF YAGWPRAMSA 
VPVLKQVLNN RQGTQVSASQ ADLKITPAGI GSASAPEEYF TGTVQISGRY QADAPARIGG 
ATVSFSAGAR TAWHTHPLGQ TLFIVSGRGL VQKEGEAVQE VGSGDVVWIP PLIRHWHGAS 
STGPMTHFAV AEALDGSSVT WMEKVSDEDY GKGVRE