Gene Smed_3724 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_3724
Symbol
ID	5318590
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009620
Strand	-
Start bp	165777
End bp	167033
Gene Length	1257 bp
Protein Length	418 aa
Translation table	11
GC content	63%
IMG OID	640775537
Product	ribulose-bisphosphate carboxylase
Protein accession	YP_001312470
Protein GI	150375874
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1850] Ribulose 1,5-bisphosphate carboxylase, large subunit
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.630821
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	25
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGATCCACA TAACCTACCG GATAGAGACA CCAGGAGACG TCGAGGCGCT GGCGAGAAAA 
ATCGCAAGCG ACCAATCAAC GGGGACGTTC GTTGCTGTGC CGGGGGAAAC GGAGGAGCTG 
AAGCGGCGGG CAGCTGCACG CGTCGTGGCC ATTCGCCACC TCCCACCGGC CGACCGGGCG 
TCGTTGCCGG ACGAGGCTGG AGACGCAACG CGTTTCAACC GGGCCGATGC GGAGATCGCA 
TATCCTCTTG AAGCGGTGGG AACGGACCTG TCCGCCCTGA TGACCATTGC AATCGGCGGC 
GTCTATGCCA TCAAAGGCAT GACCGGAATC CGTGTTGTCG ACATGAAACT CCCGCCGGAG 
TTCGCGGCGG CGCATCCGGG TCCGCAATTC GGGGTCGCCG GCAGTCGCCG CCTGACCGGT 
GTCGAAGGCC GCCCCATTAT CGGCACGATC GTCAAGCCGG CGCTCGGCCT GCTGCCGGAC 
GAAACGGCAG CGCTCGTAGG CGACCTGCTT TCTTCCGGCG TCGACTTCAT CAAGGACGAC 
GAGAAGCTGA TGAGCCCGGC CTATTCGCCG CTGAGTGCGC GCATCGCCGC CATCATGCCG 
AAGATACGCG ACCATGAGCA GAAGACCGGC AAGAAAGTCA TGTATGCCTT CGGCATATCC 
CATACCGATC CCGATGAGAT GATGCGGAAC CACGATCTCG TGGTCGCCGC TGGTGGCAAT 
GCGGCGGTCG TCAATATCAA TTCGATCGGC ATGGGCGGTG TCGCCTTCCT GCGCAAGCGC 
TCGAACCTCG TGCTCCACGC CCACCGTAAC GGCTGGGACA TTCTCACGCG CCATGGCGGC 
CTGGGGATGG AGTTTTCGGT GTGGCAGCAG TTCTGGCGCC TCCTCGGAGT GGATCAGTTC 
CAGATCAACG GCATCCGCGT CAAATACTGG GAGCCGGACG ACAGTTTCGT GAAGTCCTTC 
AAGGCGGTAA GCACGCCGCT GTTTTCCAGG GAGGATTGCC CGCTGCCGGT CGTGTGCTCC 
GGCCAATGGG GAGGACAGGC GCCCGAGACC TTTGTACGCA CCGGACGTAC GACCGATCTG 
CTCTATCTCT GCGGTGGCGG AGTCGTAAGC CACCCGGGCG GAGCCGGTGC CGGCGTGCGA 
GCCGTGCGTC AGGCATGGGA GGCGGCAGTC GCCGGGATAC CGCTCTCGGA TTATGCTAAG 
GAGCACCCCG AACTGGCGCA ATCGATCGAG AAATTCGCCG ACGGAAAGGG CGCTTGA

Protein sequence

MIHITYRIET PGDVEALARK IASDQSTGTF VAVPGETEEL KRRAAARVVA IRHLPPADRA 
SLPDEAGDAT RFNRADAEIA YPLEAVGTDL SALMTIAIGG VYAIKGMTGI RVVDMKLPPE 
FAAAHPGPQF GVAGSRRLTG VEGRPIIGTI VKPALGLLPD ETAALVGDLL SSGVDFIKDD 
EKLMSPAYSP LSARIAAIMP KIRDHEQKTG KKVMYAFGIS HTDPDEMMRN HDLVVAAGGN 
AAVVNINSIG MGGVAFLRKR SNLVLHAHRN GWDILTRHGG LGMEFSVWQQ FWRLLGVDQF 
QINGIRVKYW EPDDSFVKSF KAVSTPLFSR EDCPLPVVCS GQWGGQAPET FVRTGRTTDL 
LYLCGGGVVS HPGGAGAGVR AVRQAWEAAV AGIPLSDYAK EHPELAQSIE KFADGKGA