Gene Smed_5431 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_5431
Symbol
ID	5319733
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009621
Strand	-
Start bp	389181
End bp	390356
Gene Length	1176 bp
Protein Length	391 aa
Translation table	11
GC content	67%
IMG OID	640777195
Product	phage integrase family protein
Protein accession	YP_001314127
Protein GI	150377532
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.606096
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	24
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGTCGATA ATCATAGAGC GGCCTATTTC GACAGCCCAG CGGTCCACCG ACGCGCCGAA 
GAGCTCGACG CGCTCGACGC CATCCTACCG TTCGACCGAC GCGACCGGCT CGCCGCGCTG 
CTGACCGACG ACGATGTCGC GACCCTGAAA CATCTCGCGA GCGAAGGCAT GGGCGAGAAC 
ACGCTGCGGG CACTCGCCTC CGATCTCGGC TATCTCGAGG CCTGGTGCCA GCTTGCCACC 
GGTTCCCCCC TCCCCTGGCC GGCGCCGGAA GCACTGCTCC TGAAGTTCGT CGCCCATCAC 
CTCTGGGATC CGGTCAAGCG CGCCGAGGAC CCGGCCCACG GCATGCCGGC CGAGGTCGAG 
GCCGGATTGC GTGCCGAACG CCTGCTGAGG GCCGACGGAC CGCACGCGCC CGGCACGGTG 
CGGCGCCGGC TGACCTCCTG GTCGATCCTG ACCCGCTGGC GCGGTCTCAC CGGCGCCTTC 
GGTGCGCCAT CGCTGAAGAG CGCGCTGAGG CTGGCAGTCA AGGCGAGCAA CCGGCCGCGC 
CAGCGCAAGA GCAAAAAGGC AGTGACCGTC GATATCCTGG CGAAACTGCT TCAGGCTTGT 
GCTGGCGATC GGCCGGTTGA CCTCCGCGAT CACGCGCTGC TCCTCACCGC CTTTGCCTCC 
GGCGGCCGTC GCCGCTCGGA AGTGGCGGCT CTGCGCGTCG AGGATCTCGC CGACGAGGAA 
CCGGTCCGCG CGGATCCCTC CGACAAGACC TCCCCTCCCC TGCCCTGTCT GTCGATCCGC 
CTCGGCCGCA CCAAGACGAC GACCGCCGAT GAGAACGAAC ATGTGCTGTT GATCGGCCGT 
CCAGTAGCTG CCCTGAAAAC TTGGCTGGCT GAAGCGCTAA TCAAGGACGG CCCGGTGTTC 
CGGCGCATCG ATCAGTGGGG CAATATCGAC CTGCGGGCGC TGACGCCGCA GTCTGTCAAT 
CTGATCCTGA AAGCACGCTG TGAACAGGCC GGCCTCGATC CGGCGCTGTT TTCGGCGCAC 
GGCCTAAGGT CCGGCTATCT GACCGAGGCG GCAAATCGTG GTATCCCGCT GCCCGAGGCG 
ATGCAGCAGT CGCTGCACAA ATCGGTGACC CAGGCGGCCA GCTACTACAA CAACGCGGAA 
CGAAGGAATG GGCGAGCGGC CCGGCTGATC GTCTGA

Protein sequence

MVDNHRAAYF DSPAVHRRAE ELDALDAILP FDRRDRLAAL LTDDDVATLK HLASEGMGEN 
TLRALASDLG YLEAWCQLAT GSPLPWPAPE ALLLKFVAHH LWDPVKRAED PAHGMPAEVE 
AGLRAERLLR ADGPHAPGTV RRRLTSWSIL TRWRGLTGAF GAPSLKSALR LAVKASNRPR 
QRKSKKAVTV DILAKLLQAC AGDRPVDLRD HALLLTAFAS GGRRRSEVAA LRVEDLADEE 
PVRADPSDKT SPPLPCLSIR LGRTKTTTAD ENEHVLLIGR PVAALKTWLA EALIKDGPVF 
RRIDQWGNID LRALTPQSVN LILKARCEQA GLDPALFSAH GLRSGYLTEA ANRGIPLPEA 
MQQSLHKSVT QAASYYNNAE RRNGRAARLI V