Gene Smed_4484 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_4484
Symbol
ID	5318349
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009620
Strand	-
Start bp	968351
End bp	969847
Gene Length	1497 bp
Protein Length	498 aa
Translation table	11
GC content	64%
IMG OID	640776285
Product	DEAD/DEAH box helicase domain-containing protein
Protein accession	YP_001313217
Protein GI	150376621
COG category	[J] Translation, ribosomal structure and biogenesis [K] Transcription [L] Replication, recombination and repair
COG ID	[COG0513] Superfamily II DNA and RNA helicases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	26
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGTCCACAT TTAAAGAGCT CGGCCTCTCG CAGGAGATCC TGGCGACACT GACCGCCAAC 
GGTTTCGAGA AGCCGACGCC CATCCAGACC CAGGCCATTC CGCTTGTCCT CCAAGGCCGC 
GATCTCATCG GCCTCGCCCA GACGGGCACG GGCAAAACGG CCGCCTTTGG CCTGCCGATG 
ATCGAAAAGC TTCAGGCCGA CGGCAAACGC CCCGATCCGC GCAACATCCG TGCCCTCATC 
CTTGCGCCGA CCCGAGAGCT CGTCAACCAG ATCGCCACCA ATCTTAAACT CTTCGTGAAG 
AAGACACCGA TTAAAGTCGG AGTCGTGGTA GGCGGCGTGT CGATCAACAA GCAGACCGAA 
CAGCTGGCGC GCGGCGTCGA TATTCTCGTC GCAACGCCCG GCCGTCTGCT GGATCTCATC 
TCCCGCAAGG CTGTGACCCT CACCCAGGGA CGCTACCTCG TCCTGGACGA GGCCGACCAG 
ATGCTCGACC TCGGCTTTAT TCACGACCTG CGCAAGATCG CGAAGCTCGT TCCGAAGAAT 
CGTCAGACGC TGCTCTTCTC CGCGACCATG CCGAAGCTGA TCGCCGAGCT TGCCGGCGAA 
TATCTCACCG ATCCGGTCAA GGTCGAGGTC ACGCGGCCCG GCAAGGCGGC CGACAAGGTC 
GAGCAATATG TCCACTTCGT TCCGGGCAAG GACCTGAAGA CGACAATCCT CAAACAGACG 
CTGACCGCAA ATCCGGACGG ATTGTCGCTG GTCTTCAGCC GCACCAAGCA TGGCGCCGAA 
AAGCTGATGA AGCATCTGGA CCAGGTCGGT TTCAAGGCCG CCTCGATCCA CGGCAACAAG 
AGCCAGGGCC AGCGAGAGCG CGCTCTGAAA GCCTTCCGCG ATGGTGAAAT CCGTGTACTC 
GTGGCGACCG ATGTCGCCGC ACGCGGCATT GACATTCCCG GCGTGACGCA TGTCTACAAC 
TACGACCTGC CGGAGGTGGC CGACGCTTAT GTCCACCGTA TCGGCCGCAC GGCCCGAAAC 
GGCCGCGACG GTATTGCGAT CGCCTTTTGC GCCCCGGACG AAATCCGGCT GCTGCGCGAT 
ATTGAAAAGC TGATGGGCAT CGAGATTGCC GTCGCCAGCG GAGAAGTTCC GGCCGACCAG 
GCCCGCCCGT CCAAGGGACG CGGCGGTCGC GGCAACGCCC AGTCCCGCGG CAATGGCGCA 
GGACAGCGCC AGGGCGGACC TCGCCGGGAT CGGCCACAAC GCCAGTCGGC AGCCGGCGGC 
TTCGCCGGCG ACGAACTGTT GCGCGACGAC CGTTCGCAAC AGCACGAGCG CCGCGATCAT 
CGTGCTCCGG GCCAGGACGG TCGTCCGGAA GGCAACCGCA ACCACGAAGC CAAGAAGCAC 
CATGGCCGTC CGGGCCCGAA GCGTGACGGC CGGCGCGGCA ATGAAGGCCA GCCCAGCAAC 
CGCAATGAAG GCGCCCGGGG CATGCGCCGC GCGGAAAATC GCGCGCCGCG AGGGTAA

Protein sequence

MSTFKELGLS QEILATLTAN GFEKPTPIQT QAIPLVLQGR DLIGLAQTGT GKTAAFGLPM 
IEKLQADGKR PDPRNIRALI LAPTRELVNQ IATNLKLFVK KTPIKVGVVV GGVSINKQTE 
QLARGVDILV ATPGRLLDLI SRKAVTLTQG RYLVLDEADQ MLDLGFIHDL RKIAKLVPKN 
RQTLLFSATM PKLIAELAGE YLTDPVKVEV TRPGKAADKV EQYVHFVPGK DLKTTILKQT 
LTANPDGLSL VFSRTKHGAE KLMKHLDQVG FKAASIHGNK SQGQRERALK AFRDGEIRVL 
VATDVAARGI DIPGVTHVYN YDLPEVADAY VHRIGRTARN GRDGIAIAFC APDEIRLLRD 
IEKLMGIEIA VASGEVPADQ ARPSKGRGGR GNAQSRGNGA GQRQGGPRRD RPQRQSAAGG 
FAGDELLRDD RSQQHERRDH RAPGQDGRPE GNRNHEAKKH HGRPGPKRDG RRGNEGQPSN 
RNEGARGMRR AENRAPRG