Gene Smed_3884 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_3884
Symbol
ID	5318564
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009620
Strand	+
Start bp	340409
End bp	342157
Gene Length	1749 bp
Protein Length	582 aa
Translation table	11
GC content	65%
IMG OID	640775696
Product	hypothetical protein
Protein accession	YP_001312629
Protein GI	150376033
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.329312
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	24
Fosmid unclonability p-value	0.887
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTCGTAT ACGGTGATGC AAAGCGCCTC GAGCGCGCCG ACGAATTGTC AGCCTCGATC 
GCGTCGCGGC TGCGCAGGAT CGAAGATCAG CCCCCAGGTA TCGAGCGGCA CACCGAACTC 
GTTGCGATCC TGCTCAAAGC CGGAGAACTG GTGCAGGGGC TTTCGGATGC GGAGTTCAAA 
CAGGCGAGAG CCGACGAGAT CTCCGCCTCC CGTGAGGCTG GCGAGCGTCT CCTCCTCGAC 
CTTGCGATGC TCGTCGCCCG TTCCTGGCAA CGGGGGTTCA CGGAGCGGGT TAGCGTACCG 
GCCCATGTCG CGAACCTGCT CGCGACCATC AGCGCGCCGA TCTCCCTCGG TATCCGGGAA 
CCGGAAGGCT ATGCCTTTTA CGCTCTCTAC CCCGAGAGCT ATCTGGAGGC CGCGCGAGAG 
TCCGGTCTGG GCTCCGATGC CGTGGTAATC GGTCTGCGGA GCATCGGAAC CACTCTTTCC 
GCCATTGTCG CCGCCGCCCT GCATGCAGCG CCGCCGCTGA CGCTGCGTCC CAAGGGAGAT 
CCGTTTCGAA GGCAGCTTGC AATCGCCCCG CAGCTTGCCG GACGGCTGCT GCGCAACCCG 
GCAGCGGGTT TCGCTATTGT CGACGAAGGG CCCGGCCTTT CCGGCAGCTC GTTCGGATGC 
GTAGCCGATT GGCTCGAGGA TCATGGCGTC GCCGCCACGC GCATTCACTT CTTCCCAAGC 
CACAAGGGCG ACCTTGGACC GCAATCCTGC GGCCGCCATC GCAGACGCTG GGCGACGAGC 
CCCCGCCATG TCGTGGACGT CGACGATCTC CTGATCAAGC CGGCCGGCTC TCCGCGCCAC 
CTCGCCGAGT GGGTCGGCCG CCTCGTTGGA CCGCTTGAGC GGCCGCTCGA GGATATCTCC 
GCGGGCGGAT GGCGAAAGGC GCTCCCCGGT GATTGCAGGC CTCCAGTCGA TATCAGGTTC 
GAACGAAAGA AGTTCCTCGC GCGCACCGCC GACGGAGCGT GGCTCGTCAA GTTCGCCGGG 
CTCGCCGACG TCGGACAGCG CAAACTCGTC AGGGCGCGCC TTCTCGCCGA CGCAGGCTTC 
GCACCCCCGG TTGCCGGACT GTGCCACGGC TTCCTGGTTC AGAAATGGGT CGCAGCGAGA 
CCTATGGCCC CTTCGGAATT GCGCCACCCG GCCTTCATAG CGCATCTCGG TCGCTATCTG 
GCCTTCCGGG CACGAAGCCT GCCGCCGCCA AAGACGCAAG GGGCGTCCAT CGCCCAGCTT 
TGCGAAATAG CTTCGGTCAA CACCGAAGAG GGACTGGGGT CAGCGGCCGC GTCACGCCTC 
AAAAGCCGGC TCCGAAATGC GGAGCGCTTT CATGCGGCGA TCCTGCCGGT CGATACCGAC 
AATCGGCTCC ATAGCTGGGA ATGGCTGGGC GAAGGAGCAC GGCAGTTCCT CAAGGCGGAC 
GCACTCGATC ACAGCGGCGG CCATGATCTC GTCGGCAGTC AGGACATCGG CTGGGACATC 
GCGGGGGCGC GCATCGAACT CGGCCTCACG CGAGACGAGC AGGCCGAACT GAGAGCGGCC 
GTATCCGAAA ACGGCTGGCG CCCTCCCGAC GCTGAGCTGC AGGAGATTTT CGACCTCTGC 
TATGCCGCTT TCCAGTTCGG CCTGTGGGCT TCCGCAAAGT CCGCTGCAGC CCCGGAGGAA 
GTTCACCGGC TGGAGACAGC CGCTGCGCGT TACGGCAGCC TCCTTAGGAA CGCGACCGAG 
GGCTTTTAG

Protein sequence

MLVYGDAKRL ERADELSASI ASRLRRIEDQ PPGIERHTEL VAILLKAGEL VQGLSDAEFK 
QARADEISAS REAGERLLLD LAMLVARSWQ RGFTERVSVP AHVANLLATI SAPISLGIRE 
PEGYAFYALY PESYLEAARE SGLGSDAVVI GLRSIGTTLS AIVAAALHAA PPLTLRPKGD 
PFRRQLAIAP QLAGRLLRNP AAGFAIVDEG PGLSGSSFGC VADWLEDHGV AATRIHFFPS 
HKGDLGPQSC GRHRRRWATS PRHVVDVDDL LIKPAGSPRH LAEWVGRLVG PLERPLEDIS 
AGGWRKALPG DCRPPVDIRF ERKKFLARTA DGAWLVKFAG LADVGQRKLV RARLLADAGF 
APPVAGLCHG FLVQKWVAAR PMAPSELRHP AFIAHLGRYL AFRARSLPPP KTQGASIAQL 
CEIASVNTEE GLGSAAASRL KSRLRNAERF HAAILPVDTD NRLHSWEWLG EGARQFLKAD 
ALDHSGGHDL VGSQDIGWDI AGARIELGLT RDEQAELRAA VSENGWRPPD AELQEIFDLC 
YAAFQFGLWA SAKSAAAPEE VHRLETAAAR YGSLLRNATE GF