Gene Smed_1232 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_1232
Symbol
ID	5322079
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009636
Strand	-
Start bp	1312774
End bp	1314096
Gene Length	1323 bp
Protein Length	440 aa
Translation table	11
GC content	59%
IMG OID	640790173
Product	hypothetical protein
Protein accession	YP_001326917
Protein GI	150396450
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.583385
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	0.276368
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATCAGAC GCGGGGACAG CCGCAACGAA GTGGAGCGTG AGCGCTCGAT CGAAGGAGAC 
AATGGCATGG GAATACTCAT TAACCTCGAT CTCGCAGCCA CGATCGATCC GCTTGACGGG 
ATACTGATCG ACATCGCCCG CCGCATCCAA GTCCCCAAGA CGAAGCATGA GGACGCTGCC 
GACCACTTTC TCGGTCTCTG CGCTCATGTG GACCGCCAGG GTAGCCCCTT GGAGGGCAAG 
GTGATTGAGT GCTATCCATC TGGATCATTC TCGATCGCAG CCGCTATCTA CTCGCGTGTG 
AAGTCGATGC AGCACGATGT CGACGTCGTC GTCGAAGTCG ACTTCCCGAT CGGCACGGAT 
CCAGAGTGGA TGCTCGACAA GCTCTACGAA GCAGTGAAGG GCGATGCCGG GAGCCGCTAC 
TACGACTTCA AGGTGGCGCG GAATTCACGC TGCGTAACGG TTACCTATCC CGACGGTGTC 
ACCGTCGACC TCATGCCCGT AGCCCGGATT CTCGGCGGCC CCGAGCGTTC GGGCGTGCTT 
TTCCACCATA ATGCCAAGCG GGCTGAGAAG TACCGGAAGG AAGTTAATCC GAAGGCATTT 
ACGCTCCACT TCAACGCTCG CATCAAGTCC AGCGACGTTT TTGCATCCCG TTACCGGACG 
CGGAGGCTTC TCTCAGATGG ATTGCTGCAG GAGCGCGCCG AGACGCAGCC GATGCCCGAG 
CACGTTCCGA TCGAGGAGAA GTCGCCCCGT CTGGTTGCGA TCCAGTTGCT GAAGCGCTTC 
CGGGACATCC AGTTCCGCGG TCGCGACGGC CGATGCCCAC CCTCTGTGGT GATTGCAGCC 
ATGGCACTGG ACGCTGGTCA GATGAGCGAC AGCCTGTGTG ACGAATTGAT CGCCATTGCA 
ACCCACATGC AGCGGGAGAT CGAAGAAGCG GAGCGAGACC TTAGCAAACT GGTGGTCGCG 
AACCCTGCGC ATCCGGTAGA TATCTTCACT GACCGTTGGC CAGAAGACAG GAGCGCTCAA 
CGCCTCTGGC GGGATGATTT GATCCGCCTC GTCCGGCATC TCAGGACACT GCGGGGCCGC 
GACTGGGATC CTCGGCAGCT CAAGAACGTA CTGCAGGAAC TGTTCGGCGA GACGCCTGCA 
GAGCGGGCAT TCGAAGATCA CTATCGAGGC CAAAGCGCCT TGGCGAAGCA GAACATGCTC 
GGCATCACGA GATCAGGGGC GGTGAGAAGC GCGATCGCGA CACCGGCTAT CTCCAGCGGC 
CTTATCGTCC CTGCAAGAGC AAATACCGAC ATGGGCGGCT ATATTGAAGA TCCTGTCGAT 
TGA

Protein sequence

MIRRGDSRNE VERERSIEGD NGMGILINLD LAATIDPLDG ILIDIARRIQ VPKTKHEDAA 
DHFLGLCAHV DRQGSPLEGK VIECYPSGSF SIAAAIYSRV KSMQHDVDVV VEVDFPIGTD 
PEWMLDKLYE AVKGDAGSRY YDFKVARNSR CVTVTYPDGV TVDLMPVARI LGGPERSGVL 
FHHNAKRAEK YRKEVNPKAF TLHFNARIKS SDVFASRYRT RRLLSDGLLQ ERAETQPMPE 
HVPIEEKSPR LVAIQLLKRF RDIQFRGRDG RCPPSVVIAA MALDAGQMSD SLCDELIAIA 
THMQREIEEA ERDLSKLVVA NPAHPVDIFT DRWPEDRSAQ RLWRDDLIRL VRHLRTLRGR 
DWDPRQLKNV LQELFGETPA ERAFEDHYRG QSALAKQNML GITRSGAVRS AIATPAISSG 
LIVPARANTD MGGYIEDPVD