Gene Smed_1028 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_1028
Symbol
ID	5321874
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009636
Strand	+
Start bp	1098221
End bp	1099537
Gene Length	1317 bp
Protein Length	438 aa
Translation table	11
GC content	60%
IMG OID	640789971
Product	hypothetical protein
Protein accession	YP_001326716
Protein GI	150396249
COG category	[S] Function unknown
COG ID	[COG2718] Uncharacterized conserved protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	1
Plasmid unclonability p-value	0.0000562968
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	29
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCGAATT TCATCGACCG CCGCCTCAAT CCGAAGGACA AGAGTCTCGG CAACAGGCAA 
CGTTTCCTGA AACGGGCGCG AGAGGAGCTT AAACGAACCA TCAAAGAACG GGTCAAGTCG 
GGCAAGATCG CGGATGTGGA TGCGGAGCAG AACGTGTCCA TGCCGGCCCG CGGCGTCAAC 
GAGCCGGCCT TCCAGCCGGA CTCCAACAGC GGCGAGCGGC GCCACGTCCT GCCGGGAAAC 
CGGGAGTTCG CGGCAGGAGA CCGCATCCCG AAAAGGGGTG GAGGCGGCGG CGCCGGAAAT 
GCGGGCGCCG GCACCGGCCA AAGCGAGGAC GAGTTTCAGT TCGTCCTTTC ACGCGAAGAG 
GTGCTCGACC TCTTCTTCGA GGATCTCGAA CTCCCCGACA TGGTCAAGCT CAATCTGAAG 
GAGTCGGTTA CGTTCAAGCG GCGACGAGCC GGCTTCAGCG CAAGCGGCTC TCCCACGAAC 
ATCAATGTCG GGCGCACCAT GCGCAACAGC TATGGGCGCC GAATCGCATT GCGGCGGCCG 
TCGCGCCGGG AAATCGAGGC CCTGGCCGAT GAGATTGCCA GGCTCGAAAC CGAGCCTGGC 
GGGCGGAACA AGCATCGTCA GCGATTGGAG GAACTGCGAC AGACGCTCGA CAGTCTCGAG 
CGACGGCGCC GGCGAATTCC CTATGTCGAT CCGGTAGACA TTCGCTTCAA TCGTTTCGAG 
CCTCAGCCTT TACCGAATGC GAGCGCAGTC ATGTTCTGCC TCATGGATGT CTCGGCGTCG 
ATGGGGGAGC GGGAGAAGGA CCTCGCCAAA CGTTTTTTCG TGCTGCTGCA TCTCTTCCTC 
AAGCGGCGCT ACGAGCGGAT CGACATCGTA TTCATCCGGC ACACCGATGA AGCCGGCGAG 
GTCGACGAGA ACACGTTTTT CTATAGCAAG CAGAGCGGCG GCACGGTCGT TTCCACCGCC 
CTGGAGGAGA TGCTGCGCGT TATCAGGGAG CGTTACCCTG CCAACGAATG GAACATCTAC 
GCCGCACAGG CGTCGGACGG CGAGAATATC TCAGGCGACT CCGAACGCTG CGCCTCCCTT 
CTTCATGACG AGCTCATGGG ACTTTGCCAA TATTATGCCT ATGTCGAGAT CATCGATGAG 
CGCGAGACGG AGATTTTCGG CACCACCGAC AACGGGACTT CGCTCTGGCG AGCCTACCGC 
ATCGTCGATG GCGAATGGCC GAATTTCCAG ATGACCCGCA TCGCGAAACC GGCGGATATC 
TATCCCGTCT TCCGAAAACT CTTCGGCAAG CAGCCGGAGA TGCAATTGCG CAAGTAA

Protein sequence

MPNFIDRRLN PKDKSLGNRQ RFLKRAREEL KRTIKERVKS GKIADVDAEQ NVSMPARGVN 
EPAFQPDSNS GERRHVLPGN REFAAGDRIP KRGGGGGAGN AGAGTGQSED EFQFVLSREE 
VLDLFFEDLE LPDMVKLNLK ESVTFKRRRA GFSASGSPTN INVGRTMRNS YGRRIALRRP 
SRREIEALAD EIARLETEPG GRNKHRQRLE ELRQTLDSLE RRRRRIPYVD PVDIRFNRFE 
PQPLPNASAV MFCLMDVSAS MGEREKDLAK RFFVLLHLFL KRRYERIDIV FIRHTDEAGE 
VDENTFFYSK QSGGTVVSTA LEEMLRVIRE RYPANEWNIY AAQASDGENI SGDSERCASL 
LHDELMGLCQ YYAYVEIIDE RETEIFGTTD NGTSLWRAYR IVDGEWPNFQ MTRIAKPADI 
YPVFRKLFGK QPEMQLRK