Gene Smed_3891 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_3891
Symbol
ID	5318685
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009620
Strand	+
Start bp	349107
End bp	350192
Gene Length	1086 bp
Protein Length	361 aa
Translation table	11
GC content	64%
IMG OID	640775703
Product	hypothetical protein
Protein accession	YP_001312636
Protein GI	150376040
COG category	[S] Function unknown
COG ID	[COG4641] Uncharacterized protein conserved in bacteria
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.172461
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	25
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAACTGG CATTTTACGG ATCGAGCCTC GTTTCGGCCT ACTGGAACGG CGCGGCCACC 
TACTATCGCG GCCTGCTCCG TGCTCTCGCG CAACGGGGCT ATCAGATCAC CTTCTATGAG 
CCTGATGTCT ACGACCGGCA AATGCACCGC GACATCGATC CGCCCTTCTG GTGCAAGGTC 
GTCGTCTACG AAGGGACCAT TGAAGGTCTG AAAAGCGTCG CCGGGAAAGC CGGTGAGGCC 
GACATCGTCG TCAAGGCGAG CGGAGTGGGC TTTGAGGACG AGTTACTGCT CGCCGAGGTC 
ATGGCGGCGG CGGATCCAGC GGCATTGAAG ATCTTCTGGG ACGTCGATGC ACCTGCCACG 
CTGGCCGATC TCAGGGCCGC GCCCGACCAC CCGCTTCGTC GCGCGCTTCC CTCTCTGGAT 
CTCGTTCTGA CCTATGGCGG CGGCGATCCC GTGGTCGGCG CCTATCGGGC TCTCGGTGCC 
CGCGAATGCG TTCCGATCTA CAATGCCGTC GATCCCGAGA CGCACTATCC GGTTTCGCCG 
GACCCGCGCT TTAACGCGGA TCTCGCCTTC CTCGGCAATC GCCTGCCGGA CCGGGAGGAG 
CGGGTGGAAG CCTTCTTCCT CGAGCCGGCG CAAAAGCTCT GGCAGCGGCG TTTCCTGCTT 
GGCGGAGCGG GTTGGCATGA CAAATCCCTG TCCCCGAACG TCGCCTATAT CGGTCATGTC 
CCGACGGCGG ACCACAATGC CTTCAACACG ACACCGACTG CCGTATTGAA CATTTCGCGC 
TCCAGCATGG CCGATAACGG CTTTTCGCCG GCAACCCGCG TATTCGAGGC GGCCGGCGCC 
GGTGCCTGCC TGATCACCGA CTACTGGGAG GGGATCGAAC TTTTCCTGAA GCCCGGAGAA 
GAAGTGCTGG TCGCCAGAGA CGGCCGCGAC GTCGCCGAGC TGATGCAGAA ACTGACCAGC 
GCTAACGCCA GGGAGATCGG CGAGCGCGCG CTGCGCCGCG TGCTGGCCGA GCACACCTAT 
GCGCATCGTG CCGCAGAAGT GGACCGCATC TTGCGCCAGG CGCGCCGGAT GGAGGCTGCC 
GAATGA

Protein sequence

MKLAFYGSSL VSAYWNGAAT YYRGLLRALA QRGYQITFYE PDVYDRQMHR DIDPPFWCKV 
VVYEGTIEGL KSVAGKAGEA DIVVKASGVG FEDELLLAEV MAAADPAALK IFWDVDAPAT 
LADLRAAPDH PLRRALPSLD LVLTYGGGDP VVGAYRALGA RECVPIYNAV DPETHYPVSP 
DPRFNADLAF LGNRLPDREE RVEAFFLEPA QKLWQRRFLL GGAGWHDKSL SPNVAYIGHV 
PTADHNAFNT TPTAVLNISR SSMADNGFSP ATRVFEAAGA GACLITDYWE GIELFLKPGE 
EVLVARDGRD VAELMQKLTS ANAREIGERA LRRVLAEHTY AHRAAEVDRI LRQARRMEAA 
E