Gene Smed_3176 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_3176
Symbol
ID	5324055
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009636
Strand	+
Start bp	3339534
End bp	3340703
Gene Length	1170 bp
Protein Length	389 aa
Translation table	11
GC content	63%
IMG OID	640792124
Product	hypothetical protein
Protein accession	YP_001328835
Protein GI	150398368
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	29
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCAGCA TTTTTCTTCC GTGCCAGGAC GGCTCGCTCG AAGAATACCG GCTCCAGGGA 
ATGCCTATCG CCCGTCCCGG CGCCGTTCCG GCGTTCAGCC GTATCGCCTA TGCGGCTGCG 
CATGTCGTTT CCGATCCGCT CCGCGACGCA GACCCCTGGG GCAATCCTGC GATCGACTGG 
GAGGCGACGA TGGCCTTCCG GCATCATCTG TGGGGCCTCG GCTTCAGGAT TGCCGAAGCA 
ATGGACACCG CGCAACGCGG GATGGGCCTT ACATGGCCGG CGGCCCGGCA ACTGATACGC 
CGCTCGCTCG CCGAAGCACG CAGCGTTCCG GGCGCCGATC TTGCCTGCGG CGCCGGCACC 
GACCATCTTG CGCCCGCGGA CGCGCGATCC ATCGAAGACG TCATTGCCGC CTATGAGCAG 
CAAATCGGCT TCGTCGAAGC CGAGGGCGGC CGTGCGATCA TGATGGCGAG CCGGGCTCTG 
GCCCGCGTGG CGCGCTCCCC CGCCGACTAC CGGCGTGTCT ACGGCCACAT CCTGTCCCAG 
ACGAAAGAAA AGGTGATCCT GCACTGGCTG GGCGACATGT TCGACCCGCA GCTTCGAGGA 
TATTGGGGCT CGGAAAACTT CGAGGAAGCG CTCGAAACCG TTCTGGCGAT CATCGGCGAG 
AACAGCGCCA GGGTTGAGGG CATCAAGATT TCACTGCTCG ACAATGCCAA GGAACTGGCC 
CTGCGCAACC GGCTGCCCGA AGGCGTGCTT TGCTTCACCG GCGACGACTT CAACTATGCG 
GAACTGATCG AGGGAGACGG CACGAAATAC AGTCACGCGC TGCTCGGCAT ATTCGATGCG 
GTCGCACCTT CGGCGTCGAA GGCGCTTGCG GCGCTCGCGA GCGGAGATCT CTCAACCTTC 
CGCGGCGTCA TCGAACCGAC AGTACCCCTG TCGCGCAAGA TCTTCGAGGC GCCGACGCAA 
TATTACAAGG CCGGCGTCGT CTTCCTCGCC TGGCTGAACG GTCATCAACG GCATTTCACC 
CTGCCCGCCG GCCTTCAGTC GGCTCGCGGA TTGCTCCATT ATGCCGATAT TTTCCGCCTG 
GCAGATCAGG CCAATGTGCT CGACAAGCCG GAGCTGGCTG TTGCGCGGAT GCGCAATCTG 
CTTGGGGTGC TGGGAGTGGA GCAGTCGTGA

Protein sequence

MTSIFLPCQD GSLEEYRLQG MPIARPGAVP AFSRIAYAAA HVVSDPLRDA DPWGNPAIDW 
EATMAFRHHL WGLGFRIAEA MDTAQRGMGL TWPAARQLIR RSLAEARSVP GADLACGAGT 
DHLAPADARS IEDVIAAYEQ QIGFVEAEGG RAIMMASRAL ARVARSPADY RRVYGHILSQ 
TKEKVILHWL GDMFDPQLRG YWGSENFEEA LETVLAIIGE NSARVEGIKI SLLDNAKELA 
LRNRLPEGVL CFTGDDFNYA ELIEGDGTKY SHALLGIFDA VAPSASKALA ALASGDLSTF 
RGVIEPTVPL SRKIFEAPTQ YYKAGVVFLA WLNGHQRHFT LPAGLQSARG LLHYADIFRL 
ADQANVLDKP ELAVARMRNL LGVLGVEQS