Gene Smed_4882 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_4882
Symbol
ID	5318044
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009620
Strand	+
Start bp	1391076
End bp	1392521
Gene Length	1446 bp
Protein Length	481 aa
Translation table	11
GC content	59%
IMG OID	640776667
Product	hypothetical protein
Protein accession	YP_001313599
Protein GI	150377003
COG category	[S] Function unknown
COG ID	[COG5361] Uncharacterized conserved protein
TIGRFAM ID	[TIGR01409] Tat (twin-arginine translocation) pathway signal sequence

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.196066
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	25
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTCACGA AACGCGATCT GCTTCACGCT GCTGCGATAG CCGCCGCGGT GGCCGCCACG 
GCGGCGAGGT CCACCCCAGC AATTGCCCAG GACAAAGCCG GATGGCCCAG CGTGCTGGAG 
GCCAAGGATA TTGCCGAGGA AGGGCTCATC TATGGCTTGC CGCTGGTGAT GAATTACGCG 
GTCATGCAGG AGTTCGCAGT CGACAGAAAC TCGGGGCAGT TCAAGGCACC TTTCAACGAA 
ATCAACAACA TGCACCATGT CGCGACCCCC GCGGACACTG CAATCATAAC GCCGAACAGC 
GATACCCCTT ACTCGTTTGT GTGGCTGGAT TTGCGCGCCG AGCCGATGGT TCTCTCGGTT 
CCGGCGATCG ATAAGGACCG ATACTATTCG ATCCAGCTCA TCGACGGCAA CACCTATAAC 
TTCGGCTATA TCGGCACGCG CGCCACGGGC ACCGAGCCGG GCGACTATCT GGTGGTCGGC 
CCCGACTGGA AGGGTGAAAC GCCCGCCGGT ATCAAGAAGG TCTTCAGATC GACGACGCCG 
TTCACGTTTA CCGCTATCCG CACGCAGCTC TTCAACCGCA ACGACATGCC GAGGGTCGAG 
AAAATTCAGG CTGGCTACAC CGCGCAGCCT CTCTCCGCTT TCCTGAAACA ACCGGCTCCG 
CCCGCATCGC CGAAAATCGA CTTCCTTCCA GCCACCACTG CAGGGATCAA GGACAACTTC 
TTCCGATATC TCGATGCGTC CCTGCAATTC GTTCCTGAGA CGTCAAGGGA CAAGGCCATC 
CGCGCGAGAC TCGCTAAGAT TGGCATTGGT CCGGGAAAGA CCTTCGAGTT CGAGGATCTG 
TCGCTCGAAC ACAAGGACGC AATTCGCGTG GCCATGAAGC AGGGCAATGA CAAAGTCGAC 
AAATGGCTGA CCAACGGAAA CAAAAATATC AACGGCTGGA ACATCGGCTC GTTCTTCGGT 
GACGAAGCCT TCTTCAACGG TGATTGGATG ATGCGGGCCG GGGCTGCCAA GGGCGGTCTC 
TATGGAAATG ATGCCGTTGA AGCCATGTAC CCCTACACCC GAACGGACAC GACCGGCGAG 
CCGCTCGACG GCAGCAAGCA CAAGTACACA ATCACCTTCG CACCCGGCCA GTTGCCTCCG 
GTAAATGCGT TCTGGTCCGT CACGATGTAC GACGGCAAGA GCCAGTTCCT GGTCAAGAAC 
CCGATCGATC GCTACCTCAT CAACTCTCCG ATGTTGCCGG GGATGAAAAG GGCGCCGGAT 
GGTTCGCTGA CGCTGTACAT TCAAAAGGAC AGCCCCGGTG CGGACAAGGA GGCAAATTGG 
CTTCCAGCCC CGGATGGCAC GATTTATCTC GTGATGCGCC TGTACTGGCC GAAGCCTACG 
CCACCCTCGA TTTTGCCGGC GGGCGAGGGG ACATGGCAGC CGCCCGGCGT GAAACGGGTC 
TCGTAG

Protein sequence

MLTKRDLLHA AAIAAAVAAT AARSTPAIAQ DKAGWPSVLE AKDIAEEGLI YGLPLVMNYA 
VMQEFAVDRN SGQFKAPFNE INNMHHVATP ADTAIITPNS DTPYSFVWLD LRAEPMVLSV 
PAIDKDRYYS IQLIDGNTYN FGYIGTRATG TEPGDYLVVG PDWKGETPAG IKKVFRSTTP 
FTFTAIRTQL FNRNDMPRVE KIQAGYTAQP LSAFLKQPAP PASPKIDFLP ATTAGIKDNF 
FRYLDASLQF VPETSRDKAI RARLAKIGIG PGKTFEFEDL SLEHKDAIRV AMKQGNDKVD 
KWLTNGNKNI NGWNIGSFFG DEAFFNGDWM MRAGAAKGGL YGNDAVEAMY PYTRTDTTGE 
PLDGSKHKYT ITFAPGQLPP VNAFWSVTMY DGKSQFLVKN PIDRYLINSP MLPGMKRAPD 
GSLTLYIQKD SPGADKEANW LPAPDGTIYL VMRLYWPKPT PPSILPAGEG TWQPPGVKRV 
S