Gene Smed_5641 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_5641
Symbol
ID	5319943
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009621
Strand	+
Start bp	606459
End bp	607856
Gene Length	1398 bp
Protein Length	465 aa
Translation table	11
GC content	59%
IMG OID	640777377
Product	hypothetical protein
Protein accession	YP_001314309
Protein GI	150377714
COG category	[S] Function unknown
COG ID	[COG5361] Uncharacterized conserved protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	0.617076
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCAGCACT CGCCGATTTT CCTCGCGCTC GCCCTATCGA TTTCGACGGC CGACACTGCA 
GCTGGTTTCA CGACGGACGA GCTTCGAAAC CGAACCATTG AGAGGCGGGC CGTCGAAGCC 
GTCAACTGGG GCATTCCGGT GGTGAACTTC GACCGGATGC TGCAAGCGTT CAAGGAAAAA 
GGCGGCGATT TCAACCAGAT CGTCTACTGG GGCGGACTGT TCGACTGGAG GAACCAGACA 
CTCACACCCA ACCCGGACAC GATCTACTTC AAGCCTTTCT GGGACACGAA GATGGCCGGA 
CCGATTGTGA TCGAAATCCC TCCTGCGGGA GAAGATGGAT CGATCACGGG AACGCTGATG 
GACATGTGGC AGGCGGCACT GGAGGACGTC GGCCCGGCGG GCGTGGACCA GGGTAAAGGC 
GGGAAGTATC TGATCCTGCC GCCCGACTAC AAGGAGAAGC CTCCCGAAGG CTTTATCGTC 
CTGCCGTCTT CGACCTATGA GGGCTTCGGT CTGCTCCGGT CCGTGATCAA TGGCAGTGGG 
CCAGATGCGG CCAGGCGCGC CGTCGATTAC GGCTTGAAGG TCAAACTCTA TCCGCTGGCA 
CAGGAAGCCA GCCCGTCGAA GACGAAGTTC ATCGACGTTC TCGGACAGAT GTTCGACTCC 
ACCATCCGCT ATGACCTCAG CTTTTTCCAG TCGCTCAACC GGGTCGTCCA GTACGAACCA 
TGGTTGTCTC GGGACAAAGT CATGGTCGAC ATGCTGAAGA CCATCGGCAT CGAGAAGGGA 
AAGCCGTTCA ATCCAGACGA GTCTGCCCGA AAGGTGCTTG AAAGCGCCGT TGACGAAGCG 
CATGCCTGGT TCGACTTCCG TTATGAAACG ACATTCGCTC CGTACTTCAA GGACACGCAC 
TGGGCCGTGC CCGCATCTCC GGAATTGATG GAGGTGTCCG ACAGCTTCTA CGAGTCGCCA 
GACAGCTACG CCATCGACGC CAGGGGCGTC ACAGATTATT GGGCTTTCAG CACGGTTAAG 
CACCTCGGTG CGGGGCAATT CTACCTGATG TCGACAAAGG ACAAGCATGG GGCGCCCCTC 
GACGGAGGAA AGGCGTACAA GCTCACCATC CCCGCAAACG TGCCAGTCAC GCAGTACTGG 
TCGGCCGTGG TCTATGACAG GGCTACTCAC GCGCTGATCC GCGATGTCGC GAGCCCCAGC 
AAATCCTCGC AGACGCCGGG GCTTCAGGTG AACGAGGACG GGACTGTTGA TCTATACTTC 
GGCCCCGACG CGCCGTCCGG CAAAGAATCG AACTGGACAC CCACGAAAGC CGGGGGCCGC 
TTCGAAGTGC TTTCCGCCTC TACGGCCCGC AAAAGCCTCT CTTCGACAAG ACGTGGACCC 
TTCCCGATAT CGTGGTAG

Protein sequence

MQHSPIFLAL ALSISTADTA AGFTTDELRN RTIERRAVEA VNWGIPVVNF DRMLQAFKEK 
GGDFNQIVYW GGLFDWRNQT LTPNPDTIYF KPFWDTKMAG PIVIEIPPAG EDGSITGTLM 
DMWQAALEDV GPAGVDQGKG GKYLILPPDY KEKPPEGFIV LPSSTYEGFG LLRSVINGSG 
PDAARRAVDY GLKVKLYPLA QEASPSKTKF IDVLGQMFDS TIRYDLSFFQ SLNRVVQYEP 
WLSRDKVMVD MLKTIGIEKG KPFNPDESAR KVLESAVDEA HAWFDFRYET TFAPYFKDTH 
WAVPASPELM EVSDSFYESP DSYAIDARGV TDYWAFSTVK HLGAGQFYLM STKDKHGAPL 
DGGKAYKLTI PANVPVTQYW SAVVYDRATH ALIRDVASPS KSSQTPGLQV NEDGTVDLYF 
GPDAPSGKES NWTPTKAGGR FEVLSASTAR KSLSSTRRGP FPISW