Gene Smed_2934 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_2934
Symbol
ID	5323811
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009636
Strand	+
Start bp	3080586
End bp	3081677
Gene Length	1092 bp
Protein Length	363 aa
Translation table	11
GC content	62%
IMG OID	640791885
Product	GumN family protein
Protein accession	YP_001328598
Protein GI	150398131
COG category	[S] Function unknown
COG ID	[COG3735] Uncharacterized protein conserved in bacteria
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	38
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATCACCT TCACCAGACC CGTCCGCGAT CTCGCGGCCA AGGCGACCGA CTGCCTGTTG 
TGGCTCACGG CATCGTTCCA CATACTGATG GCCGCGAGCC TCCTTGCCGC CCTGCTCTAT 
GTCTCGGAGG CTCGGGCGGA TGAGACGGAT TGCGTCGGCA GCAATATTTT GACCGGACTC 
GAAAATTCTG ATCCTGCCCG TCTGGCGGCT TTGCGTGCGG AAGCGGCGGC GATACCCAAC 
GGAAAGGGCC TGCTCTGGCG AATCGAAGAT CCCGCCGCTC AAGGCCAGGG ACGGGCGCCC 
TCCTTTCTGC TCGGCACCAT GCATGTCAGC GACCCGCGCG TGCTGGCGAT GCCTGGCGGG 
GCGGCGCAAG CCTTCGCAAA AGCGCGGACC GTCATCGTGG AATCCGACGA GATTATCGAT 
CAGAACCGGG CGACCGCCGC GATCATGATG CGGCCCGATC TGACCATGTT CACCGGCGAC 
AAGACGATCA ACGACTTCCT GAAGCCGGAG GACCTCGCCC TTCTCGAAGG CGGACTGAAG 
GCTCGCGGCA TCCCCCTGCC CCTCGTCACC AGGATGAAGC CCTGGATGAT CGCCAGCTTC 
GTGGCCCTGC CGGCCTGCGA ATTCTCACGC AAGGCGGCCG GCGCCTCCTT CCTCGATAAG 
AAGCTCGCCG AGGACGCGGT GAGGGAGGGC AAGACGCTCA AGGGGCTCGA AACGCTGGTC 
GAACAGCTTG CGGCAATGGA TTCTCTGCCG GTCGAACTGC ACTTGAAGGC ATTGATCGAA 
ACGCTCGCTC TCGGCAAGAC GATCGACGAC GTGTTCACGA CGACCACCGA TCTCTATCTT 
TCCGGCGAGA CGGGCACCAT CATGCCCATG ATGAAACTGG TCTCCGCCGG GCTTTCGCCT 
AATGATGCCG GCTATGCCGA ATTCGAGCAA AGGATCGTCG TCGACCGCAA CAGGATCATG 
GCGGACCGTG CCGGACCTAT CCTGAGGGAC GGCGGCGCCT TCATGGCCGT GGGCGCGCTG 
CATCTTCCGG GCAAGGAAGG CCTGGTCGAA CTTCTGCGGC AAGAGGGTTT TAAGGTTACG 
CGGGAGGAAT GA

Protein sequence

MITFTRPVRD LAAKATDCLL WLTASFHILM AASLLAALLY VSEARADETD CVGSNILTGL 
ENSDPARLAA LRAEAAAIPN GKGLLWRIED PAAQGQGRAP SFLLGTMHVS DPRVLAMPGG 
AAQAFAKART VIVESDEIID QNRATAAIMM RPDLTMFTGD KTINDFLKPE DLALLEGGLK 
ARGIPLPLVT RMKPWMIASF VALPACEFSR KAAGASFLDK KLAEDAVREG KTLKGLETLV 
EQLAAMDSLP VELHLKALIE TLALGKTIDD VFTTTTDLYL SGETGTIMPM MKLVSAGLSP 
NDAGYAEFEQ RIVVDRNRIM ADRAGPILRD GGAFMAVGAL HLPGKEGLVE LLRQEGFKVT 
REE