Gene Smed_4215 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_4215
Symbol
ID	5319225
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009620
Strand	+
Start bp	698195
End bp	699187
Gene Length	993 bp
Protein Length	330 aa
Translation table	11
GC content	63%
IMG OID	640776020
Product	NMT1/THI5-like domain-containing protein
Protein accession	YP_001312953
Protein GI	150376357
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0715] ABC-type nitrate/sulfonate/bicarbonate transport systems, periplasmic components
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	31
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGATCT CCATTCGCGC CTTCGCATTG GGCAGCCTGG TCGCAATCGG CTTCTCCAGC 
CTTGCGGCAG CGGAAGCTCA AGAACCGGTG ACGCTTCGGT TTCTCGCGAG CCAGGGCAGC 
TTATCGCCGC ACGAACTCGC CTATGAACTC GGCTATTTCG ATGGCCTCGG AATCAAGCTC 
GAGAATGTCG GTTATGCGGG AGGCGGACCG GCGTCCCTGT TCGCGCTTGC TTCCGGCAGC 
GTCGACATCG GCTCGGCGGC GACGGCAGCC GTGATCAACT CGATTGCCGG CGGCAACGAT 
TTCGTCGCGG CCTTTCCGAC CAATGGCATC AACGAGCAGG TCAAGAGCAT CTTCTACGTG 
CTCGAGGACA GCCCTATCAG GACGATCGAG GATATCGCGG GTAAGACGAT CGCCGTGAAT 
ACGCTTGGGG CCCATCTCGA CTACGCGATA CGCGAGGCGC TGCATAGCAA CGGCCTGCCC 
GAAAACGCAG CCAATCTCGT CGTCGTGCCC GGACCTCAGC TCGAACAGAC GCTCCGGTCG 
AACCAGGTGG ACATCTCCGC CGTCGGATAC TGGCAGGCGA CGTTCAATGG GCAGCTCGTC 
GCCAATGGCG GAGTACGCGC GGTCTTCGAC GACACGGATG TGCTCGGCGA GATTGCCGGA 
GGTTTCGCGG TTCTGCGCCG CGATTTCGTG GAAAAGAATC CGGACGCAGC CAGGCGCTTC 
GTAGAGCAGT CCGCGCGCGC CGCCGACTGG TCGCGTGAGC ATCCGGACGA AGCACGTGCC 
TTGCTTGCCC GCATTCTGAC CGAGCGCGGC GAGAACGGCG ATCTCGCGAA GCATTGGACC 
GGATTCGGCC TGCGGAAAGG CGCGAAAGCG ACCGAGCGGG ATCTGGATTT CTGGATCGGC 
GTCCTCGAAC GCGAGGGCAG CCTGCCCCGA GGCAAATACA AGGCTTCCGA TCTTTTGTTC 
CGGCCGGACG CCAAGTCCGC CGCGTCGAAT TGA

Protein sequence

MTISIRAFAL GSLVAIGFSS LAAAEAQEPV TLRFLASQGS LSPHELAYEL GYFDGLGIKL 
ENVGYAGGGP ASLFALASGS VDIGSAATAA VINSIAGGND FVAAFPTNGI NEQVKSIFYV 
LEDSPIRTIE DIAGKTIAVN TLGAHLDYAI REALHSNGLP ENAANLVVVP GPQLEQTLRS 
NQVDISAVGY WQATFNGQLV ANGGVRAVFD DTDVLGEIAG GFAVLRRDFV EKNPDAARRF 
VEQSARAADW SREHPDEARA LLARILTERG ENGDLAKHWT GFGLRKGAKA TERDLDFWIG 
VLEREGSLPR GKYKASDLLF RPDAKSAASN