Gene Smed_4275 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_4275
Symbol
ID	5319037
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009620
Strand	-
Start bp	764210
End bp	765205
Gene Length	996 bp
Protein Length	331 aa
Translation table	11
GC content	63%
IMG OID	640776080
Product	hypothetical protein
Protein accession	YP_001313013
Protein GI	150376417
COG category	[E] Amino acid transport and metabolism [G] Carbohydrate transport and metabolism [R] General function prediction only
COG ID	[COG0697] Permeases of the drug/metabolite transporter (DMT) superfamily
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.122751
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	37
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGATTGCT CTGCCCGAAT ATGCGAATGG CTGGCCGAGA ACGTTCCCGC GGAGACGCGG 
TCCCGCTTTG AAGGAATCGA ACCGATGGCC GTCGACAGTG TCCCCGGCAA ACTTTCGCAT 
GAAAATGGAA CCGCCCGCGC CGGCGTGATC GTCATGCTCC TCGGCATGCT CATGTTTTCG 
GTAAACGACG TCATGGGAAA GTGGCTGGTA GCCACCTACT CGGTCGGTCA GGTGGTGCTG 
ATCCGCAGCA TCGCAGCGGT CCTCCTGCTC GCGCCGTTTC TATGGGTGAG CGGCCCGAAA 
AAGCTCTTCA CCCTGGAGCG GCCCGGCCTT CAGCTTGCCC GCGTGGTCGC CTCGACCGCG 
GAAGTGATCG CCTTCTATTT CGCCGTCGTC TACCTGCCGC TCGCAGATGT CATGACCTAT 
TGGCTGGCTG CGCCGATCTA TGTCGCGGCC ATTTCGCCGC TGGTCCTCAA GGAACCGGTC 
GGCTGGCGGC GCTGGACAGC GATCGCCATA GGCTTCGTCG GCGTCGTCGT CGCACTCGAA 
CCGTCGTCGC AGGCTTTCAC ACTGCCGGCC GTCATTTCGA TCCTTGGCAG CATGGCCTTC 
GCCTTCATGA TGATTTCCGG GCGGTCGCTG CGCGGCACTC CTGATACGAC CCTCGCCTTT 
TGGCAGATTG CCGGCGCCGC GGTGGCCGGC CTCGTATGGG CGCCCTTCGA CTGGACACCC 
CTCAAGCCGC TCGACACGGC GCTGCTCTGT CTCCTTGGCG TCGTCGCAAT GGTCGCCCAC 
GTGCTTGTCA ACCGGGCGCT GAAGCTCGCC GACGCCGCGA CGGTAGCCCC GCTGCAATAC 
ACGCTCCTTT TCTGGGCAAT CTTCTTCGGA TGGCTGATCT TCGGCGATAC GCCGCGGCTT 
TCGATGGTAC TCGGCGCCGG CCTTATCGTC GCCTCGGGCC TCTTCATCTT TTTCCGCGAA 
CAGCAGCTGA AGAGGCAGGG GCGGCTGAAA GGCTGA

Protein sequence

MDCSARICEW LAENVPAETR SRFEGIEPMA VDSVPGKLSH ENGTARAGVI VMLLGMLMFS 
VNDVMGKWLV ATYSVGQVVL IRSIAAVLLL APFLWVSGPK KLFTLERPGL QLARVVASTA 
EVIAFYFAVV YLPLADVMTY WLAAPIYVAA ISPLVLKEPV GWRRWTAIAI GFVGVVVALE 
PSSQAFTLPA VISILGSMAF AFMMISGRSL RGTPDTTLAF WQIAGAAVAG LVWAPFDWTP 
LKPLDTALLC LLGVVAMVAH VLVNRALKLA DAATVAPLQY TLLFWAIFFG WLIFGDTPRL 
SMVLGAGLIV ASGLFIFFRE QQLKRQGRLK G