Gene Smed_3842 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_3842
Symbol
ID	5318570
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009620
Strand	+
Start bp	299046
End bp	300395
Gene Length	1350 bp
Protein Length	449 aa
Translation table	11
GC content	62%
IMG OID	640775654
Product	xanthine/uracil/vitamin C permease
Protein accession	YP_001312587
Protein GI	150375991
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG2233] Xanthine/uracil permeases
TIGRFAM ID	[TIGR00801] uracil-xanthine permease

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	24
Fosmid unclonability p-value	0.899468
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCGGGA AAAAAATCGA TTCTATCGAC CCGACAGACC AAGCGCTGCC ACCACGCAGC 
CTGATCCTGT TCGGTCTGCA GCATGTGCTG GTAATGGCGG CGTCACCGAT AACCGCCGTG 
TTTCTCGTAA GCAAGGCGCT CGGGTTTTCC GATGCGCTTA CGGTATCGCT GATCAGCGCG 
ACATTTCTGA TCTGTGGTTT GGGGACAATC CTGCAGAGCT TCGGCCCGGC GGGTTTCGGT 
GCGCGACTGC CCTTTATCAT GGTGCCGGGC GGGGCGCCGA TTGCGATCTT TCTCGCTATC 
GCCCAGCAAA CCGACATACA GACGGCAGTC GGCGCGGTGA TCCTCACGGC CGGCTTCTAT 
TTCCTGGCGC TGCCGGTATT CCGGCGGCTG CTGCGCTATT TTCCGCCCAT CGTGGTCGGC 
ACAATGCTCC TGCTCGTGTC GGTGAACCTC GTTCGCATCT ACGGCGGTAC GATCACCGGG 
AAACAGGGGA GCGAGGGTTT TGCCGATCCG ATGAATGTCG GGCTTGCCCT TGCGACGATC 
GCCCTGACGG TGATCTTCGC CAGGATTTTT ACAGGCACGT TTCAGCGGAT TTCGGTGATG 
CTCGGGCTCA TAGCAGGTTC GATGATCGCC TTTGGAGCCG GCTATATGGA CCTCTCCGGC 
ATCTTCGACG GACCGGTCAT TGCCGTGCCC GCGCTTCTTC CGTTCGGGAT GCCGAAGTTC 
GACATCTTTG CCGCCCTCCC GCTCATCGTG TTTTCCATCA TATCGATGGC CGAAGCGACG 
GGCCAGACCA TCGCCACTGC CGAGATCGTC GGGCGTCGCG GCGATGCGCA CGCAATCGTG 
CCAGCGACCA TCCGCGGCGA TGCCGTCGCC TCGCTTGTGG GCGGCCTGTT CGGAACATCG 
CTGATCATCA CCAGCGGCGA AAACGTCGGC ATTGTCCGGG CGACCAACGT GAAGTCGCGT 
TACGTCACCG CAATGGCTGG CGTGATCCTG GTCCTCATTG CCCTGCTTGC GCCGGTCGGT 
CGGCTGGCCA ATGCCCTGCC CGGCCCTGTC GTCGGCGGAA CCGCGGTGAT CGTGTTCTCG 
ATCATCGGCG TCATCGGGAT CGATCTCCTG CGTCGCGTGG ACCTGCGCGA GCATGGCCCG 
ATGTTCACAC TGGCGGCGGC ACTATCCATG GGCCTGCTGC CTATCCTTGT TCCTGGCGTC 
TACAGCCAGT TTCCGCAGTG GAGCCAGATG ATCCTCGCCA ATGGCCTTGC CGCCGGCACG 
ATCACGGCCG TGATCGTCAA CGCTTTCTTC CAACACATGC CCTCCGGCTC GGCTCAAAAG 
GCCGCCGCCG GCGTCGAGGC TGAAATTTAA

Protein sequence

MTGKKIDSID PTDQALPPRS LILFGLQHVL VMAASPITAV FLVSKALGFS DALTVSLISA 
TFLICGLGTI LQSFGPAGFG ARLPFIMVPG GAPIAIFLAI AQQTDIQTAV GAVILTAGFY 
FLALPVFRRL LRYFPPIVVG TMLLLVSVNL VRIYGGTITG KQGSEGFADP MNVGLALATI 
ALTVIFARIF TGTFQRISVM LGLIAGSMIA FGAGYMDLSG IFDGPVIAVP ALLPFGMPKF 
DIFAALPLIV FSIISMAEAT GQTIATAEIV GRRGDAHAIV PATIRGDAVA SLVGGLFGTS 
LIITSGENVG IVRATNVKSR YVTAMAGVIL VLIALLAPVG RLANALPGPV VGGTAVIVFS 
IIGVIGIDLL RRVDLREHGP MFTLAAALSM GLLPILVPGV YSQFPQWSQM ILANGLAAGT 
ITAVIVNAFF QHMPSGSAQK AAAGVEAEI