Gene Smed_3821 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_3821
Symbol
ID	5318013
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009620
Strand	-
Start bp	275504
End bp	276505
Gene Length	1002 bp
Protein Length	333 aa
Translation table	11
GC content	60%
IMG OID	640775633
Product	periplasmic binding protein/LacI transcriptional regulator
Protein accession	YP_001312566
Protein GI	150375970
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1879] ABC-type sugar transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	34
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCTGTCT ACAAGAAGAT TGCTACCTGC ACGGTCGCTT TGGGTGCGCT TTGCGCTGCC 
CAGATTGCCG TCGCGCAGGA TGCGCCCCCG GTCGTGACGG TCGTCAAGGT GACCGGCGAA 
AACTGGTTCA CGCGCATGGA GGAAGGCGTT GTTGCCTACG GCAAGGACAA TACGGGCGTT 
TCGACGAGCC AGATCGGTCC CGCCAAGGCG GACGCCGCCC AGCAGCTGCG CCTCATAGAA 
GACCTCGTCG CGAAGAATGT CAGCGCCATC GCTGTCGTGC CGATGGACCC CTCTGCTCTC 
GAAGGCGTCT TCAAGCGCGC GATGAACCGC GGCATCAAGA TCGTCACGCA CGAAGCCGAC 
AGCTTGAAGA ATACGCAGGT CGATATCGAA GCCTTCGACA ACAAGGTCTT CGGCGCGCGC 
TTCAACGAGA AACTGGCCGA GTGCATGGGC AAGTCCGGCA AGTGGACGTC ATTCGTCGGG 
TCGCTCGGCA GCCTGACGCA CGTACAATGG GCTGACGGCG GCGCGGAGAA CGCCAAGAAA 
TATCCGGAAA TGGAACTCGT CTCCGAGAAG AACGAGTCCT TCAACGACGC CAACAAGGCC 
TACGAAAAGG CGCGCGAGAT CCTTCGCAAG TATCCTGACA TCAAAGGCTT CCAGGGCGGT 
TCGGCCATTG ACGTCATCGG AATCGGCCGC GCCGTCGAGG AAGCCGGCCT TGTGGGGAAG 
GTTTGCGTCG TCGGCCTCGG GCTGCCGAAG GACACCGCCA AGTACCTCGA ATCCGGTGCG 
GTCCAGAGCA TTTCCTTCTG GGACCCGAAG GATGCGGGTT ATGTGATGAA CAAGGTTGCT 
CAGCTCGTGA TCGAGGGCAA GGAAATCACC GATGGTATGG ATCTCGGAGT CCCGGGCTAC 
AACAAGGTGT CCGTGAAGCA GGGTCCCGGC GAAGGCATCA TCGTCGTCGG CGAAGCCTGG 
GTTGACGTCG ATAAGTCCAA CTACAGCCAG TATCCGTTCT GA

Protein sequence

MSVYKKIATC TVALGALCAA QIAVAQDAPP VVTVVKVTGE NWFTRMEEGV VAYGKDNTGV 
STSQIGPAKA DAAQQLRLIE DLVAKNVSAI AVVPMDPSAL EGVFKRAMNR GIKIVTHEAD 
SLKNTQVDIE AFDNKVFGAR FNEKLAECMG KSGKWTSFVG SLGSLTHVQW ADGGAENAKK 
YPEMELVSEK NESFNDANKA YEKAREILRK YPDIKGFQGG SAIDVIGIGR AVEEAGLVGK 
VCVVGLGLPK DTAKYLESGA VQSISFWDPK DAGYVMNKVA QLVIEGKEIT DGMDLGVPGY 
NKVSVKQGPG EGIIVVGEAW VDVDKSNYSQ YPF