Gene Smed_5985 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_5985
Symbol
ID	5320287
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009621
Strand	+
Start bp	941255
End bp	942697
Gene Length	1443 bp
Protein Length	480 aa
Translation table	11
GC content	59%
IMG OID	640777661
Product	glucan 1,4-alpha-glucosidase
Protein accession	YP_001314593
Protein GI	150377998
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG3387] Glucoamylase and related glycosyl hydrolases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	0.377487
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACAGTTG CATTTCGCAG TAAGCCAGTG ACAGTTGAGG ACCCGGCATA TAGAGGTCTG 
GCTATCGGCA CTTATGCGCC TGCAGTCACA CCGGCGCCTG CCTTCGCGCA GACCGACCTG 
GCTGCATTGT CGCGCTACTA TTCTCTTCTG ATGATGCGCA ACATCACCAG CGACGGCTAC 
GTCATCGAGG ATCCAGCATC GCCCGGCGTC TTTTCGGTAC CGGGCTGTGT CATCGCCGCG 
CCTTCCTATC CAGCGAACAC GCCGGGTGTC GACCAGGACT ATGTTTTCAA CTGGGTCCGC 
GACGGAGCTA TGACGGCCAT CGAGATCGCG CTTGCCGACT TGCCGCGCGT TTCGGGCGGG 
GGTGTGCCGA GCCTGATCGA CTACGTGAAC TTCGCCGCGC TGTGTCAGGC GAATGCGAAG 
AATTCCGCGA CCGCCACACT TGGCCATGCC TGCTTCACCA TCACCGGCAA GGTTCGTCCG 
TGGTCGGAGC AAAATGACGG GCCGGCCATT CAGTCGATCG CCATACTGAC CTTGTTCGGT 
CAGTTGGATG GCGCCACGCA GAAAATCGCT AAACGACTGG TTGAGACTAA CCTCTCTTAT 
CTTCTCGAAG TTTACCAGAA CAAGACCACA AATCTCTGGG AGGAGTATGA GGGCTATTCC 
TTTTTCGCAA GAGCCGTACA GCTGCGCTTT TTCCGGGAGA TTTCCAGAAA CACGATCGCT 
ATTGCCGTGC CTGCCGGGGT GGCCGATGCC ATCTCCTGGC TGCAAACCCA GCTGGCCAAC 
CACTGGAATG GGCAGCTCTA TGTGAGCGTT CTGGATGTCG CGGCGCAAGC CGGTTATGAC 
GCGAACATCG ATATCGTCTC TTCGGTCTGC TATGGCGGGA TCCATCCGGC TGACACCAAG 
CTTCTGGCAA CGGCGGCAAT CCTGCGGCGC CAGTGGGCTG ATATTTCGTC TTCGAGCTAT 
TTCCCAATCA ATGGCGCCGA CGCGGCCAAA GGGCTCGGAC CCGCCTTCGG GCGCTATCCG 
GGCGACCATT ACGATGGCGA TGTGGCGGCT CCGGTGGTCG GCGGGCATCC CTGGGCTCTG 
TGCACCGCCA ACTTCGCCGA GTTTCAATAT CGGCTTGCCA ATGCCATAGA CGCCAGCGGC 
GCCATTCCTC TCGATCAGTT CTCCGAACCC TTCTTCGCTG AATTGGGGCT TGGCGCATCC 
AGCAGCGCCG CCGACGCGTC AACTGCCTTA CGCGCTTCGT CTGACGCCAT GCTGCGCGCC 
ATCGTCTACC ACAGCGATCA CTACGAACTG AGCGAGCAGT TCGATGGAAC CACTGGCTAT 
GAGAAAAGCG TCCGGAACCT GACCTGGAGC TACGCCTCTT TTCTCTCGGC AGTCAGAGCC 
CGCTCCGGCG GTATCCCAGC CGGTAAGAAC AAACCCCGAA ACTCCCGCAG CCGAAGTTCG 
TGA

Protein sequence

MTVAFRSKPV TVEDPAYRGL AIGTYAPAVT PAPAFAQTDL AALSRYYSLL MMRNITSDGY 
VIEDPASPGV FSVPGCVIAA PSYPANTPGV DQDYVFNWVR DGAMTAIEIA LADLPRVSGG 
GVPSLIDYVN FAALCQANAK NSATATLGHA CFTITGKVRP WSEQNDGPAI QSIAILTLFG 
QLDGATQKIA KRLVETNLSY LLEVYQNKTT NLWEEYEGYS FFARAVQLRF FREISRNTIA 
IAVPAGVADA ISWLQTQLAN HWNGQLYVSV LDVAAQAGYD ANIDIVSSVC YGGIHPADTK 
LLATAAILRR QWADISSSSY FPINGADAAK GLGPAFGRYP GDHYDGDVAA PVVGGHPWAL 
CTANFAEFQY RLANAIDASG AIPLDQFSEP FFAELGLGAS SSAADASTAL RASSDAMLRA 
IVYHSDHYEL SEQFDGTTGY EKSVRNLTWS YASFLSAVRA RSGGIPAGKN KPRNSRSRSS