Gene Smed_4139 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_4139
Symbol
ID	5319281
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009620
Strand	+
Start bp	609032
End bp	610504
Gene Length	1473 bp
Protein Length	490 aa
Translation table	11
GC content	61%
IMG OID	640775944
Product	glycoside hydrolase family protein
Protein accession	YP_001312877
Protein GI	150376281
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1486] Alpha-galactosidases/6-phospho-beta-glucosidases, family 4 of glycosyl hydrolases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	24
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCAAGCT TCAAGATCGC CATTATCGGC GCCGGCAGCA TCGGCTTCAC CAAGAAGCTC 
TTCACGGACA TTCTTTCCGT GCCGGAGCTT CGCGACGTCG AGTTTGCCCT GACGGATCTG 
AGCGAGCACA ACCTCGCGAT GATCAAGTCT ATCCTCGACC GGATTGTGGA GGCCAACAAA 
CTCCCCACCC GGGTGACGGC AACCACCGAC CGCCGCAGGG CACTTGAGGG CGCGCGCTAT 
ATCATCAGCT GCGTGCGTGT CGGCGGCCTC GAAGCCTATG CCGACGATAT CCGGATACCG 
TTGAAATATG GCGTCGATCA ATGCGTCGGC GACACGATCT GTGCTGGCGG CATTCTTTAT 
GGCCAGCGCA ACATTCCGGT GATCCTCGAT TTCTGCAAGG ACATCCGCGA GGTGGCAGAG 
CCCGGCGCGA AGTTCCTGAA CTATGCCAAT CCGATGGCGA TGAACAGCTG GGCGGCGATC 
GAATACGGCA AGGTCGACAC GGTCGGGCTC TGCCATGGCG TCCAGCACGG AGCCGAGCAG 
ATCGCGGAGA TTCTCGGCGC CGGGGAGGGT GAGCTCGACT ACATCTGCTC CGGCATCAAC 
CACCAGACCT GGTTCGTGGA TATTCGCCTT GGCGGCCGCA AAATCGGCAA GGACGAACTC 
GTCGCCGCCT TCGAAGCGCA TCCGATTTTC TCGCAGCAGG AGAAGCTCCG CATCGACGTG 
TTGAAGCGTT TCGGCGTCTA TTCAACCGAA AGCAACGGCC ATCTTTCGGA ATACCTCCCC 
TGGTACCGCA AGCGTCCCGA CGAGATTTCG AGATGGATCG ACATGTCGGA TTGGATCCAC 
GGCGAGACCG GCGGATATCT CCGCTATTCG ACCGAGACCC GCAACTGGTT CGAAACGGAA 
TACCCGCGCT TCCTCGAAGA GGCGAGCCGG CCGCTGGAGA CGATCAAGCG CTCGAACGAA 
CATGCAAGCC GCATTCTGGA AGCACTCGAG ACGGGACGCG TCTATCGCGG CCACTTCAAT 
GTCAAGAACA ACGGCGTAAT CACCAACCTC CCGGCGGATG CGATAATCGA GTCTCCGGGC 
TTCGTCGACC GCTTCGGCAT CAATATGGTG GCGGGCATCA CCTTGCCGGA GGCCTGCGCG 
GCCACCTGCA TTGCCTCGAT CAACGTCCAG CGCATGTCGG TTCATGCGGC AATCACGGGC 
GACATCGATC TCCTGAAGCT CGCCGTTCTG CACGACCCGC TGGTCGGCGC TATCTGCACG 
CCGGAGGAGG TCTGGCAAAT GGTGGATGAA ATGGTCGTCG CCCAGGCCGA ATGGCTGCCG 
CAATATGCCC ATGCGATCGA CGCGGCCAAG GAAAGGCTCG CCCGCGCCAC CGTCGCTACG 
CGGGAGTGGA AGGGTGCAGC GCGCCGCGAG GTGCGCTCGA TCGAGGAAAT CCGCGCGGAA 
AAGGAAGCGG CGAAGCTGCG TGCCGCCGGG TAG

Protein sequence

MASFKIAIIG AGSIGFTKKL FTDILSVPEL RDVEFALTDL SEHNLAMIKS ILDRIVEANK 
LPTRVTATTD RRRALEGARY IISCVRVGGL EAYADDIRIP LKYGVDQCVG DTICAGGILY 
GQRNIPVILD FCKDIREVAE PGAKFLNYAN PMAMNSWAAI EYGKVDTVGL CHGVQHGAEQ 
IAEILGAGEG ELDYICSGIN HQTWFVDIRL GGRKIGKDEL VAAFEAHPIF SQQEKLRIDV 
LKRFGVYSTE SNGHLSEYLP WYRKRPDEIS RWIDMSDWIH GETGGYLRYS TETRNWFETE 
YPRFLEEASR PLETIKRSNE HASRILEALE TGRVYRGHFN VKNNGVITNL PADAIIESPG 
FVDRFGINMV AGITLPEACA ATCIASINVQ RMSVHAAITG DIDLLKLAVL HDPLVGAICT 
PEEVWQMVDE MVVAQAEWLP QYAHAIDAAK ERLARATVAT REWKGAARRE VRSIEEIRAE 
KEAAKLRAAG