Gene YpAngola_A3017 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	YpAngola_A3017
Symbol	mglB
ID	5801489
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Yersinia pestis Angola
Kingdom	Bacteria
Replicon accession	NC_010159
Strand	+
Start bp	3187072
End bp	3188064
Gene Length	993 bp
Protein Length	330 aa
Translation table	11
GC content	44%
IMG OID	641340855
Product	galactose-binding protein
Protein accession	YP_001607385
Protein GI	162418532
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1879] ABC-type sugar transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	35
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	27
Fosmid unclonability p-value	0.013396
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAATAAGA AGGTTTTCAC ATTAGCAGCT TTGGTTACCA GCATGATGGT TGGCGCATAC 
GCTCAAGCTG AAACCCGTAT TGGCGTTACT ATTTATAAAT ATGATGACAA CTTTATGTCA 
GTGGTCCGCA AAGCTATCGA AAAAGACGCG AAAGCTTCCC CTGAGATCAC TCTGCTGATG 
AATGATTCCC AGAATGACCA ATCCAAGCAA AATGATCAGA TTGACGTATT GCTGGCTAAG 
GGCGTGAAAG CTTTGGCAAT TAACCTGGTT GATCCCGCTG CGGCCCCAGT TGTAATTGAT 
AAAGCACGTT CAAATGATAT TCCGATTGTA TTTTATAACA AAGAACCTTC TCGCAAGGCA 
TTGGATAGCT ACGATAAAGC TTATTACGTC GGGACTGACT CGAAAGAATC TGGGGTTATT 
CAGGGGGAGC TGATCGCTAA ACATTGGCAA GCTAATCCAG AGTGGGATCT GAACAAAGAT 
GGTAAAATTC AGTTTGTGTT GCTGAAAGGT GAACCGGGTC ATCCAGATGC AGAGGCGCGT 
ACTACCTATG TTATTAAGAC CCTGAATGAA AAAGGCTTGC CAACCCAACA ATTGCAGTTA 
GACACCGCCA TGTGGGATAC CGCACAGGCT AAAGATAAGA TGGATGCATG GCTGTCTGGT 
CCTAATGCAA ACAAAATTGA AGTAGTTATT GCCAACAATG ATGCGATGGC AATGGGTGCA 
GTAGAAGCAC TGAAAGCACA CAATAAAACC AGCGTTCCAG TCTTTGGTGT CGATGCCTTA 
CCAGAAGCGT TAGCGCTGGT TAAATCAGGC CAAATGGCGG GTACAGTGCT GAATGATGCC 
AATAATCAGG CGAAAGCGAC CTTTGACTTG GCTAAAAATC TGGCGGCTGG CAAACCTGCA 
GCAGAAGGGA CAACGTGGAA AATTGAAAAC AAAATCGTAC GTATTCCATA CGTAGGTGTT 
GATAAAGATA ATCTGGCTGA ATTCACTAAA TAA

Protein sequence

MNKKVFTLAA LVTSMMVGAY AQAETRIGVT IYKYDDNFMS VVRKAIEKDA KASPEITLLM 
NDSQNDQSKQ NDQIDVLLAK GVKALAINLV DPAAAPVVID KARSNDIPIV FYNKEPSRKA 
LDSYDKAYYV GTDSKESGVI QGELIAKHWQ ANPEWDLNKD GKIQFVLLKG EPGHPDAEAR 
TTYVIKTLNE KGLPTQQLQL DTAMWDTAQA KDKMDAWLSG PNANKIEVVI ANNDAMAMGA 
VEALKAHNKT SVPVFGVDAL PEALALVKSG QMAGTVLNDA NNQAKATFDL AKNLAAGKPA 
AEGTTWKIEN KIVRIPYVGV DKDNLAEFTK