Gene YpAngola_A1411 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	YpAngola_A1411
Symbol	galK
ID	5799878
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Yersinia pestis Angola
Kingdom	Bacteria
Replicon accession	NC_010159
Strand	-
Start bp	1466069
End bp	1467220
Gene Length	1152 bp
Protein Length	383 aa
Translation table	11
GC content	51%
IMG OID	641339367
Product	galactokinase
Protein accession	YP_001605931
Protein GI	162421746
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG0153] Galactokinase
TIGRFAM ID	[TIGR00131] galactokinase

Plasmid Coverage information

Num covering plasmid clones	38
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	78
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGTTTAA AACAACATAC CCAGACTATT TTCCGCCAAC AGTTTGACCG CGAGTCTGAC 
ATCACCATTA AAGCGCCGGG CCGCGTCAAT CTGATTGGCG AACATACCGA CTATAACGAT 
GGCTTTGTTC TGCCCTGCGC CATTAATTAT GAAACGGTGA TCAGTTGTGG CAAACGCGAC 
GATCGCCAGA TTCGTGTTAT TGCCGCCGAC TATGAAAACC AGCAGGATAT ATTCTCTCTT 
GATGCACCGA TTGTCCCGCA TCCTGAATAT CGCTGGGCTG ACTACGTGCG TGGTGTGGTG 
AAACATCTAC AAATGCGCAA CGCTGATTTT GGTGGGGCCG ATCTGGTTAT CTGTGGCAAT 
GTCCCGCAGG GTGCTGGCCT CAGTTCCTCT GCATCGTTGG AAGTGGCCGT GGGCCAAGCC 
CTGCAATCAC TCTATCAACT CCCTCTTAGC GGTGTAGAAC TGGCGCTGAA TGGGCAAGAG 
GCAGAAAACC AATTTGTCGG CTGTAACTGC GGCATTATGG ATCAGTTAAT CTCAGCATTG 
GGTAAAAAAG ACCATGCGTT GCTGATTGAT TGTCGGACCT TGGAAACCCG TGCCGTGCCA 
ATGCCGGAAA ACATGGCCGT CGTTATTATC AACTCAAACA TTCAACGTGG CCTGGTTGAC 
AGCGAATACA ATACTCGCCG CCAACAGTGT GAAGCTGCCG CCCGTTTCTT TGGCGTCAAA 
GCATTGCGTG ATGTCGAACC GAGCCTCTTC TTCTCAATAC AAGACGAGCT AGATCCGGTC 
GTCGCTAAAC GCGCCCGCCA TGTGATCAGC GAGAATGCAC GCACGCTGGC AGCCGCAGAT 
GCCTTGGCCG CCGGGAACTT GAAATTGATG GGGCAATTGA TGCAAGAGTC TCATATTTCT 
ATGCGTGATG ACTTTGAGAT CACGGTTCCA CCAATAGATA GACTCGTCGA GATTGTGAAA 
TCAGTGATTG GTGATCAAGG TGGGGTGCGC ATGACGGGTG GCGGTTTTGG CGGTTGTATT 
ATCGCGTTAA TGCCGCTTGA ATTAGTCGAG CAGGTTCGCA CCACCGTTGC GCAAGAATAC 
CCGGCACACA GCGGCGGCAA GAAAGAGACT TTTTATGTCT GTCAGGCTTC ACAAGGAGCG 
GGTTTATGCT GA

Protein sequence

MSLKQHTQTI FRQQFDRESD ITIKAPGRVN LIGEHTDYND GFVLPCAINY ETVISCGKRD 
DRQIRVIAAD YENQQDIFSL DAPIVPHPEY RWADYVRGVV KHLQMRNADF GGADLVICGN 
VPQGAGLSSS ASLEVAVGQA LQSLYQLPLS GVELALNGQE AENQFVGCNC GIMDQLISAL 
GKKDHALLID CRTLETRAVP MPENMAVVII NSNIQRGLVD SEYNTRRQQC EAAARFFGVK 
ALRDVEPSLF FSIQDELDPV VAKRARHVIS ENARTLAAAD ALAAGNLKLM GQLMQESHIS 
MRDDFEITVP PIDRLVEIVK SVIGDQGGVR MTGGGFGGCI IALMPLELVE QVRTTVAQEY 
PAHSGGKKET FYVCQASQGA GLC