Gene ECD_00428 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECD_00428
Symbol	gsk
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli BL21(DE3)
Kingdom	Bacteria
Replicon accession	CP001509
Strand	+
Start bp	469171
End bp	470475
Gene Length	1305 bp
Protein Length	434 aa
Translation table	11
GC content	52%
IMG OID
Product	inosine/guanosine kinase
Protein accession	ACT42327
Protein GI	253976657
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAATTTC CCGGTAAACG TAAATCCAAA CATTACTTCC CTGTAAATGC ACGCGATCCG 
CTGCTTCAGC AGTTCCAGCC AGAAAACGAA ACCAGCGCCG CCTGGGTAGT GGGTATCGAT 
CAAACGCTGG TCGATATTGA AGCGAAAGTG GATGACGAAT TCATTGAGCG TTATGGATTA 
AGCGCCGGGC ATTCACTGGT GATTGAGGAT GACGTAGCCG AAGCGCTTTA TCAGGAACTA 
AAACAGAAAA ACCTGATTAC CCATCAGTTT GCGGGTGGCA CTATTGGTAA CACCATGCAC 
AACTACTCGG TGCTCGCGGA CGACCGTTCG GTGCTGCTGG GCGTCATGTG CAGCAATATT 
GAAATTGGCA GCTATGCCTA TCGTTACCTG TGTAACACCT CCAGCCGTAC CGATCTTAAC 
TATCTACAAG GCGTGGATGG TCCGATTGGT CGTTGCTTTA CGCTGATTGG CGAGTCCGGG 
GAACGTACCT TTGCTATCAG CCCTGGCCAC ATGAACCAGC TGCGGGCTGA AAGTATTCCG 
GAAGATGTGA TTGCCGGAGC CTCGGCACTG GTTCTCACCT CTTATCTGGT GCGTTGCAAG 
CCGGGTGAAC CCATGCCGGA AGCAACCATG AAAGCCATTG AGTACGCGAA GAAATATAAC 
GTACCGGTGG TGCTGACGCT GGGAACTAAG TTTGTCATTG CCGAGAATCC GCAGTGGTGG 
CAGCAATTCC TCAAAGACCA CGTCTCTATC CTTGCGATGA ACGAAGATGA AGCCGAAGCG 
TTGACCGGAG AAAGCGATCC GTTGTTGGCA TCTGACAAGG CGCTGGACTG GGTAGATCTG 
GTGCTGTGCA CCGCCGGGCC AATCGGCTTG TATATGGCGG GCTTTACCGA AGACGAAGCG 
AAACGTAAAA CCCAGCATCC GCTGCTGCCG GGCGCTATAG CGGAATTCAA CCAGTATGAG 
TTTAGCCGCG CCATGCGCCA CAAGGATTGC CAGAATCCGC TGCGTGTATA TTCGCACATT 
GCGCCGTACA TGGGCGGGCC GGAAAAAATC ATGAACACTA ATGGAGCGGG GGATGGCGCA 
TTGGCAGCGT TGCTGCATGA CATTACCGCC AACAGCTACC ATCGTAGCAA CGTACCAAAC 
TCCAGCAAAC ATAAATTCAC CTGGTTAACT TATTCATCGT TAGCGCAGGT GTGTAAATAT 
GCTAACCGTG TGAGCTATCA GGTACTGAAC CAGCATTCAC CTCGTTTAAC GCGCGGCTTG 
CCGGAGCGTG AAGACAGCCT GGAAGAGTCT TACTGGGATC GTTAA

Protein sequence

MKFPGKRKSK HYFPVNARDP LLQQFQPENE TSAAWVVGID QTLVDIEAKV DDEFIERYGL 
SAGHSLVIED DVAEALYQEL KQKNLITHQF AGGTIGNTMH NYSVLADDRS VLLGVMCSNI 
EIGSYAYRYL CNTSSRTDLN YLQGVDGPIG RCFTLIGESG ERTFAISPGH MNQLRAESIP 
EDVIAGASAL VLTSYLVRCK PGEPMPEATM KAIEYAKKYN VPVVLTLGTK FVIAENPQWW 
QQFLKDHVSI LAMNEDEAEA LTGESDPLLA SDKALDWVDL VLCTAGPIGL YMAGFTEDEA 
KRKTQHPLLP GAIAEFNQYE FSRAMRHKDC QNPLRVYSHI APYMGGPEKI MNTNGAGDGA 
LAALLHDITA NSYHRSNVPN SSKHKFTWLT YSSLAQVCKY ANRVSYQVLN QHSPRLTRGL 
PEREDSLEES YWDR