Gene Shewmr4_3408 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Shewmr4_3408
Symbol
ID	4253974
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shewanella sp. MR-4
Kingdom	Bacteria
Replicon accession	NC_008321
Strand	+
Start bp	4069966
End bp	4071111
Gene Length	1146 bp
Protein Length	381 aa
Translation table	11
GC content	53%
IMG OID	638120046
Product	galactokinase
Protein accession	YP_735531
Protein GI	113971738
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG0153] Galactokinase
TIGRFAM ID	[TIGR00131] galactokinase

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	0.0618615
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCGAACC CTGCGCAGCG CGCCACTAAG TTATTTGTCC AAACCTTTGG CACTAAAGCC 
GATGATTTAT ACCAAGCCCC AGGTCGGGTT AATTTGATCG GTGAATATAC GGATTACAAC 
GACGGCTTCG TATTGCCCGC CGCCATTAAT TTTCATACTG TGATTGCGGT TAAACGCCGA 
GACGACAATA AGTTTCGCGC CGTTGCCGAC GCCTTTCCGG GGCAAATCAA GGAATGGAGC 
TTCGGTAAAG ACACCGAAAT CAATCCTGAG GATGGTTGGG TTAATTATCT CAAAGGCTTG 
ACCGTGGCCA TGGCCAACAC TGGGCTTATC GCCAAAGGGT TAGACTTAGC GGTTGTCGGC 
GATGTGCCAT TAGCCGCGGG TCTGTCTTCC TCCGGCGCCT TAGTCGTCGC CTTTGGCACC 
GCCATTAGCG ACAGCAGCCA ACTGCATTTA TCTCCTATGG CGGTTGCACA ACTCGCTCAG 
CGCGGTGAAT ATCGATATGT CTCATCGGCT TGCAGCATTA TGGACCATAT GATCTGCGCC 
ATGGGCGAAC CGGATCATGC CTTGCTCATC GATTGTCTGG ATCTGGATAG CGAGCCTATT 
GCGATCCCTG AAAATCTCAG CCTTATCATT ATCGATGCCC ATATCGAAAA ACAACGTCTG 
GCGGCAACGA ATCAACAGCG CCGTGAAGAA TGCGCACAGG CTGCCGAGCA TTTTGGTCTC 
GATGCCCTGC GCCACCTCGA CCTGCGCCAG CTCGAAAGTG CTAAAGATCA ATTGGATGAC 
ACCCTGTATC GCCGCGCCAA ACACGTAGTC ACCGAAAACA AACGCACTCA GAGTGCCGCT 
CGGGCGCTAG AGCAAAATAA TCTATCTAAA TTCAGTTTGT TAATGGCACA GTCCCATCAA 
TCTCTGCGGG ATGATTTTGA GGTGACACTG CCCGAATTTG ACACTTTGGT GGACATAGTC 
GGCCAAGTGA TTGGAGAGCG TGGCGGCATT CGCATGACCG ACGGTTGTGT CGTCGCCTTA 
GTGGATCACG AACTCACCGA TGCCGTGGTC TCGGCGGTCG AGCATGCATT TTATGAACAG 
ACCGGAATCG ATGCCACTGT GTATCTCTGC TCCGCGAGTG CTGGCGCGGG GCGCATCGAC 
ATCTAG

Protein sequence

MSNPAQRATK LFVQTFGTKA DDLYQAPGRV NLIGEYTDYN DGFVLPAAIN FHTVIAVKRR 
DDNKFRAVAD AFPGQIKEWS FGKDTEINPE DGWVNYLKGL TVAMANTGLI AKGLDLAVVG 
DVPLAAGLSS SGALVVAFGT AISDSSQLHL SPMAVAQLAQ RGEYRYVSSA CSIMDHMICA 
MGEPDHALLI DCLDLDSEPI AIPENLSLII IDAHIEKQRL AATNQQRREE CAQAAEHFGL 
DALRHLDLRQ LESAKDQLDD TLYRRAKHVV TENKRTQSAA RALEQNNLSK FSLLMAQSHQ 
SLRDDFEVTL PEFDTLVDIV GQVIGERGGI RMTDGCVVAL VDHELTDAVV SAVEHAFYEQ 
TGIDATVYLC SASAGAGRID I