Gene GM21_4110 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GM21_4110
Symbol
ID	8139484
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sp. M21
Kingdom	Bacteria
Replicon accession	NC_012918
Strand	+
Start bp	4693579
End bp	4694649
Gene Length	1071 bp
Protein Length	356 aa
Translation table	11
GC content	69%
IMG OID	644871725
Product	galactokinase
Protein accession	YP_003023883
Protein GI	253702694
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG0153] Galactokinase
TIGRFAM ID	[TIGR00131] galactokinase

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	98
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCCGCTA CCGAGTTTGA GAAGACCTTC GAGGCCCCCT GCGAAGCGAC CGCCCGCGCA 
CCCGGCCGGG TCAACCTCCT GGGGGAGCAT ACCGACTACA ACGACGGCTT CGTCCTCCCC 
ATCGCGGTCC CGCTGGAGAC CACGGTGGAG CTGGCCAAAA GCCGCGACGG CCGGAACCAC 
TACTATGCGG AGGAGCTGCA GGAAAGGGCG TGGTCGGAGA CGGGAGGCGC GGTCCCCAGC 
GGCTTCGCCG CCTACCTGCA CGGCTGCCTC GCGCTTTTGC GCCTCTCCGG GCACCACGTG 
GACCCGGTTT CGGTGCGGGT CACCTCCCAG GTGCCCATGG GGAGCGGACT CTCCTCCAGC 
GCCGCGCTCG AGGTCGCCTT CCTGCGCGGG ATGCGGGAGC TGTTCCGCCT CGACCTGGAC 
GACGTCGAGA TCGCGCTCAT GGCCCAGCAG GCCGAGATCC GCTACGCCGG GGTCAACTGC 
GGCATCATGG ACCAGATGGC CGCGAGCCTC GCCGATTCCA CCCACATGCT CTTCATCGAC 
ACCCGGTCGC TGGAGCGAAA GCTCCTCCCG CTCCCCCCGC GCTCGGAGCT CCTGGTGATC 
GACTGCGGGG TCCCGCGAAA GCTCGGCGAG AGCATGTACA ACCTGCGCCG CCAGGAGTGC 
GAGGAGGCTG CGGAGCTTCT GGGGGTGGGT TCGCTGCGGG ACCTCTCGGA CCTGAACCAA 
CTGATCAAGC TGCCGCGCAA CCTGGCGCGG CGCGCCCGGC ACGTGCTGAC CGAGAACGAG 
CGGGTGTTGG AGGCGGTCAA GGGGGTGCAC GGCTGCCGCT TCGGGGAGTT GATGAACGCC 
TCGCACAAGA GCCTCAGGGA CGACTTCCAG GTCTCCATAC CCGAACTGGA CCTTTTGGCC 
AGGCTGCTGC AGGAACAGGT CGACGTGTAC GGAGCGCGGC TCACCGGGGC CGGCTTCGGA 
GGGGCCTGCG TGGCGCTGGT GCGCGAGGGG AAGGCGGCGG AGGTAGCGTC GAACGTCCTG 
GCGCTCTACC GCGAGCAAGG GGAGCAGGGG AAGCTATTGG TGCCGCAGTA G

Protein sequence

MPATEFEKTF EAPCEATARA PGRVNLLGEH TDYNDGFVLP IAVPLETTVE LAKSRDGRNH 
YYAEELQERA WSETGGAVPS GFAAYLHGCL ALLRLSGHHV DPVSVRVTSQ VPMGSGLSSS 
AALEVAFLRG MRELFRLDLD DVEIALMAQQ AEIRYAGVNC GIMDQMAASL ADSTHMLFID 
TRSLERKLLP LPPRSELLVI DCGVPRKLGE SMYNLRRQEC EEAAELLGVG SLRDLSDLNQ 
LIKLPRNLAR RARHVLTENE RVLEAVKGVH GCRFGELMNA SHKSLRDDFQ VSIPELDLLA 
RLLQEQVDVY GARLTGAGFG GACVALVREG KAAEVASNVL ALYREQGEQG KLLVPQ