Gene Gmet_1883 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Gmet_1883
Symbol
ID	3739159
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter metallireducens GS-15
Kingdom	Bacteria
Replicon accession	NC_007517
Strand	-
Start bp	2097946
End bp	2099490
Gene Length	1545 bp
Protein Length	514 aa
Translation table	11
GC content	60%
IMG OID	637779174
Product	hypothetical protein
Protein accession	YP_384837
Protein GI	78223090
COG category	[G] Carbohydrate transport and metabolism [S] Function unknown
COG ID	[COG0062] Uncharacterized conserved protein [COG0063] Predicted sugar kinase
TIGRFAM ID	[TIGR00196] yjeF C-terminal region, hydroxyethylthiazole kinase-related [TIGR00197] yjeF N-terminal region

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.00817146
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	0.000000287535
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGAAGGTTG TTACCGGCGA AACCATGCAG CGGATGGACC GTCGCTCCAT CGAGGAATTC 
GGCATACCGG GCATTGACCT CATGGAAAAT GCCGGCCAGG GGTGCGCTGC GGCCATTATT 
GAACGATTCG GACCGGCTGC GGGACGGATG GTGCTCGTTG TTGCCGGCAA GGGGAACAAC 
GGTGGCGACG GATATGTAAT TGCCAGGCTT CTGCAGCAGG AAGGGTGGGA AGTTCAGACC 
GTCGTCCTTG CCCTGCGCGA AGAGATTGCC GGTGATGCCA AGGTTAACCT GGATCGCCTT 
GATCCAGAAA CCGTCATGTT TTCGCCTCCT CCGGCAGGGC TCGCTCCTTT TGCCCCCCAC 
CTGGAACGGG CATCGGTGAT CGTAGACGCC CTCTTCGGCA CGGGTCTCAA GAGTGAGGTT 
CAGGGTAGCT TTGCCGAGGC GATTAACCTT CTGAACGCTG CGGGAAAACC GGTCGTGGCC 
GTTGATATTC CCTCGGGGAT AGACGCAGGG ACCGGTCGGA CTCTCGGCGT CGCGGTCAAG 
GCTGATGTAA CCGTTACCTT TGCCCTTGCC AAGCTTGGCC ATGTCCTTTA TCCCGGTGCC 
GAGCTCTGTG GCGATCTCCG TGTAGTTGAT ATCGGCATCC CTCTTCAGGT TGCCGCTGAT 
GCCGAAGGGT ACGATTTTGT CGACCATGGG ACGGCTTGTC GTCTGGTTCG TCCTCGGGAT 
CGTCGCGCCC ATAAGGGGAG CTTCGGCCAT TGTCTTGTTG TTGCCGGCTC CACCGGCAAA 
ACCGGTGCCG CTGCCATGGC TGCAAACAGT GCGGTTCGTG CCGGCTCGGG ACTGGTGACT 
TTGGCGGTTC CCGAACGCCT CAACGCCATT CTGGAAATGA AAACCACCGA GGCCATGACC 
CTGCCACTTC CCGATGGCGG TGCCGGACGC TTGGTGCAGG ATTCTGCGCC GGCACTGCTC 
GAAGCCATTG GCGGCAAATC AGCCGTCGCG TTGGGGCCGG GCATCTCGTG GCATTTAGAC 
ACTGCACGCC TTATCCGCCA TCTCGTCACC AAGATCGAGA CCCCTCTTGT GATAGATGCC 
GATGGTCTGA ACGCCCTGTC CGAAGACCCC GCCATCTTGC AGCGAAAACG GAGCAACTGC 
ATCGTCCTTA CCCCGCATCC GGGCGAAATG GCCCGTCTTA CCGGCACCTC CACCGCGATT 
ATCGAGGCAG ACCGGATTGC TGCGGCGCGT GAGTTTGCAG AACAGAATGG CGTGTATATG 
ATACTGAAAG GTGCCCGTAC GGTCATTGCT GCGCCGGACG GACGGGTCGC CATCAACGGG 
AGCGGTAACC CTGGTATGGC GTCGGGGGGG ATGGGTGACG TCCTTACCGG CATCCTGGCA 
TCTCTCTTGG GGCAGGGATA CGAACCCTTT GACGCCTGCC GGCTCGGCGT GTTCATTCAT 
GGTCACGCCG CAGATTTGGT GGCAGCCGAC AAGGGAGAAA TCGGCATGTC GGCCGTCGAC 
GTTCAGGAAA GACTCCCCTG GGCATTCAAA ACGCTAACCC TATAA

Protein sequence

MKVVTGETMQ RMDRRSIEEF GIPGIDLMEN AGQGCAAAII ERFGPAAGRM VLVVAGKGNN 
GGDGYVIARL LQQEGWEVQT VVLALREEIA GDAKVNLDRL DPETVMFSPP PAGLAPFAPH 
LERASVIVDA LFGTGLKSEV QGSFAEAINL LNAAGKPVVA VDIPSGIDAG TGRTLGVAVK 
ADVTVTFALA KLGHVLYPGA ELCGDLRVVD IGIPLQVAAD AEGYDFVDHG TACRLVRPRD 
RRAHKGSFGH CLVVAGSTGK TGAAAMAANS AVRAGSGLVT LAVPERLNAI LEMKTTEAMT 
LPLPDGGAGR LVQDSAPALL EAIGGKSAVA LGPGISWHLD TARLIRHLVT KIETPLVIDA 
DGLNALSEDP AILQRKRSNC IVLTPHPGEM ARLTGTSTAI IEADRIAAAR EFAEQNGVYM 
ILKGARTVIA APDGRVAING SGNPGMASGG MGDVLTGILA SLLGQGYEPF DACRLGVFIH 
GHAADLVAAD KGEIGMSAVD VQERLPWAFK TLTL