Gene GM21_1711 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GM21_1711
Symbol
ID	8137042
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sp. M21
Kingdom	Bacteria
Replicon accession	NC_012918
Strand	+
Start bp	1992875
End bp	1993888
Gene Length	1014 bp
Protein Length	337 aa
Translation table	11
GC content	64%
IMG OID	644869323
Product	glycosyl transferase family 2
Protein accession	YP_003021523
Protein GI	253700334
COG category	[R] General function prediction only
COG ID	[COG1216] Predicted glycosyltransferases
TIGRFAM ID	[TIGR00034] phospho-2-dehydro-3-deoxyheptonate aldolase

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	5
Fosmid unclonability p-value	2.9788799999999997e-27
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGACCGACG CCATCATAGA CGTCATCATA CCCATTTGGA ACAGGCCCGA CGAGACCCGG 
AACTGCCTGG TCACCCTGAT CAAACACACA CCCGGCGCCC GATTCATCAT GGTGGACTGC 
GGGTCCGAGC GGGATACCGA GAGGCTCCTG CAGGAACTCG CCGACAGCCT GGACGACCGC 
GCGTTGTTGA TGCGCGATGA CAGCAACATC GGTTTCGTGC CTGCTGCGAA CCGCGGTTTC 
GAAAGCTCCG AGGCGCCGTA CCTTGCTTTG GTGCGCAACA CCAGCCTGGT GAGCCCCAAT 
TGGCTGGAGC CGCTGCTCGC CTATGCCCAA GAGCATCCGG AGGCGGGGAT TCTCCTTCCC 
TGTCTCGATC CGGGCGAGGA GTGCAGCGTT ACGACCGAAC TCGAACGGGG CTCTTTCGCC 
GCCATGGTGA TCGCCAGGGA ACTCTATCGC CGGATCGGAG GTCTCGACGA GGGGATGGAC 
GGCGGCGTGT GGTGCCTCAA GGACTACACC CGGCGCGCCA ACGCCCAGGG GTTCATCACC 
GTGCAGGTGC CCACCCCGGT GGTGCGCCAC CAGGAAGAAG TCCGGCTCGG TTCCGAGCAA 
AGGCGGCGCG AAACGCAGCA GCGGAGCATC GCGCTTTTCA GGGAACGTTG GGGCGTGGGA 
GGGAGCTACA TCCTTCATGT ACCCAAGGGG ATCGAAGTCG AGCTGCTGGG CGAAAAACTG 
CAGTGGCTGG TAAAAGGGGC GCGGCACGAC GACAGCTTTA CCGTGCTGCT GCCGGCCTCC 
TTGAACCAGG CCGCCCAGCA GGCGGGACTC GGGCGCCTGC ACGAGCACGT CACCCTGGTA 
CCGCTCCCAA GGCTCGCCTG GGACGGCATG AAGAAGCGCC TCTTCGACAA GATCGTGTCC 
CAGAAACCGG GGACCACCCC GGTCACAGCG GTGGATGGAA TACCCTTCCC CTGGAGCGAG 
CGGTACCTGT CCTTCTCCGA GCTTTGCGAG AGGATCAAGG CCCGCTACCA GTAG

Protein sequence

MTDAIIDVII PIWNRPDETR NCLVTLIKHT PGARFIMVDC GSERDTERLL QELADSLDDR 
ALLMRDDSNI GFVPAANRGF ESSEAPYLAL VRNTSLVSPN WLEPLLAYAQ EHPEAGILLP 
CLDPGEECSV TTELERGSFA AMVIARELYR RIGGLDEGMD GGVWCLKDYT RRANAQGFIT 
VQVPTPVVRH QEEVRLGSEQ RRRETQQRSI ALFRERWGVG GSYILHVPKG IEVELLGEKL 
QWLVKGARHD DSFTVLLPAS LNQAAQQAGL GRLHEHVTLV PLPRLAWDGM KKRLFDKIVS 
QKPGTTPVTA VDGIPFPWSE RYLSFSELCE RIKARYQ