Gene GM21_3501 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GM21_3501
Symbol
ID	8138873
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sp. M21
Kingdom	Bacteria
Replicon accession	NC_012918
Strand	-
Start bp	4039581
End bp	4040573
Gene Length	993 bp
Protein Length	330 aa
Translation table	11
GC content	62%
IMG OID	644871120
Product	glycosyl transferase family 2
Protein accession	YP_003023280
Protein GI	253702091
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0463] Glycosyltransferases involved in cell wall biogenesis
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	1
Fosmid unclonability p-value	8.137120000000001e-33
Fosmid Hitchhiker	No
Fosmid clonability	decreased coverage

Sequence

Gene sequence

GTGAGCCGGC CGCAGAAAGG ACCGGGCGCG CCGTCGCAGG AGGGGGCGCG GATAGCGGTA 
GTGATTCCTT CCTATAAGGT GAAGCAGCAT GTGCTTCAGG TGATCTCTGC CATAGGCCCC 
GAAGTCTCCA GCATCGTCGT GGTGGATGAC GCCTGCCCCG ACGGTTCCGG CCGCTACGTT 
GAAGAGAACT GCCGCGACCC GCGCGTGCTG GTTTGCTCCC ACACCGAAAA CCGCGGGGTC 
GGTGGCGCCA CGCTCACCGG GTATCAGGCG GCTCTGGACC AGGGCGCGGA CATCATCGTC 
AAGCTGGACG GCGACGGGCA GATGGACCCG GCCCTCATCC CGAAGCTGGT GCGGCCGATA 
GTCGACCAGG TCGCGGACTA CAGCAAGGGG AACCGCTTCT ATTCCGTCGA AGATCTCCAG 
CAGATGCCTT TCGCGAGGCT GGTGGGAAAT TCAGTGCTCT CCTTCATGGC CAAGTTCTCC 
ACCGGGTATT GGACCATCTT CGACCCCACC AACGGCTTCA CCGCGATCCA CGGCGCCGTC 
GCGGCGCTGC TTCCGCTGGA AAAGATCGAA AAGAGGTATT TCTTCGAGTC CGACATGCTG 
TTCCGGCTCA ACACCCTGCG CGCGGTGGTG GCCGACGTTC CCATGCGTGC CAGATACGCC 
GACGAGAAGA GCAACCTCAG CATCCTCGGG GTCATTCCCG AGTTTCTCAG GAAGCACGCG 
GTGAACAGTT GCAAACGGAT TTTCTACAAC TACTACCTGA GAGACTTCAG CGCCGCCTCG 
GTAGAAGTGG TGCTCGGCCT CTGCGCCCTT TTGTTCGGGG TCGTCTTCGG TTCGTGGACC 
TGGTACGGTT CGATTCGGAC GGGGGTCCCG GCGACCAGCG GGACGGTCAT GCTGGCTGCG 
CTCCCGACCA TGCTGGGGAT GCAGCTTTTC CTTGCCTTTC TTTCCTACGA TACGGCCAAC 
GCGCCCAAGT ATCCCCTGCA CAGAAGGCTT TAA

Protein sequence

MSRPQKGPGA PSQEGARIAV VIPSYKVKQH VLQVISAIGP EVSSIVVVDD ACPDGSGRYV 
EENCRDPRVL VCSHTENRGV GGATLTGYQA ALDQGADIIV KLDGDGQMDP ALIPKLVRPI 
VDQVADYSKG NRFYSVEDLQ QMPFARLVGN SVLSFMAKFS TGYWTIFDPT NGFTAIHGAV 
AALLPLEKIE KRYFFESDML FRLNTLRAVV ADVPMRARYA DEKSNLSILG VIPEFLRKHA 
VNSCKRIFYN YYLRDFSAAS VEVVLGLCAL LFGVVFGSWT WYGSIRTGVP ATSGTVMLAA 
LPTMLGMQLF LAFLSYDTAN APKYPLHRRL