Gene GM21_3409 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GM21_3409
Symbol
ID	8138776
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sp. M21
Kingdom	Bacteria
Replicon accession	NC_012918
Strand	-
Start bp	3940540
End bp	3941616
Gene Length	1077 bp
Protein Length	358 aa
Translation table	11
GC content	65%
IMG OID	644871026
Product	glycosyl transferase group 1
Protein accession	YP_003023191
Protein GI	253702002
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	139
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGCATCG CCATGATCGA CAACAGCCGT GGCTGGGGTG GAGCCGAGCA GGTTATGCTC 
ATGGTCGCTT CCCATCTGCG TGAGCGCGGC CACGAGGTGA CCGTGTTCGT GCGGGAGGGG 
GGCGCCCTGG TGGAGCCTTT CCGCAGGGCG GGGCACGATG TCTGCGCTGT ACCGCGCAAA 
GGGCTCGGGG TCTTGGCCGG GATTGCCAGG ACGGCAAGCG CCATCCGTGG CGGCGGGTTC 
GACCTGATCC ACGTGCACCG AAACCACGAC CTGGTGGTCG GCAAGATCGC TTCCGTGGCG 
GCCGGGCTCC CGATGCTCCT CACCCAGCAC TGCCTTTTGG GGAACACATC CAGCTCGATC 
ATCAACCTGG CCGACCGCGT CGTCGCGGTC TCTGGTTTCA TCGGCGACGA CATGAAGTGC 
CGCTTCCCGG TTCTTTCCGG CAAGCTGCAG GTGATCCACA ACGGCATCGA TCTCACCCCG 
TTCAAGGAGC CGAAGCCGGG CTTCTGGGAG AAGGTCCCGG CGGTCGCGGG CGCTAAGCCG 
CTCTTGGGGG TTATCGGCTA CTTCTACAAG AATCAGGAAG AGCTCATCGC CATGATGCCG 
CGCGTGCGGG AACGGCTGCC GCAGGCGAAG CTCGTCATCA TCGGCAAGGA CGACGAGAAG 
CAGCCCGCCC TCGAGAAGCT TGCGGCCGAG TTGGGTGTGG CGGATGCCGT CTACTTCCCG 
GGGAAGATTC CGTACGCCGA GATCGGTGAC GCCATGGCGG GGCTCGATTT CAACGTGAGC 
GCCTTCCGGC GCGAGGGGTG CGCCCTGAAC GTATTGGAAT CTCTCGCGGT CGGCACCCCC 
TTCGTCGGCT ACCGCTCCGG CAGCTATCCC GAGCTTGCCA TCGACGGAGA AACCGGGTTG 
CTGGTCGACA ACCAGGACCA GTTCGTCGAC GCGCTGGCGC GTCTTTCGGC CGATCCCGAG 
CTCGTCGCCT CAATGAGGAA GAGAGCCCGG GAGGATGCCC TTGTCCGCTT CGACCTGAAT 
CGGATGGTTG AGGACTACCT GGACCACTAC CGGGAGATGA CGGGGGGAAA GCCGTGA

Protein sequence

MRIAMIDNSR GWGGAEQVML MVASHLRERG HEVTVFVREG GALVEPFRRA GHDVCAVPRK 
GLGVLAGIAR TASAIRGGGF DLIHVHRNHD LVVGKIASVA AGLPMLLTQH CLLGNTSSSI 
INLADRVVAV SGFIGDDMKC RFPVLSGKLQ VIHNGIDLTP FKEPKPGFWE KVPAVAGAKP 
LLGVIGYFYK NQEELIAMMP RVRERLPQAK LVIIGKDDEK QPALEKLAAE LGVADAVYFP 
GKIPYAEIGD AMAGLDFNVS AFRREGCALN VLESLAVGTP FVGYRSGSYP ELAIDGETGL 
LVDNQDQFVD ALARLSADPE LVASMRKRAR EDALVRFDLN RMVEDYLDHY REMTGGKP