Gene GM21_4112 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GM21_4112
Symbol
ID	8139486
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sp. M21
Kingdom	Bacteria
Replicon accession	NC_012918
Strand	-
Start bp	4697050
End bp	4698207
Gene Length	1158 bp
Protein Length	385 aa
Translation table	11
GC content	65%
IMG OID	644871727
Product	glycosyl transferase group 1
Protein accession	YP_003023885
Protein GI	253702696
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	85
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCCAGAG CGATCATCGT ATTCTCGCAC CTGCGCTGGA GCTTCGTGTA CCAGCGCCCA 
CAGCAGTTGT TGACCCGGAT GGCGGGCAGG CGCCGGGTGA TCTTCTTCGA AGAGCCGCTT 
TACGACGCCG GGCGTGCGCC GTTTCTGGAA TGCAGCACGC CGGAGCCGGG GGTGCTGGTC 
TGCAGGCCCC ATACCCCGTC CCAAAAATCG GGGTTTCACG ACGAGCAGCT GCACTGGCTG 
GCGCCGCTTC TGGAAGAGCT GGTGGCGCAG GAGGAACTGA GCCGGTATAT CGTCTGGTTC 
TACACCCCGA TGGCGCTTCC CCTGGCAAGG GTGCTCCGCC CCTCCCTGGT GGTGTACGAC 
TGCATGGACG AGTTGACCGG TTTTCTGGAG GCGCCGAAGG AACTGGTGCA GCGGGAAAAG 
GCGCTGCTGG CAGTGGCGGA CCTAGTTTTT ACCGGCGGGC CCAGCCTGTA CCAGGCCAAG 
AAGAGTCATC ACCCCGAGGT GCACTGCTTC CCGAGCAGCG TCGACGCCTC CCATTTCGCG 
CTCGCCTGCG ATCCGGAGTG CGAGCACGCG ACCCAGAAGG CCCTCCCCAA GCCGAGGCTC 
GGCTACTTCG GCGTGCTGGA CGAGAGGCTC GACCTGCAGC TTCTGCACAC CTTGGCGCTA 
TCCCATCCCG ACTGGCAGAT CGTCATGGTC GGCCCGGTGC TGAAGATCTC TCCAGAGCTC 
CTCCCCAGGG AGCCGAACAT CCACTACTTC GGGCAGCAGG AATACGCCGC TCTCCCCGGT 
TACCTGGCCG GGTGGGACGT CTGCCTCATC CCGTTCGCAT TGAACGACGC CACGCGCTTC 
ATCAGCCCCA CCAAGACCCT GGAGTACATG GCCGCGGAGA AGCCGGTGGT CAGCACCCCC 
ATCACCGACG TGGCGGTCCC CTACGGCGAC ATCGTCTTCA TCGGGGACGG CATCGGCAAC 
TTCATAGCCG CCTGCAAGAA AGCCCTGGCG CTTTCGCCGA ACCGGTACCG GGAGATGGTA 
GGCGCAATGC GCCAGGTGCT CGCGGGGACT TCGTGGGACG CTACGGTGCA GGGGATGAAC 
CAACTGATCG ACCGGGCGGT CCGGCGCAAG AGGGCGCGGC CGGTGCGCAG CGAAACGGTG 
GCTTCGGAGA ACGTTTGA

Protein sequence

MPRAIIVFSH LRWSFVYQRP QQLLTRMAGR RRVIFFEEPL YDAGRAPFLE CSTPEPGVLV 
CRPHTPSQKS GFHDEQLHWL APLLEELVAQ EELSRYIVWF YTPMALPLAR VLRPSLVVYD 
CMDELTGFLE APKELVQREK ALLAVADLVF TGGPSLYQAK KSHHPEVHCF PSSVDASHFA 
LACDPECEHA TQKALPKPRL GYFGVLDERL DLQLLHTLAL SHPDWQIVMV GPVLKISPEL 
LPREPNIHYF GQQEYAALPG YLAGWDVCLI PFALNDATRF ISPTKTLEYM AAEKPVVSTP 
ITDVAVPYGD IVFIGDGIGN FIAACKKALA LSPNRYREMV GAMRQVLAGT SWDATVQGMN 
QLIDRAVRRK RARPVRSETV ASENV