Gene GM21_3816 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GM21_3816
Symbol
ID	8139190
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sp. M21
Kingdom	Bacteria
Replicon accession	NC_012918
Strand	+
Start bp	4388315
End bp	4389454
Gene Length	1140 bp
Protein Length	379 aa
Translation table	11
GC content	65%
IMG OID	644871435
Product	glycosyl transferase group 1
Protein accession	YP_003023593
Protein GI	253702404
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	101
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGCCTAAAA CCTTACTGAT CGAGGGTTGG CGTTTCGTCC CCCACTCCTA CGCCTGCGTA 
AACATGTGGC AGTGCCTCGA ACTGATCAAG CGTCCCGACG TAGAGCTGTA CCATCGCGAC 
CTTCCCTATT TCAAGCCCGA ATGGAAGCCG ACGCAGCACC TCTTCGACCC CGCCGCGACC 
GCCGCACTAA AGGCCATCCC CCCCTTGCCG CCGGGAAAAA AGGCCGACCT TTTGCTCAGG 
GTCGCTTTCC CCTACCGCTT CGACCGGAAC AACGCCGGCC GGCACCTCGT CTTCGGCACC 
GCCGAGCACG GCATCGTCAC CCCCTCCATG GTGGAGGGCG GAGTCCCGCT GGCGCAGGCC 
ATGGCGGACT CGGAAGCTTT GATAATCACC CCGAGCAACT GGTCCCGGGC CGGCTTCCTT 
AGAAGCGGCG TCGCGCCGGA ACGGGTGGCC TTAGTGCCGC ACGGAGTGGA CCCGGGGATC 
TTCCGGCCGC TGCCGGAAGC GGAGCGGGAA GCGCTCAGAC GACAGTTGGG GTGGCAGGAT 
AATTTCGTCG TCCTGAACGT CGGCTGCATG ACCGGCAACA AGGGGGTGCG CTACCTGCTG 
AAGGCATGTG CCGTGCTGCA AGAGCGCTTC CCGCAACTGA AGCTCTGCAT GAAGGGGCTC 
GACCCGCTCT ACCCTTCGCG CCGGCTGCTG CAGGAGGCGG GAGACCTTTT GACCGCGGAA 
GAGGGAACCC GCCTCGCCTC CTCGCTGGTC TACATCGGAG AGGACCTCTC CTTCTCCGAC 
ATGGTCAGCC TCTACAACGC CGCCGACGCC TACGTCTCCC CCTACATCGC CGAGGGTTTC 
AACCTGCCGG TCCTCGAAGC CGCCGCCTGC GGGCTCCCGG TCATCTGCAC GGCGGGTGGG 
CCGACCGACG ACTTCGTCGA TGCGAGCTTC GCCAAAAGGA TAGACAGCAC GCTCATCCAG 
AAAGACGGAT TGTTAGGCGT GCAGCCGGAC CTGGAGCACC TCGTCGAACT TATCGCGCAA 
ACGGTCCAGG ACCACGAGTT CCGCCAGAAG GCCCGTGGAG CCGGCCCCTC CTTCGTGGCC 
GGCTCCTTCA CCTGGCGCCA CGCGGTGGAG AAGCTGCTGA CGCTGCCGCA GTCGGACTGA

Protein sequence

MPKTLLIEGW RFVPHSYACV NMWQCLELIK RPDVELYHRD LPYFKPEWKP TQHLFDPAAT 
AALKAIPPLP PGKKADLLLR VAFPYRFDRN NAGRHLVFGT AEHGIVTPSM VEGGVPLAQA 
MADSEALIIT PSNWSRAGFL RSGVAPERVA LVPHGVDPGI FRPLPEAERE ALRRQLGWQD 
NFVVLNVGCM TGNKGVRYLL KACAVLQERF PQLKLCMKGL DPLYPSRRLL QEAGDLLTAE 
EGTRLASSLV YIGEDLSFSD MVSLYNAADA YVSPYIAEGF NLPVLEAAAC GLPVICTAGG 
PTDDFVDASF AKRIDSTLIQ KDGLLGVQPD LEHLVELIAQ TVQDHEFRQK ARGAGPSFVA 
GSFTWRHAVE KLLTLPQSD