Gene GM21_3504 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GM21_3504
Symbol
ID	8138876
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sp. M21
Kingdom	Bacteria
Replicon accession	NC_012918
Strand	-
Start bp	4044819
End bp	4046021
Gene Length	1203 bp
Protein Length	400 aa
Translation table	11
GC content	65%
IMG OID	644871123
Product	glycosyl transferase group 1
Protein accession	YP_003023283
Protein GI	253702094
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	4
Fosmid unclonability p-value	3.0009700000000003e-28
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

TTGAAGATCG TCTTCCTGGC TCCCTTCGGC ATCCGCCCCA AGGGCACTGT CATCGCCCGG 
ATGCTACCGC TGGCTGTAGA ACTGCAGGGG TTGGGGCACG AGGTCGTCAT CGTGGCGCCT 
CCCTACACGA ACCCTGAGGA TTCGGGAAAG ACCGAAACGG TGCGGGGGGT ACGGCTGGTG 
AACGTCCTTC TCGGGCCCAA GCACAAGGCA CTCGCCGCGC CCTTCCTCGC CTGGCGCATG 
CTGCGCGCGG CGTTGGCCGA GCGCCCTGAC CTGATTCATC TCTTCAAGCC CAAGGGGTAC 
GGCGGCATCG CCGGCATGCT CCTCATCTCG CTGCAGCGCC TGGGAATCAG GATGCCGCCG 
CTTTTCCTCG ACACCGACGA CTGGGAAGGC GAGGGGGGGA TGAACGAACT GCACGACTAC 
TCCGGCGTCG AGAAGCGCTT TTACCGGTTC CAGGAACAGT GGATCACGCA GCACGCGGTG 
GGGGTGACGG CGGCGAGCCG GGAACTGGAG CGGCTGGTAA CGGAGATGGG TGTTCCGGGG 
GGGCGGATGC TTTATCTTCC CAACTGCGTC GGTGCGGCGC CCGCCGTCGA CGGAGCCGGG 
GCCCGAGCCC GGCTCGGCAT CGCTCCGGAC GCGCCGGTCG TCCTTCTCTA CACCCGCTTC 
TTCGAGTTCA GCCAGGAAAA GCTGCACTAC CTTTTCGCCG AATTGTTCAA GCAGATGCCG 
CAGGTCCGCT TCCTGGTGGT GGGGAAGGGG CGTCACGGGG AGGAGGACCT GCTTGCCAAG 
GCGGCAAGGG AGTCTGGCTT CGACGCAGCG CTGGCCATGG CCGGATGGGT GGCCCCGGAG 
GCGATCCCCG ACCTGCTGGC GGCCGGAAAC GTCGCCATCT ACCCCTTCGC ACAGAACCTG 
GTGAACCGCA CGAAGTGCCC GGCAAAGCTT ACCGAGATCC TCCTGGCGGG GACTCCGGCC 
GTCGGCGACC GCGTCGGGCA GTTGACCGAG TACATCGACG ACGGGCGCTC CGGCATCCTC 
TGCGACCCGG ACGATTGGCG GCAGATGGCG GATGAGACCC TGGCGTTGCT CCGTTCGCCG 
GAGAGACAGC GGCAGATGGG GGAGCACGCA CGCCTTTATC TGCAGGAAAA CTTCAACTGG 
AAGGATGCGG CGCTTCGGCT CGATGACTTC TATCGCAGGA ACGCCGGCAC CTCGAAAAGT 
TGA

Protein sequence

MKIVFLAPFG IRPKGTVIAR MLPLAVELQG LGHEVVIVAP PYTNPEDSGK TETVRGVRLV 
NVLLGPKHKA LAAPFLAWRM LRAALAERPD LIHLFKPKGY GGIAGMLLIS LQRLGIRMPP 
LFLDTDDWEG EGGMNELHDY SGVEKRFYRF QEQWITQHAV GVTAASRELE RLVTEMGVPG 
GRMLYLPNCV GAAPAVDGAG ARARLGIAPD APVVLLYTRF FEFSQEKLHY LFAELFKQMP 
QVRFLVVGKG RHGEEDLLAK AARESGFDAA LAMAGWVAPE AIPDLLAAGN VAIYPFAQNL 
VNRTKCPAKL TEILLAGTPA VGDRVGQLTE YIDDGRSGIL CDPDDWRQMA DETLALLRSP 
ERQRQMGEHA RLYLQENFNW KDAALRLDDF YRRNAGTSKS