Gene GM21_3404 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GM21_3404
Symbol
ID	8138771
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sp. M21
Kingdom	Bacteria
Replicon accession	NC_012918
Strand	-
Start bp	3935621
End bp	3936676
Gene Length	1056 bp
Protein Length	351 aa
Translation table	11
GC content	66%
IMG OID	644871021
Product	lipopolysaccharide heptosyltransferase I
Protein accession	YP_003023186
Protein GI	253701997
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0859] ADP-heptose:LPS heptosyltransferase
TIGRFAM ID	[TIGR02193] lipopolysaccharide heptosyltransferase I

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	133
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGCGCGTTC TGATTGTCAA GATGTCCGCC TTGGGGGACG TGATACACGC CCTGCCGGTG 
CTGGATTATC TGACTCAAAC GGTGAAGGGG ATCGAGATCG ACTGGGTGGT CGAGGAGGCT 
TTCCGGGACA TGCTCTCCGG CAACCCGCTC ATCTCCCGGC TGCACCTGGC CCGTTTCAAG 
GCGTGGCGCA AGAAGCCCTT CGCTCCGGCC ACGCTCAGGG AGGTGAACGC CCTGGCGAAT 
GCGCTCAAGG AGCGCGAGTA CGACATCGTC TTCGACCTGC AGGGGAACAT CAAGAGCGGC 
ATCGTCACCA GGATCACCGG CTGCCCCAGG CGCTACGGCT TTGACCGGGA GGGGGTGCGC 
GAGAGCCTCA ACGTCTACTG CACCACGAAC CAGATACCGC TCAGGCGCGC GGACCAGCAC 
GTGAACGACC GGGCGCTGCG GGTGGTGAGC GTACCCTTCG GCAAGAACTA CCAGGGGATG 
CAGCTTGCCA CGGATATCTA CACCCCGCCG GAGGACGATG CGGCGGCCGA GGCGTTTCTG 
GCGACGCTCT CCGACGGGCT GGTCTTCGTG CTGCACCACG GCACCACCTG GAGCACCAAG 
CACTGGCACC AGGAGGGGTG GATCTCGCTG GGGCAGGAGC TTTTGACGCT CTACCCGGAG 
GCCACCATCC TCCTTTCCTG GAGTGGCGAG ACCGAGCACG AGGGTGCCAA GGAGATCGCC 
GCAGGGATCG GGAGCCAGGT GCGGGTGCTT CCCAAGCTCA CCCTGAAGGG GTTCAGCGCG 
CTCTTGAAAA AGGTCGACCT GGTCCTTGGC GGGGATACCG GTCCCATCCA CATCGCCGCC 
GCCGTCGGGA CCCCCACGGT CAGCCTGTAC CGAGCCACCG ACGGGGCCCG CAACGCGCCC 
AGGGGAGAGC ACCGGGCGGT GCAGTCACCG CTTTCCTGCG CCAAGTGCCT GCGCCGCTCC 
TGCGACCGGG ACGACGAGTG CCGCCGGAGC ATCCAGGTGA AGGCCATGCT GCAGGCCTGC 
CGGGAACTGC TGAGTAATAC GAGTACCCCG CTTTAG

Protein sequence

MRVLIVKMSA LGDVIHALPV LDYLTQTVKG IEIDWVVEEA FRDMLSGNPL ISRLHLARFK 
AWRKKPFAPA TLREVNALAN ALKEREYDIV FDLQGNIKSG IVTRITGCPR RYGFDREGVR 
ESLNVYCTTN QIPLRRADQH VNDRALRVVS VPFGKNYQGM QLATDIYTPP EDDAAAEAFL 
ATLSDGLVFV LHHGTTWSTK HWHQEGWISL GQELLTLYPE ATILLSWSGE TEHEGAKEIA 
AGIGSQVRVL PKLTLKGFSA LLKKVDLVLG GDTGPIHIAA AVGTPTVSLY RATDGARNAP 
RGEHRAVQSP LSCAKCLRRS CDRDDECRRS IQVKAMLQAC RELLSNTSTP L