Gene GM21_3411 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GM21_3411
Symbol
ID	8138778
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sp. M21
Kingdom	Bacteria
Replicon accession	NC_012918
Strand	-
Start bp	3942713
End bp	3943819
Gene Length	1107 bp
Protein Length	368 aa
Translation table	11
GC content	68%
IMG OID	644871028
Product	lipopolysaccharide heptosyltransferase II
Protein accession	YP_003023193
Protein GI	253702004
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0859] ADP-heptose:LPS heptosyltransferase
TIGRFAM ID	[TIGR02195] lipopolysaccharide heptosyltransferase II

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	143
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCAAGG CCGCCATGAC TGACAACCGT ACGGGGAAAA GGATCCTGGT GCTGCGCTAC 
CGCTTCATCG GCGACACCAT CCTCACCGTC CCGTTTCTGC GGAACCTGCG CCGCGCCGAG 
CCGGACGCCT ACATCGCCTG GGTCGTCGCC CCCGGCTCCT CCGAGGTGAT CCAGGGGACA 
CCCTACGTCG ACGAGCTCAT CTTCTGGGAT CCCCCCACCA TCCATGCCGA CAGCCGCTCC 
ACCCACAAGA CGCTAGGCGA CAAGTTAGGC TTCATCAGGG AGCTGCGCGC CCGCCGCTTC 
GACAAGGTCT ACGTGCTCAA GCGCTCCTTC GGCAGCGCCA TCATTGGCCT TCTCTCCGGC 
GCCTCGAAAC GGATCGGCTT CGCCACCGAG GGGCGGAACT TCCTGTTGAC CAAGGGGGTC 
CCCTACCGGC ACGGGCAGCA CGAGGTGCAA AACTTCCTGG ACGTCTTGCG CGCCGACGGC 
GTGCCGGTCG TGGACGATCA TCTCGAGGCG TGGCTTTCGG CCGAGGAGAA GGCTTTCGCG 
GACGACTTCT TCCGGCAGCG CGGCGTCTCC GCGGACGAGC TGGTGATCGG GATGCACCCC 
TTCGCCGCCA ACCCGCCGCG CGCCTGGCAC CTGGACAACT TCACCGAACT GGCGCGCGCC 
CTGCAAAAGC GCTATCGCTG CCGGATCATG TTCTTCGGCG GCCCCCGGGA CAAGGAGGCG 
CTCGACGCGA TACGCGGCGG GCTGGACGTG CCGCCCCTTG AGGCGGTCGG CTCGACCACG 
CTGCGCCAGA CCATGGCCCT TCTCTCCCGC TGCGGCGCCC TTGTCTGCAA CGACAGCGGC 
ATCATGCATC TCGCCGCCTC GCTGCAGGTG CCGCTGGTCG CGCTTTTCGG CCCGCAGTCG 
CCGGTCAAGT TCGGCCCCTG GGGGACCGCG TGCCGCGTGG TGCGCCACGA CTTCCCCTGC 
GGCCCATGCC GCCAGAGGTT CTTCACCGAG TGCGAGCCGT CGGAGCGCGG GAGGCCCGCC 
TGCATCGAGG CGATCACGGT GGACGAAGTG CTGGCTGAAA TCGAAGCCCT GCTCGCGGCG 
GGGGATAGGG AGCACACGGA TAGATGA

Protein sequence

MTKAAMTDNR TGKRILVLRY RFIGDTILTV PFLRNLRRAE PDAYIAWVVA PGSSEVIQGT 
PYVDELIFWD PPTIHADSRS THKTLGDKLG FIRELRARRF DKVYVLKRSF GSAIIGLLSG 
ASKRIGFATE GRNFLLTKGV PYRHGQHEVQ NFLDVLRADG VPVVDDHLEA WLSAEEKAFA 
DDFFRQRGVS ADELVIGMHP FAANPPRAWH LDNFTELARA LQKRYRCRIM FFGGPRDKEA 
LDAIRGGLDV PPLEAVGSTT LRQTMALLSR CGALVCNDSG IMHLAASLQV PLVALFGPQS 
PVKFGPWGTA CRVVRHDFPC GPCRQRFFTE CEPSERGRPA CIEAITVDEV LAEIEALLAA 
GDREHTDR