Gene GM21_3509 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GM21_3509
Symbol
ID	8138881
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sp. M21
Kingdom	Bacteria
Replicon accession	NC_012918
Strand	-
Start bp	4050429
End bp	4051763
Gene Length	1335 bp
Protein Length	444 aa
Translation table	11
GC content	61%
IMG OID	644871128
Product	polysaccharide biosynthesis protein
Protein accession	YP_003023288
Protein GI	253702099
COG category	[R] General function prediction only
COG ID	[COG2244] Membrane protein involved in the export of O-antigen and teichoic acid
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	1.00438e-16
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGAACCAGG CGTGGGTTAG CTATCTGCCG GGATTCCTGC GCAAGCGGGT CGAGGGGCGG 
CACGAGCTGC AGAAGGTGCT GAACAACACC GGCTGGCTTC TCGGCGACCG CGTCCTCCGG 
ATGGGGGTGG GTCTGCTGGT TGGCATCTGG ATAGCCCGCT ATCTTGGCCC CTCCAACTAC 
GGCATGCTGA GCTACGCGGC GTCCCTGGTC GGCATCTTCA CCTCAGTGGC CATCCTTGGG 
CTGGAAGGGA TCATTGTCCG GGACCTGGTG CGCTTCCCCG ACCGGGAAGG GGAGATCCTC 
GGCACCACTT TTTCGCTGAG ACTCACGGCC GGGATCTGTT CCTATCTCCT CACCGTCGCC 
ACCGTGTTCA TCCTCCGTCC TGGCGACGCC GTTTCCCAGA TGATGGTCGC GGTGATGGGG 
TGGGTCCTGA TCTTCAACTC CGCCGATACC ATGGATTTGT GGTTTCAGTC CAAGGTACGG 
TCGAAGTACG TGGTCTATGC CAAAAACGGC GCGTTCCTGC TGAGTTCCGC GCTGAGGCTG 
GCCCTGGTGC TGATGGAGGC CCCGGTAGTT GCCTTCGCCG CCGCCAATGC GATGGAGGCG 
GCGCTCGGAG CCGCAGGGCT CTTCTACGTC TACCATCGCG ACGGGCAGAT GGTCAGGCGC 
TGGAAGGCGA GCCTCGCCCT GGCGCGCGAG CTGCTGAAAG ATTCCTGGCC CCTGGTCCTG 
TCGGGCGTGG TGTACATGAT CTCGCTAAGG ATAGACCAGG TCATGCTGGG GCAGATGGCC 
GATACCCACG AGGTCGGCAT CTACGCCTCG GCAGTCAAGA TCGCGGAGAT CTGGTTCTTC 
ATACCAACCG CGCTCGTCAC CTCCGTCTTT CCCAACATCG TGAAGGCGAA GGAATCAAGC 
GAGGAGGAGT TTCACGGCCG GCTGCAAAAG CTCTACAACC TGCTTGCCTT CACCGGGTAC 
GCCATCGCCA TACCGACGAC GCTACTGGCT GGTTTCGTCG TTCACCTGCT TTACGGCGAT 
GCCTATGTAG CCGCCGCACC GATGCTCATC TTCCTGATTT GGAGCGACCT GTTCATCAAC 
ATCGGCGTGG CGCGGAACTC CTACCTGCTC GCCATGGGGT GGTCCTGGTG CTACTTCTGG 
ATGGCGGTCT CGGGGATGGT GATAAACGTG GCCCTCAACC TCTTCCTGAT ACCGCGCTAT 
GGTGGAACGG GAGCGGCGAT AGCGACCTGC ATTTCCTACT GGGTCGCGGC CCACGGCGCC 
AGCTATTTCT ACAGGCCGTT ACGGAAGTCG GCGGGCATGA TCACCAGGGC GCTCCTCTGC 
CCGAGGTTTT GGTAA

Protein sequence

MNQAWVSYLP GFLRKRVEGR HELQKVLNNT GWLLGDRVLR MGVGLLVGIW IARYLGPSNY 
GMLSYAASLV GIFTSVAILG LEGIIVRDLV RFPDREGEIL GTTFSLRLTA GICSYLLTVA 
TVFILRPGDA VSQMMVAVMG WVLIFNSADT MDLWFQSKVR SKYVVYAKNG AFLLSSALRL 
ALVLMEAPVV AFAAANAMEA ALGAAGLFYV YHRDGQMVRR WKASLALARE LLKDSWPLVL 
SGVVYMISLR IDQVMLGQMA DTHEVGIYAS AVKIAEIWFF IPTALVTSVF PNIVKAKESS 
EEEFHGRLQK LYNLLAFTGY AIAIPTTLLA GFVVHLLYGD AYVAAAPMLI FLIWSDLFIN 
IGVARNSYLL AMGWSWCYFW MAVSGMVINV ALNLFLIPRY GGTGAAIATC ISYWVAAHGA 
SYFYRPLRKS AGMITRALLC PRFW