Gene Sama_1691 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sama_1691
Symbol	mdoG
ID	4603942
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shewanella amazonensis SB2B
Kingdom	Bacteria
Replicon accession	NC_008700
Strand	+
Start bp	2067034
End bp	2068656
Gene Length	1623 bp
Protein Length	540 aa
Translation table	11
GC content	55%
IMG OID	639781054
Product	glucan biosynthesis protein G
Protein accession	YP_927567
Protein GI	119774827
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG3131] Periplasmic glucans biosynthesis protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.138891
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	6
Fosmid unclonability p-value	0.0773488
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGTTCGTT CTCCTCGCAC CGCCAGTATC AAACCCAAGG CCGTGGCAGC CTTGCTGCTT 
GGCATGTCTG CTCTTTCCCC CATGCATCTC TTCGGCGCTG AGCCAGAGCA GGTGCAAACG 
GTAAAGCCTG CCGTTAAAGC GGAAATGCCG CCAAAGCCAA CCAAGCCAAC TCAGGTGCGT 
TTTGCCAAAA CCGGTAATTT TGATGCGGAT ACCGTTGTGC GCATCGCAAG ACAGCTTGCA 
GCCAAACCCT ATGTGGCTTT GAGCGATCCG CTCCCGCCTG GACTGGCTAA CATCAGCTAT 
GATGAGTACC GCGATATTCG CTTCAAGCCA GAGCAGGCCA TTTGGAAGCA GGACGGGTTG 
CCCTATCAGA TGCAACTCTT CCACCGTGGG TTCTATTTTC AGGATTTGAT TGAAATCGCC 
ATCGTCGAAG GCAAAAAGTC GACTCACCTG TCTTATGACC CGTCACTCTT CAGTGCCGGT 
GAAGTCATTC GTGAAAAGCT GCCCAATGAA GACATTGGTT ACAGTGGTTT GCGGGTACAT 
TATCCGCTGA ACAGCAGCGA GTATTTTGAT GAGCTCTTTG TGTTCCAGGG CGCCAGTTAC 
TTCCGCGCCC TCGGTAAAGG CAATGCCTAC GGCCTGTCTG CCCGTGGCCT TGCCATTAAA 
ACCGCCGATC CGGCCGGTGA AGAATTCCCG GTCTTTCGCG CGTTTTGGAT AGAAAAGCCC 
AATAACGAAA CTAACCTCAT TGTGGTTCAT GCGCTGCTGG ATAGCCCCAG CGTGGCCGGT 
GCATATCGTT TCTCCATCCG TCCCGGTGAC AACACCCGTA TGGATGTGGA AGCCGTGCTC 
TTCCCACGGG TAGAGCTTGC CAAAGTGGGT TTGGCCCCGA GCACCAGCAT GTACATGCAT 
TCTCCCAATG GCCGCCATCT CACAGACGAT TTTCGCCCAG CGGTGCATGA CTCAGACGGC 
CTGTTGATGA TCAACGGCCG GGGTGAGCGT TTGTGGCGTC CGCTGGCAAA TCCAAAGGAT 
CTGCAGGTAA GTGCCTTTAT GGATAACTCC CCACAGGGCT TTGGTTTGCT GCAGCGTGAG 
CGCAACTATG TGAACTACCA GGATCTGGAA GCCAACTATG AGCGTCGTCC AAGCCTTTGG 
GTTGAGCCCG TGGGTAACTG GGGTGCCGGT GCCGTGGTTC TGACTGAAAT CCCGACTCAG 
TCTGAAATTC ACGACAACAT TGTGGCCTTC TGGAAGCCTC GTCAGCCACT TGCGGCCGGC 
AGCGAGTACC GCTTTGCTTA CCATCTGTCC TGGGGTGCCA ATCCTGTGCC AGTGGATAAC 
AGCATTATCG TAAGCCGCAG TGCCAGTGGC CGTGCCGACA TTGCCAAGCC AACGCCAAAA 
CGCCTGTTCG TGGTGGATTA TGAGGTGAAA GGCGAGAAGC CCGCCAAGTT GCCCACGCCC 
AAGGTGGAAA CCTCCGCAGG CGTTGTCAGC AATGTGGTTA TCCGCGAAAA CCCCAAATCA 
AAAGGCTATC GTTTGTCGTT TGAGTTTGAC CCGGGTGAAA CCAAACTGGC TGAGTTTCGT 
GCCGAGCTTA AGTTTGACGA ACCCCGCAGC GTAGAAACCT GGCTGTACCG TTGGACGCTC 
TGA

Protein sequence

MVRSPRTASI KPKAVAALLL GMSALSPMHL FGAEPEQVQT VKPAVKAEMP PKPTKPTQVR 
FAKTGNFDAD TVVRIARQLA AKPYVALSDP LPPGLANISY DEYRDIRFKP EQAIWKQDGL 
PYQMQLFHRG FYFQDLIEIA IVEGKKSTHL SYDPSLFSAG EVIREKLPNE DIGYSGLRVH 
YPLNSSEYFD ELFVFQGASY FRALGKGNAY GLSARGLAIK TADPAGEEFP VFRAFWIEKP 
NNETNLIVVH ALLDSPSVAG AYRFSIRPGD NTRMDVEAVL FPRVELAKVG LAPSTSMYMH 
SPNGRHLTDD FRPAVHDSDG LLMINGRGER LWRPLANPKD LQVSAFMDNS PQGFGLLQRE 
RNYVNYQDLE ANYERRPSLW VEPVGNWGAG AVVLTEIPTQ SEIHDNIVAF WKPRQPLAAG 
SEYRFAYHLS WGANPVPVDN SIIVSRSASG RADIAKPTPK RLFVVDYEVK GEKPAKLPTP 
KVETSAGVVS NVVIRENPKS KGYRLSFEFD PGETKLAEFR AELKFDEPRS VETWLYRWTL