Gene GM21_0079 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GM21_0079
Symbol
ID	8135378
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sp. M21
Kingdom	Bacteria
Replicon accession	NC_012918
Strand	+
Start bp	104013
End bp	105290
Gene Length	1278 bp
Protein Length	425 aa
Translation table	11
GC content	64%
IMG OID	644867696
Product	major facilitator superfamily MFS_1
Protein accession	YP_003019924
Protein GI	253698735
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2271] Sugar phosphate permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	8
Fosmid unclonability p-value	1.28688e-24
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGTTAGAGT GCCGGCCGGG GGTAATGACA ATGCATGAAC AGGAGCGGCT GCGCCGGCAG 
CGCTGGTTTA TTTTCTTTAT CCTGGCCCTG ATCTACATCA TGGTGTACTT CTATCGCGTC 
TCGCTCGCGG TCGTCGCCAA GGACGTCTCG CGCGACCTGA ACCTCACCCC CTCTCAACTG 
GGTTCTCTTT CCAGCATCCT CTTCTACGTC TACGCCGCGG CACAGATCCC GCTGGGGCCT 
ATGATCGACC GACTCGGAAG CCGGGTGGTC ATCAGCGGCT CCGGGGTGCT CACCGCGCTG 
GGCGGCATCC TCTTCTCCCA GGCGGCCAAC ATGGGGCAGG CCGTGGCCGG CCGCGTTCTC 
TTAGGGATCG GAACCGCATC GGTGTTGATG GCTACCTTCA CCATCTTCAG CCACTGGTTC 
ACCAAGCAGG AATTCGGAAA GGTCTCCGGA ATGATGGTCG CGACGGGAAA CCTGGGGAAC 
CTGGCGGGGA CGGCGCCTTT GGCCTTGGCG GTCGCAGCGG TCGGGTGGCG CAACTCCTTT 
CTCGCGGCGG GGGTGCTGCA GGCGGTGGTC ACGGTACTGG TTTTCGGCCT GGTGCGAGAC 
CGCCCCCCCG TTCCCGATCG GCATGAGGAG GAAGCGCCGG CCCGGCTGGG GATGCTTGAA 
GCATGGAGGA AGATCGTCTC CAACGGGGAC TTCTGGCTCT TGGCCGCGGT GGCGTTCGCC 
TGGTACGGGA ACTACCTGGC GGTGCAGGGG CTTTGGGGGG GGCCCTACCT GATGGAAGTG 
GTGAGGCTTA CCCGGGAGGA GACGGGAAGG ATGCTGATGT ACACCTCGCT GGGGTTCATC 
GCGGGGAGCC TCATGATCGA CCACGTGGCG CGCAGGATCC TCCGTTCCTA CAAGAAGACC 
CTTCTCGGCG GGCAACTGCT GCTGTTGCTC CTCATGACGA GCTTTCTCGG GCTCGCCGAC 
AAGATGCCGA CGGCAGCGCT CTCGGCGCTG TTCTTCGGCC TGGGGCTCTG CGTCTCCAGC 
GGCGTGATGA TCTATCCCAT CATCCGCTCC ATGTTCCCGG TAGCCATAGT GGGGACCGCG 
CTCACGTCGC TCAACTTCTT CGTGCTGCTG GGGGCCGCAT CGGTGCAGCA GGGGATGGGG 
ATAATGATCG GCGCGGTCGC GAAGACGACA CCCGAGGCGA CGGCGCAGGC GTATCATTCG 
GCGTTCCAGC TCCCCATCGG GGCGCTGGCG TTCGCCGCGG CCATGTTCTT CTTCGCCAAG 
GATTATTGGG AGAAGTAG

Protein sequence

MLECRPGVMT MHEQERLRRQ RWFIFFILAL IYIMVYFYRV SLAVVAKDVS RDLNLTPSQL 
GSLSSILFYV YAAAQIPLGP MIDRLGSRVV ISGSGVLTAL GGILFSQAAN MGQAVAGRVL 
LGIGTASVLM ATFTIFSHWF TKQEFGKVSG MMVATGNLGN LAGTAPLALA VAAVGWRNSF 
LAAGVLQAVV TVLVFGLVRD RPPVPDRHEE EAPARLGMLE AWRKIVSNGD FWLLAAVAFA 
WYGNYLAVQG LWGGPYLMEV VRLTREETGR MLMYTSLGFI AGSLMIDHVA RRILRSYKKT 
LLGGQLLLLL LMTSFLGLAD KMPTAALSAL FFGLGLCVSS GVMIYPIIRS MFPVAIVGTA 
LTSLNFFVLL GAASVQQGMG IMIGAVAKTT PEATAQAYHS AFQLPIGALA FAAAMFFFAK 
DYWEK