Gene GM21_1737 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GM21_1737
Symbol
ID	8137068
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sp. M21
Kingdom	Bacteria
Replicon accession	NC_012918
Strand	-
Start bp	2022353
End bp	2023594
Gene Length	1242 bp
Protein Length	413 aa
Translation table	11
GC content	64%
IMG OID	644869349
Product	major facilitator superfamily MFS_1
Protein accession	YP_003021549
Protein GI	253700360
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2271] Sugar phosphate permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	122
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACTAAAG CCACCCCACC TCTCACGGCC AAAATCCACT ACGGCTGGAT CATCGTCGCC 
ACCAGCGCCC TGGGCCTTTT TTCCTGCTTC GGCCTGGCCC GTTACGCATA CTCCATGCTC 
ATCCCCGGGA TGCAGGCGGG CCTTGCCCTA AGCTACGACC GTATGGGGTT CATCGGCACG 
GCCAATTTCG TCGGCTACCT GGCCTCCGTC CTGGCGGCGC CAAAGCTGAT GGGGCGGCTG 
CCCCCCCGGT GGATGGCGGC TTTAGCCCTT TTCGTTATCG GCCTCGGCAT GATCGGTATC 
GGCTTTTGCA CCTCTTTTTT CCCGATAATT GCCCTGTACG CGTTGGTGGG GATGGGAAGC 
GGATTCACCA ACATCCCCCT CATGGCGCTG GTCACCTTCT GGTTCCGCAG CGAGCATCGC 
GGCAAGGCAG CGGGCCTAGC CATCGCAGGG AACGGGATAG GAATCATCCT CGCCGGGTTC 
CTGGTTCCCG CACTCAACCG CAGCTTCGGG CCAGACGGCT GGCGCGCCGG CTGGATGGTG 
CTGGGGTCGA TATGCCTCGG CATCGCCCTC GTCACCGCTG TTTTGCTGCG AAACCACCCC 
TCAGAGCTGG GGCTTGAGCC GGTGGGAAGG GTGGTGGATG CGTCCCCGGA GCAGTTCATC 
CACCGCGAGC ACAAGGGGGA CGGCGCGCTC TTGCTCAGGC TGGGGCTTCT CTACCTGGTT 
TTCGGCGCCA CCTTCATGGT GTACGGCACC TTCATCGTCA CCACCATGGT GCGGGAGTAC 
GGGCTAGCCG AGGCGCGGGC CGGGCTCTAC TGGTCCTGGG TAGGCTTCTT CAGCTTTTTC 
TCCGGCATCG GCTTCGGCAC CCTGTCCGAC CGCATCGGCA GGCGCCGTGG GCTTGCCTTG 
GTCTTCACCG TTCAGACCGC GGCCTACCTG CTTGCGGGTC TTAAAGCCGG TCTCTTGGGC 
CTCACCGTAT CGCTCGTGCT CTACGGCTGC GCCGTCTTTG CCATCCCCGC CATCATGGCG 
GCCGCGGTCG GCGATTACCT GGGGCTGAAC CGGGCATCCG CCGCCTTCGG CACCATCACC 
ATCTTCTTCG GATTGGGGCA GGTCATCGGC CCCGCCGGAG CCGGGATGAT CGCCAAGTCC 
ACCGGCGCCT TCACCACCCC CTACCTCATA GCCGGGATAC TGACCGCCTG CGCCGCGGTC 
CTGGCTTTCC TGCTCCCCGA ACCTGCCGGG AAAAGTGCCT GA

Protein sequence

MTKATPPLTA KIHYGWIIVA TSALGLFSCF GLARYAYSML IPGMQAGLAL SYDRMGFIGT 
ANFVGYLASV LAAPKLMGRL PPRWMAALAL FVIGLGMIGI GFCTSFFPII ALYALVGMGS 
GFTNIPLMAL VTFWFRSEHR GKAAGLAIAG NGIGIILAGF LVPALNRSFG PDGWRAGWMV 
LGSICLGIAL VTAVLLRNHP SELGLEPVGR VVDASPEQFI HREHKGDGAL LLRLGLLYLV 
FGATFMVYGT FIVTTMVREY GLAEARAGLY WSWVGFFSFF SGIGFGTLSD RIGRRRGLAL 
VFTVQTAAYL LAGLKAGLLG LTVSLVLYGC AVFAIPAIMA AAVGDYLGLN RASAAFGTIT 
IFFGLGQVIG PAGAGMIAKS TGAFTTPYLI AGILTACAAV LAFLLPEPAG KSA