Gene GM21_1741 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GM21_1741
Symbol
ID	8137072
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sp. M21
Kingdom	Bacteria
Replicon accession	NC_012918
Strand	-
Start bp	2026667
End bp	2027914
Gene Length	1248 bp
Protein Length	415 aa
Translation table	11
GC content	62%
IMG OID	644869353
Product	major facilitator superfamily MFS_1
Protein accession	YP_003021553
Protein GI	253700364
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2271] Sugar phosphate permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	129
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACATCCA GTGATGAAAG CACGAAAGTG GCAATGCGGC AGGTATTCGG CCTGCCGGTG 
ATAGTGGCGG CCCTGGGGTA CTTCGTCGAC ATCTACGACC TGGTGCTGTT CAGCATCGTC 
AGGGTCCCAA GCCTCAAGGC GATCGGGCTC TCCGGGCAGG AACTGATCGA CAAAGGGGTG 
TTCCTGCTCA ATATGCAGAT GGCGGGCATG CTGCTGGGGG GGATCCTCTG GGGGGGCCTC 
GGCGACAGAA AGGGTCGCCT CAAGATCATG TTCGGCTCCA TCTTCATCTA CTCGCTGGCG 
AATCTCGCCA ACGGCATGGC CAACTCCATC GAGGCCTACG CCTTTCTCCG CTTCATGGCG 
GGGGTGGGCT TGGCAGGCGA ACTCGGCGCC GGCATCACGC TGGTGAGCGA GGTACTGCAC 
CGCTCCGTCA GGGGGTACGG CACCATGATC GTGGCGACGG TCGGGGTATC GGGTGCCATC 
CTCGCCAACA TCGTCGCCAA GGAGTTCGAC TGGCGCACCG CCTTCGTCAT CGGCGGCATC 
CTGGGCCTTT TGCTCCTGCT GCTGCGGGTA ACGGTCGCCG AATCCGGGAT GTTCAAGGGG 
ATGGAATCAA AGGAGGTCGC CAAGGGGAAC TTCCTCGCCC TCTTCACCTC GCGCGACCGC 
TTCGGCCGCT TCATGAATTC CATCCTGATC GGCCTCCCCT CCTGGTTCGT GGTGGGGGTC 
CTGATCACCT TCTCCCCCGA ATTCGCCAAG GCCCTCGCGG TCCAGGGAAC GGTCAGCGCC 
GGCAACGCGG TCATGTACTG CTACATGGGG CTCGTGGCCG GCGACCTCGT CAGTGGGCTA 
TTGAGCCAGT TGCTGAAAAG CCGCAAGAAG GTGGTGCTCC TTTTCCTACT CTTGACCGTC 
GCGGCGGTAG CGGGCTACTT CAGCGCCGCC GGGGTTTCCG CCGGCTCCTT CTACCTCATC 
TGCGGCTTGC TCGGCTTCGG TATCGGCTAC TGGGCCATCT TCGTGACCGT GGCGGCGGAG 
CAGTTCGGAA CCAACCTGAG GGCCACCGTC GCCACCACCG TCCCCAACTT CGTGCGCGGC 
ATGACCATCC CCATCACCAT GCTGTTCCAG GCGGCAAGAA AGGTCCTCGG GCTGGAAATG 
GGCGCCCTTG CCGTCGGGGC GCTTTGCCTC GTCATCGCGC TGATAAGCCT TTCCCTGCTG 
CAGGAGACTT TCCACAAGGA TCTCGATTAT TTCGAGGAGT ACCTCTAA

Protein sequence

MTSSDESTKV AMRQVFGLPV IVAALGYFVD IYDLVLFSIV RVPSLKAIGL SGQELIDKGV 
FLLNMQMAGM LLGGILWGGL GDRKGRLKIM FGSIFIYSLA NLANGMANSI EAYAFLRFMA 
GVGLAGELGA GITLVSEVLH RSVRGYGTMI VATVGVSGAI LANIVAKEFD WRTAFVIGGI 
LGLLLLLLRV TVAESGMFKG MESKEVAKGN FLALFTSRDR FGRFMNSILI GLPSWFVVGV 
LITFSPEFAK ALAVQGTVSA GNAVMYCYMG LVAGDLVSGL LSQLLKSRKK VVLLFLLLTV 
AAVAGYFSAA GVSAGSFYLI CGLLGFGIGY WAIFVTVAAE QFGTNLRATV ATTVPNFVRG 
MTIPITMLFQ AARKVLGLEM GALAVGALCL VIALISLSLL QETFHKDLDY FEEYL