Gene GM21_4033 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GM21_4033
Symbol
ID	8139407
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sp. M21
Kingdom	Bacteria
Replicon accession	NC_012918
Strand	-
Start bp	4616438
End bp	4617814
Gene Length	1377 bp
Protein Length	458 aa
Translation table	11
GC content	64%
IMG OID	644871649
Product	MATE efflux family protein
Protein accession	YP_003023807
Protein GI	253702618
COG category	[V] Defense mechanisms
COG ID	[COG0534] Na+-driven multidrug efflux pump
TIGRFAM ID	[TIGR00797] putative efflux protein, MATE family

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	38
Fosmid unclonability p-value	0.00000078929
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGAACCACG GCCACGAGCT GCTGCACCAA CCGATCCCGG GGTTGATCAG GAAACTGGCC 
GTTCCCACCA GCGTCGGCTA TTTCTTCAAC ACCATGTTCA ACGTGGTCGA CACCTTCTAC 
GGCGGAAGGG TCTCCACCGA GGCGCTCGCC GCACTTTCCC TTTCCTTTCC CATTTTCTTC 
CTCATCATCG CCATCGGCGC CGGGATCTCC ACCGGGGCGA CCGCGCTCAT AGGCCACGAG 
CTCGGCGCGG GCAACGCCGA AGAGGCGCGG CACCTGGCGG GACAGACCAT CTCCTTCGGC 
ATCGTGCACG GCGTACTGGT CGCGGCGGTC GGCTTCTCGG CCGCTCCGCT GCTCTTCCAG 
CTCCTGGGCG CCAAAGGGGC TGTCTTGCAG CTCGCGCTGC AGTACATGGA CACCATCTTC 
ATCGGGAGCA TCTTCTTCCT GATCAACTAC GTGTTGAACT CCATCCTGAA CGCGACCGGC 
GACAGCCGCA GCTTCCGTAA CTTCCTGGTC GTCGGGTTCT TCCTCAACCT CGTCTTCGAC 
CCCTGGTTTC TCTACGGCGG GCTCGGGGTG CCGGCGCTGG GGATATCCGG CATAGCCTGG 
GCCACCATAC TGATCCAGGC CATCGGTAAC TGTTATCTGG CGGCGAGGGT CAGGCAGTCG 
GGGATGCTGG AGGGCTTCCG CTGGAGGGAG CTTATTCCCA GCCGGCACGC TTACTCCCAA 
CTGGCCCGGC AGGGGTTTCC CTCCAGCCTC AACATGATGA CCGTCGCCAG CGGCATCTTC 
CTGATCACCT GGTTCGTCGG GCGCTTCGGG AGCGAGGCGG TGGCGGCTTA CGGTATCGGC 
TCCCGGATCG AGCAGATCGC GCTCCTTCCG GTGATGGGGA TGAACGTGGC GACGCTCGCG 
CTTGTGGCGC AAAACAGCGG GGCCAGGCAG TTGGAGCGGG TGGTGCAGAC CATCAAGACC 
GCGCTGCGGG TAGGGGTGGC GCTGATGGGC GCCGGAACGG TGGTCGTGTT CCTTGCGGCC 
CGGCCGCTGA TGGGGCTATT CAGCAACGAC CCCAAGGTGG TGGAGATAGG GGTCGGCTAT 
CTCAGGATCG AGTCCTTCGT CTTCATGGCC TACGTCATCC TCTACACCTG CGTCGCCGTG 
CTTCAGGGGT TGAAGAGGCC AGGGTTTGCC CTGATGATCG GGTTGATGAG GCAGATCGTT 
TTCCCCCTTC CGGTCTTCTA CCTCCTGGCG GTGTTCTTGG GGTTCGGTCT CACCGGGATC 
TGGTGGGGAA TACTGCTGGT GACCTGGGGA GCCGCCTGCG TCACCGTCGT GTACGTGCTG 
CGGCTGGCGG CAGGCATGAG CCCCGCCGGC GCTGGGCTGG AGAGGGCTGC CGACTGA

Protein sequence

MNHGHELLHQ PIPGLIRKLA VPTSVGYFFN TMFNVVDTFY GGRVSTEALA ALSLSFPIFF 
LIIAIGAGIS TGATALIGHE LGAGNAEEAR HLAGQTISFG IVHGVLVAAV GFSAAPLLFQ 
LLGAKGAVLQ LALQYMDTIF IGSIFFLINY VLNSILNATG DSRSFRNFLV VGFFLNLVFD 
PWFLYGGLGV PALGISGIAW ATILIQAIGN CYLAARVRQS GMLEGFRWRE LIPSRHAYSQ 
LARQGFPSSL NMMTVASGIF LITWFVGRFG SEAVAAYGIG SRIEQIALLP VMGMNVATLA 
LVAQNSGARQ LERVVQTIKT ALRVGVALMG AGTVVVFLAA RPLMGLFSND PKVVEIGVGY 
LRIESFVFMA YVILYTCVAV LQGLKRPGFA LMIGLMRQIV FPLPVFYLLA VFLGFGLTGI 
WWGILLVTWG AACVTVVYVL RLAAGMSPAG AGLERAAD