Gene Haur_3692 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Haur_3692
Symbol
ID	5735541
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Herpetosiphon aurantiacus ATCC 23779
Kingdom	Bacteria
Replicon accession	NC_009972
Strand	+
Start bp	4644463
End bp	4645848
Gene Length	1386 bp
Protein Length	461 aa
Translation table	11
GC content	52%
IMG OID	641280844
Product	MATE efflux family protein
Protein accession	YP_001546456
Protein GI	159900209
COG category	[V] Defense mechanisms
COG ID	[COG0534] Na+-driven multidrug efflux pump
TIGRFAM ID	[TIGR00797] putative efflux protein, MATE family

Plasmid Coverage information

Num covering plasmid clones	0
Plasmid unclonability p-value	0.0000025823
Plasmid hitchhiking	No
Plasmid clonability	unclonable

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCAATTC CATTAGGCGC AGCACAGGGG CGAAGCAGCC AACGGAGTGC TGTATTAAAG 
TTGGGCTTGC CAGCAGTTGG CGAGCAATTA TTGAGTTTGA TGGTTGGGTT GGTTGATACC 
TATGTGGTGG GACACTTGAG CTTAGCCGTC GCAACTGCCA ATGGCTACGA TCGCCAAATC 
GCCTTGGCAG CGACCGGCAT TTCGAGCCAA GTCACATGGA CATTAATCAC CTTTTTTATG 
GCAGTAGCCC TCGGTAGCAC GGTGGTTATT GCGCGGTTTG TGGGGGCAGG CGAGCGCGAA 
CAAGCCAACC AAACCCTGCG CCAAGCCCTG CTAATTGGGC TAGCCATGGG CCTGCTGAGT 
TTATTTTTGG CCTATAGCTT TGCCCCTCAA CTGATGGATT TACTCGGCGC AAACGAGCAA 
GTGCGCCAAT ATGGGGCTGG CTATTTGCGT ATTTCCGCCT TATCAATGCC CTTAATGGCC 
ATGCTTTACG TGGGCAATGC CGCCTTACGT GGCTCCGGCG ATACGCGCAC CCCACTCAAG 
GTTATGCTGG TCGTCAATGG GATCAACGCA GGGTTATCGT TGCTCTTGGT CAATGGCTAT 
TTTGGTTTTC CGGCGATGGG GATTAATGGG GCAGCATTTG CCGCGATGAG TGGGCAAGGC 
ATCGGTGGCT TAATGGTGCT TGCAACACTG ATTCGTGGCC GTTCAGGCTT GAAGCTTGAT 
CAAATTCCAC GCCCAGATGG CAATTTGATC TGGCGGATTT TACGCCAAGG GCTGCCATAT 
GGGGCTGAGC AATTTATTTT TCAGGCCGCA TTATTAATTT TTATCCATTT GATCAACGAT 
ATTGGCACGG CGGCTTATGC TGCGCATAAC ACCATTATCA CGATTGAAAG TATTTCGTTT 
TTGCCAGGCA TGGGCTTGGC GGTAGCCGCC ACAACCTTAG TCGGCCAACA TATGGGAGCA 
AATCAGCCAC AACAAGCTAG CGAAAGTGGC TTTGAGGCAT TTCGGCTGGG AGCACTCTTC 
ATGGGGGCAA TTGGCTTATT GTTTGTAGTT GCGCCAGAAG TCTTTTTGCG CTTTTTCGTT 
GCTGACGAAG AGGTAGTGCA ACTCGCCGCC TTACCGTTGC GCATGGTTGG GTTTGCTCAG 
CCCGCTTTGG CCGCTAATTT CATCTTCAGC GGCAGTTTAC GTGGTGGTGG CGAGCCAAAA 
TGGCCACTGA TTAGCAAAAT GCTGAGTGTT TGGTGTGTCC GCTTACCGCT GGCATGGCTG 
CTTGTCAAGC ACTTCGACCT TGGCTTGAAT GGCATTTGGC TGGCAATGTG TACCGATTTT 
GCCGTCCAAG GCAGCTTGGC ATGGTGGCGC TTCCGACAAG GCAAATGGCA AAGTGCAAAA 
GTTTAG

Protein sequence

MAIPLGAAQG RSSQRSAVLK LGLPAVGEQL LSLMVGLVDT YVVGHLSLAV ATANGYDRQI 
ALAATGISSQ VTWTLITFFM AVALGSTVVI ARFVGAGERE QANQTLRQAL LIGLAMGLLS 
LFLAYSFAPQ LMDLLGANEQ VRQYGAGYLR ISALSMPLMA MLYVGNAALR GSGDTRTPLK 
VMLVVNGINA GLSLLLVNGY FGFPAMGING AAFAAMSGQG IGGLMVLATL IRGRSGLKLD 
QIPRPDGNLI WRILRQGLPY GAEQFIFQAA LLIFIHLIND IGTAAYAAHN TIITIESISF 
LPGMGLAVAA TTLVGQHMGA NQPQQASESG FEAFRLGALF MGAIGLLFVV APEVFLRFFV 
ADEEVVQLAA LPLRMVGFAQ PALAANFIFS GSLRGGGEPK WPLISKMLSV WCVRLPLAWL 
LVKHFDLGLN GIWLAMCTDF AVQGSLAWWR FRQGKWQSAK V