Gene Haur_2125 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Haur_2125
Symbol
ID	5734013
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Herpetosiphon aurantiacus ATCC 23779
Kingdom	Bacteria
Replicon accession	NC_009972
Strand	+
Start bp	2669021
End bp	2670544
Gene Length	1524 bp
Protein Length	507 aa
Translation table	11
GC content	53%
IMG OID	641279266
Product	major facilitator transporter
Protein accession	YP_001544893
Protein GI	159898646
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID	[TIGR00711] drug resistance transporter, EmrB/QacA subfamily

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACAGAAG CACGTCGCTG GCCATGGGGC TTAATTTGGA CAGCCCTGAT TATTTTTTTG 
GCCGCTCTCG ACCAAACGGT GGTGATCACC GTCTTACCAA ATGTGGTCAG CACGCTGGGC 
CTTGATGTTG AGCAAGCGCT TGAACAAGGC ATTTGGGTCA TCACTGGCTA TTTGTTGGGC 
TATACCGTCG CTATGCCCTT GCTAGGACGG ATCGCCGATG CCTATGGTCA TCGGCGCTTA 
TTTTTGGCGG CGCTCGGGGT TTTCGTGGGC GGTTCAATTG GTTGTGCCTT GGCAGATAGC 
GTTTGGTCGT TGGTGGCATG GCGCATCGTT CAGGCGATTG GTGGTGGCGC TGTGTTGCCG 
ATCGGTTTGG CAATCTCGAT GGATGAAGTT AAGCCAATTC ATCATGCAAC TGCCTTGGGG 
ATTATGGGGG CCGCCGGCGA AGCTGGCGGG GTGCTTGGCC CAGCCTATGG TGGCCTGATT 
TCACAAATCC AACTGCTCGA TGTTGATGGT TGGCGTTGGG TTTTCTGGCT GAATATTCCA 
CTCGGCGCAG CTTTGGCTTG GGCAATTATT CGCACCTTAC CTGATCGGCC TGGTAATCGC 
GGGGCGATTG ATTATATTGG CGGTGGCTTG ATTGCGGTTA GTTTGACCGC CTTAACTGTG 
GCGCTTTCAC GCTCGCTCGG TAGTTTGGCC ATCGAGCCCA GCGCCGAAAG CGGCAACCTC 
GATCAATATG CAGTGCAATG GACATCACCA TTAACCATTG GCCTGTTGGT GTTGGCAGTG 
CTCAGTTTTA TTGGCTTTAT CTGGTGGGAA CGCCGCACGA CAACTCCATT GATCGAGCTA 
AGCGCCTTCC GCACCCCAGC ATTTAGCGCT GCCAATATTA CCAATGTCTT GGTTGGCATG 
GCCTTAATTG TGGGCATGGT CAATGTGCCG TTTTTCGTCG GAACAGTGTT GGCAGGCGAT 
GCGCTTTCTG GTGGATTAAC GTTAATGCGC CTGACCATGA TGATCCCGAT TGGTGCAGTT 
TTGGGTGGTA TGTTGATGCG CAAGATTAGT GCGCGGTTGG TTGCTAGCCT CGGCATGATC 
ACCACCGCCG TTGGTTTTGC ATTGCTGGGC TTTTGGAAAG CAGAAACCAA TCAATTCCAA 
TTAACCATCT ATTTATTGTT AACGGGTACA GGCTTTGGTT TAGTACTCCC CGCCTTGAGT 
GCTGCCGCCA TTGGCACCGT TGCCCGTGAA TCAATGGGCA CTGCCGCAGG CTTATTGAAT 
GCATTACGCA TGGTCGGAAT CACCTTGGGT GTTTCGGCTT TGGCTTCATG GAGTTTGGCC 
TACCGCGCTA GCCTCAATAG TACGTTGGTG TTTACAATGG AAGATTTCAA TACAGGCGCG 
GCCCAATTGG CCCTAACCCA AAATGAAATG ACGGTGTATC ACAGCACCTT TTTCGCCGCC 
GCAGTAGTTT GCTTAATTGC GTTGATTCCA ATTTGGTGGC TGCCACGCGA ACGCAGCGAG 
GGCGACACAC CACTGTTTGC CTAG

Protein sequence

MTEARRWPWG LIWTALIIFL AALDQTVVIT VLPNVVSTLG LDVEQALEQG IWVITGYLLG 
YTVAMPLLGR IADAYGHRRL FLAALGVFVG GSIGCALADS VWSLVAWRIV QAIGGGAVLP 
IGLAISMDEV KPIHHATALG IMGAAGEAGG VLGPAYGGLI SQIQLLDVDG WRWVFWLNIP 
LGAALAWAII RTLPDRPGNR GAIDYIGGGL IAVSLTALTV ALSRSLGSLA IEPSAESGNL 
DQYAVQWTSP LTIGLLVLAV LSFIGFIWWE RRTTTPLIEL SAFRTPAFSA ANITNVLVGM 
ALIVGMVNVP FFVGTVLAGD ALSGGLTLMR LTMMIPIGAV LGGMLMRKIS ARLVASLGMI 
TTAVGFALLG FWKAETNQFQ LTIYLLLTGT GFGLVLPALS AAAIGTVARE SMGTAAGLLN 
ALRMVGITLG VSALASWSLA YRASLNSTLV FTMEDFNTGA AQLALTQNEM TVYHSTFFAA 
AVVCLIALIP IWWLPRERSE GDTPLFA