Gene Haur_3349 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Haur_3349
Symbol
ID	5735219
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Herpetosiphon aurantiacus ATCC 23779
Kingdom	Bacteria
Replicon accession	NC_009972
Strand	-
Start bp	4223687
End bp	4225012
Gene Length	1326 bp
Protein Length	441 aa
Translation table	11
GC content	50%
IMG OID	641280496
Product	major facilitator transporter
Protein accession	YP_001546113
Protein GI	159899866
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2211] Na+/melibiose symporter and related transporters
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCAATGGA AATTAGCACT TCATCGGCCT ATTGCTCCGC GTGCGAGCAA TGAAGAAACT 
TTGCGCCGTA ACATGCGCTT AGGAGTGGCC AATGGAGTTT TATTTATTTT AGCCGACGCA 
TTTAGCGATG CGAATTTGGT TCTGACGGTA TTTGTACGCG AGCTGGGCGC TGCGCCGTGG 
GTAGTTGGCT TGTTGCCATC GCTCAAATCG GGCGGCTGGC TGCTACCACA ATTGTTGAGT 
GCTGGCCGTT TGCAAGGCAT GACCTACAAA TTGCCAGTCT ATCGCCAAGT CGGAATTGTG 
CGCTTTTTTA TTTGGCTGGC GATGGTTTTG GTAGTCTGGA ATGCAACTAG TTTGCCAGTT 
TGGGTGCTGT TGCCGCTGTT TTTGCTAGGC TATGCGCTCT ACAATTTTAC GGGTGGATCT 
GGCTCGGTGG CTTTTCAGGA AGTTGTGGCC AAAACGATTC CTGCCCGTCA GCGCGGCAAA 
TTTTTCGGAG CACGCAATTT AATCGGCGGT TTGCTCTCGT TTGCCTTGGT TAGCCCTTTG 
GTTGGTTGGT TGCTGAGCCG TTCCAGTCCT TTGCTATTTC CCCACAATTA TGGGGTTTTG 
CTGTTTATTT CGTTTGTGTT GATTGGCTTT GGGATTATTT CGTTTAGCCT ATTTGCCGAG 
CCGCCGACAA CCAATCCGCC TGCGGCGATT TCGACCAAGC AGATGTTTGC GAAAATTCCG 
GTGTTGCTCA AGAGTGACCG CAATTTTCGC CAATATGTGC TTTCGCGCAT GGTCACCCGT 
TTGGGTGGCT TGGCTGACCC TTTTTATATT TTGTATGCCC GTGAAGTATT GAATGTGCCA 
CCACGCATGA TTGGGGTCTA TTTGGCGGTA CGAGTGTTCT CGGCAGCACT ATCGAACCTC 
TTTTGGTCGC GGGTTGGCGA TCAACGGGGC AATCGTTTGT TGATTGTCTT AACTGGTGCG 
TTGATCATCA CCGTGCCAAC GTGGGCTTTG TTGGTGATGC CATTTGCCAG TATTTTGGGG 
CCAGAAGCCT TGGGTTGGTT TTTTGGCGTA ATTTTCTTGT TGATCGGCCT AAGTGTCGAT 
GGCTCGAACA CTGCTAGTTT AACCTATGTG ATGGAGTTAG CACCAGCCGA GCAACGTCCA 
GTCTATGTCG GTGTTTGTAA TACCTTGATG GGCATCGCGA CCTTTTTTCC GGTGCTGGGT 
GGGGTGTTAT TGGCCCAATT CGGCTATTTA CCCTTGTTTT GGATTAGTGC GGCCAGCGCC 
TTTATTGGTT TGTTGCTCTC GCGCCGCTTG CCTGAGCCAC GTATCCACGA AGAACGTAGA 
GCATAG

Protein sequence

MQWKLALHRP IAPRASNEET LRRNMRLGVA NGVLFILADA FSDANLVLTV FVRELGAAPW 
VVGLLPSLKS GGWLLPQLLS AGRLQGMTYK LPVYRQVGIV RFFIWLAMVL VVWNATSLPV 
WVLLPLFLLG YALYNFTGGS GSVAFQEVVA KTIPARQRGK FFGARNLIGG LLSFALVSPL 
VGWLLSRSSP LLFPHNYGVL LFISFVLIGF GIISFSLFAE PPTTNPPAAI STKQMFAKIP 
VLLKSDRNFR QYVLSRMVTR LGGLADPFYI LYAREVLNVP PRMIGVYLAV RVFSAALSNL 
FWSRVGDQRG NRLLIVLTGA LIITVPTWAL LVMPFASILG PEALGWFFGV IFLLIGLSVD 
GSNTASLTYV MELAPAEQRP VYVGVCNTLM GIATFFPVLG GVLLAQFGYL PLFWISAASA 
FIGLLLSRRL PEPRIHEERR A