Gene Haur_1139 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Haur_1139
Symbol
ID	5733031
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Herpetosiphon aurantiacus ATCC 23779
Kingdom	Bacteria
Replicon accession	NC_009972
Strand	+
Start bp	1302340
End bp	1303527
Gene Length	1188 bp
Protein Length	395 aa
Translation table	11
GC content	51%
IMG OID	641278278
Product	major facilitator transporter
Protein accession	YP_001543915
Protein GI	159897668
COG category
COG ID
TIGRFAM ID	[TIGR00882] oligosaccharide:H+ symporter

Plasmid Coverage information

Num covering plasmid clones	0
Plasmid unclonability p-value	0.00000165449
Plasmid hitchhiking	No
Plasmid clonability	unclonable

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGGCAGCC GTTTGGCGCT CTGGCGGTCG AATGCACGTC CCGGGGTTCG GGGTAGTTTG 
TACTATTTAT GTTTTTGGTC AAGCGTTGGG ATGTATATTC CATTCATTAA TGTATATTTC 
ACCAACCTTG GCTTAAGTGG GCAACAAATA GCCATGTTTG GGGCAATTAG CCCGCTAGCA 
GTGCTGTTGT TCAACCCATT GGTGGGTGCA ACAGCCGATC GACGTGGCTG GCATGTGCAG 
TTACTCCTAA GCATGTTGGC CTTAACGGGG TTAAGCCAAA TTGCCTTGGC ATTTCCAACA 
ACCTTCTTTA CAATCTTGCC AGTGATGGTC GTTTTGGCAG TGGTACGCGG GCCAATTGCG 
CCATTGGCTG ATAGCATGAT CGCAGGCATG GCCGTGCGTC ATCAACTGGC CTATGGCAAA 
TTGCGGCTCT GGGGTTCAGT TGGCTATGCC GTCACCTCAT TATTAGGTGG TATTTGGTGG 
GCCAAAACGG GCTATCCAAC CATGTTTATA TTGACTGGCT TGATGACTGG CTTGGTCGCG 
ATCGTAGCCA ATAGCCTTGA TCATACGCCT GAATTGCGCA AAACTGCTGC CAAATCGGCG 
AAAGCGCCCC GTGATGCCGC TTTTATCGCA ATTGTCGTGA TCACTAGTTT GGTTGGGGCT 
GCCTTTAGCA TGGTTTCAAT GTTCGATGGC AACCTGATTC AACGGATCAG TGGGAGCACC 
ATCATGCTGG GGGTTTTGCC ATGTGTCATC GCCAGTACCG AAGTGCCAGT GATGCTCAAC 
GCCGATCGGG TGATCGCTCG CTTTGGCACA GCTAAAACAC TAGCCGTTTC AACCTTGATT 
CTTGGGCTAG GGTTTATTGG CAGCGGCATG GTGAGCGAAG CTTGGATGTT AATTCCAATT 
GGCATGTTTC GGGCTTGTGG ATTTGGCTTG TACTCGGTGG CGATCATTCG CCTAATTACC 
GAGCGCATTC CAACCACCTT GCTGGCAACC GCGCAAGGCT TGATCAGTGC GATTGCTGGT 
GGTTTGTCGC CGTTGTTGGC TACCCAAGCG GGTGGCTATA TGTTCGATAT ATCAGGGCCA 
CAATTGGTCT TTATTGCATC AGGCTTGTGC ATTGGCTTGG CAACCTTGGT CGTTTGGCTA 
GGCTTAAAAC TGAATTGGTT CAAACCAATC GCGCAAACCA ACGCCTAA

Protein sequence

MGSRLALWRS NARPGVRGSL YYLCFWSSVG MYIPFINVYF TNLGLSGQQI AMFGAISPLA 
VLLFNPLVGA TADRRGWHVQ LLLSMLALTG LSQIALAFPT TFFTILPVMV VLAVVRGPIA 
PLADSMIAGM AVRHQLAYGK LRLWGSVGYA VTSLLGGIWW AKTGYPTMFI LTGLMTGLVA 
IVANSLDHTP ELRKTAAKSA KAPRDAAFIA IVVITSLVGA AFSMVSMFDG NLIQRISGST 
IMLGVLPCVI ASTEVPVMLN ADRVIARFGT AKTLAVSTLI LGLGFIGSGM VSEAWMLIPI 
GMFRACGFGL YSVAIIRLIT ERIPTTLLAT AQGLISAIAG GLSPLLATQA GGYMFDISGP 
QLVFIASGLC IGLATLVVWL GLKLNWFKPI AQTNA