Gene Haur_2594 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Haur_2594
Symbol
ID	5734472
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Herpetosiphon aurantiacus ATCC 23779
Kingdom	Bacteria
Replicon accession	NC_009972
Strand	+
Start bp	3329024
End bp	3330211
Gene Length	1188 bp
Protein Length	395 aa
Translation table	11
GC content	52%
IMG OID	641279734
Product	major facilitator transporter
Protein accession	YP_001545360
Protein GI	159899113
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCAACGC GGACAAGTGG GCAGGCTGTC GCTCTGACAG GCCTTTCGGT CATGGTAATG 
ATGACATTTT CGCATGCCAT GAATGATATG TGGACTTCAC TGTTAGCGCC CTTACTGCCA 
AGTATTCGCG ATACCTATCA GGTGAGTATT GGTCAAACTG GCATTTTGGT GGCGATTTTG 
TCGTTTGCTG GCTCGATGCT TCAGCCCTTG CTTGGTGCGG TTGGCGATTA TATTGATCGG 
CGTTGGTTAG CGGCATTTGG CCCTGTGCTG ACGGCGATCG GCCTAACCTT GATTGGCTAT 
GTGCCCAATT TCTTTATGCT GGGCGCGTTG ATTATGCTTG GTGGTTTGGG CAGCGCAATT 
TTTCATCCGG CAGGAGCAGC CTATATCGCC ATGGGCGCGA ATCCTCAGCA ACGTGGTTTG 
TTTGTTTCAA TTTTTTCGGC TGGCGGCACG GTTGGCATGG CCTTTGGCCC CCTAATTGCT 
GCCCAGTTTG ATTTGGTGAG TTTGCCCTAT TTGCTGCCCG TGGGAATTGC AGTTGGGGTT 
TTGACCTTCT TGATGATTCC TTCAGCCAAG CAAAATCGCA GCCAACCCAA AACGTTGCGC 
GATTATATCA GCGTTTTTCA GGGGCCGTTG CGCTGGCTTT GGTTTATGAG CGTCTTACGC 
TCGCTTTCGA GTGTTTCATA TAGCAGCTTA TTGGGCTTTA TGCTGCGCGA TCGTTTTGAT 
CAAGCGATGG CTGATGCCCA TGTTGGCCCG ACGTTGGCGG TTTTCAATAT TGCCTCAGCG 
GTTGGCGGCA TTATTGGCGG ACGCATTTCT GATCGAATTG GGCGCACAGT GGTGCTGCGT 
TCAAGTATTT TGAGCACAAT TCCGCTTTTT ATCGGCTTAG TGCTATCATC GCCATTGAAT 
TGGTGGTATT ACCCCTTGAC GGCACTGGTT GGGGCAATGG TGATGGCTAA TATTCCGGTT 
TCGATTGTCA CAGCGCAGGA GTATGCACCG CAACATATTG CCACCGCCAG CGCCATGATG 
ATGGGCTTTG CTTGGGGTAC GTCGGGCGTG CTTTACCCCA TCATTGGCAG CCTCGCCGAC 
TGGACCTCGC CAACCTGGGC CATGATCGCC GCGATTGGCT TGTTATTGCC AGCCTTCTTT 
ATCACGGTAC GGCTGCCCGA GCCTGAGCGC ACAACGACGA TAGGGTAG

Protein sequence

MATRTSGQAV ALTGLSVMVM MTFSHAMNDM WTSLLAPLLP SIRDTYQVSI GQTGILVAIL 
SFAGSMLQPL LGAVGDYIDR RWLAAFGPVL TAIGLTLIGY VPNFFMLGAL IMLGGLGSAI 
FHPAGAAYIA MGANPQQRGL FVSIFSAGGT VGMAFGPLIA AQFDLVSLPY LLPVGIAVGV 
LTFLMIPSAK QNRSQPKTLR DYISVFQGPL RWLWFMSVLR SLSSVSYSSL LGFMLRDRFD 
QAMADAHVGP TLAVFNIASA VGGIIGGRIS DRIGRTVVLR SSILSTIPLF IGLVLSSPLN 
WWYYPLTALV GAMVMANIPV SIVTAQEYAP QHIATASAMM MGFAWGTSGV LYPIIGSLAD 
WTSPTWAMIA AIGLLLPAFF ITVRLPEPER TTTIG