Gene Haur_0878 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Haur_0878
Symbol
ID	5732779
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Herpetosiphon aurantiacus ATCC 23779
Kingdom	Bacteria
Replicon accession	NC_009972
Strand	+
Start bp	999251
End bp	1000456
Gene Length	1206 bp
Protein Length	401 aa
Translation table	11
GC content	49%
IMG OID	641278010
Product	major facilitator transporter
Protein accession	YP_001543654
Protein GI	159897407
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG0738] Fucose permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGTCAAT CAATCGTCCA TGAAGCCAGC CCCGCAACCA AACAGGCTTG GAAGCCAACT 
CTGCTGATCG CGTTGTTGGC TGGGCAGTTC ATTGCATTTG GTCTGGTATT AGGTGTGCAG 
GGTGTGATCT TAGCCGAAGT TATGCTTGCA CTAGCCTTGA CCGAAGGTAT TTTTGGGACT 
GTCCAGCTTG CCCTGCCAGT CGTAGGGTTT CTGGTATTGA TGTTTAACAG TCAGCTCTAT 
CTACGACTTG GGAATAAATG GCAATCCATT TTGAGTTTAT TGCTTTTAGT CAGTGCCATG 
CTTGTGTTGG CGACAATTGC CAATCTTTGG GGTTTAATCC TTGGCCTGAT TCTTTCAGGA 
GCCGGATTTG CTATGCTCGA TGCGGCGACC AATAGTGCCA GTATGGATTT TGAGCAGGCT 
AGTGGTCGGC ATATTTTGAA TGTTATGCAT GGCTTATCAA GTGGCGGAGT GATGGTAGGG 
GCGTTTATCA CCGGATTTGC CCTCGAATCT GGTTGGTCGT ATCAAGCAGT TGCCATAGCT 
TCGGCAGCGA TTTGTTGTTC CCCGATTATC CTTGCGACAT TTCCCGCCCG CTACCCAACT 
GCCAGCCAAG CCCAAACTGA ATCAGCTGAT TCAGCAGACG GGAGCTTCCA CAAAAAGCCT 
TTATTTATTG CCCTCGCAAG TATTTGTTTT TTAGGCAGCG CCTCGGAAGC CATCGCTGTC 
GTTTGGACAG TCATTTATTT ACTTGGGTTA GAAGCCTCAA TTGCGCTGAG CGGAACCGTT 
TTTGCCCTGT TTAATGGAGC AATGCTGCTT GGTCGTTTTA TTAATGCACC AATTGTTGCT 
CGCTTGGGGA GTCGGGTTTC CTTGCTGATT TCTGGAATCG GGATGCTGAT TGCGGCGGCG 
CTCTTGCTGC TCTTTAATAC GATTCCTGTA TCGATTGTGG CTTTTATTAT TTTGGGCTTG 
GCAGTAGCTG GTATTCAACC AACGGCGCTC AGTGCTGCGG CTCCGTTATC ACCCAATAAT 
AGTGGAGCTG TCGCTGCGCC AATTATGATG TCGGCCTATG GGGCACTGCT GATCGCTCCT 
TTGATCTATG GTTGGATTGC CGAATTTACG GCCTTACGCC CTGCAATGCT GCTCGTTGGC 
TTGTTTGGCT TGATTACCTG CTGGCTCACC ATCAGCATTG TTGGTCGCCA TACAGCTAGC 
ACGTAG

Protein sequence

MSQSIVHEAS PATKQAWKPT LLIALLAGQF IAFGLVLGVQ GVILAEVMLA LALTEGIFGT 
VQLALPVVGF LVLMFNSQLY LRLGNKWQSI LSLLLLVSAM LVLATIANLW GLILGLILSG 
AGFAMLDAAT NSASMDFEQA SGRHILNVMH GLSSGGVMVG AFITGFALES GWSYQAVAIA 
SAAICCSPII LATFPARYPT ASQAQTESAD SADGSFHKKP LFIALASICF LGSASEAIAV 
VWTVIYLLGL EASIALSGTV FALFNGAMLL GRFINAPIVA RLGSRVSLLI SGIGMLIAAA 
LLLLFNTIPV SIVAFIILGL AVAGIQPTAL SAAAPLSPNN SGAVAAPIMM SAYGALLIAP 
LIYGWIAEFT ALRPAMLLVG LFGLITCWLT ISIVGRHTAS T