Gene Haur_2823 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Haur_2823
Symbol
ID	5734704
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Herpetosiphon aurantiacus ATCC 23779
Kingdom	Bacteria
Replicon accession	NC_009972
Strand	-
Start bp	3590727
End bp	3591953
Gene Length	1227 bp
Protein Length	408 aa
Translation table	11
GC content	54%
IMG OID	641279966
Product	major facilitator transporter
Protein accession	YP_001545589
Protein GI	159899342
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.087939
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCGGCGAA GCCCGTTTTA TGGCTGGTGG ATTGTGAGCA TGCTGGGATT TACCGAGATG 
ACTTCGTGGG GCGTGATTTA CTACGCATTT AGCGTGCTCT TGACCCCGAT GCAGCGTGAG 
TTGGGTTGGT CGCAAGCCCA TTTTACGGGT GGATTTTCGC TGGCCTTGTT TATTTCGGGA 
ATTGTGGCTT TGCCCGTTGG CCGCTGGCTC GACCAGCATG GCGCACGCGG TTTGATGACA 
CTTGGCTCAT GTTTGGCGGC AATTTTGGTG GTGGCATGGG CCAATGTTCA ATCGCTCTTG 
GCTTGGTATC TGATTTGGGC TGGCTTGGGT TTGGCGATGG CGGCAATTTT ATATGAGCCA 
GCGTTTGCCG TGGTGGCAAC GTGGTTTCAG CAAAAACGCC AACATGCCCT GACAATTTTG 
ACGGTTGGCG GTGGCTTGGC CAGCGTCGTA TATGTGCCCT TAGTTACGCG ATTGCTCGGC 
ACACTGAATT GGCGCGAGGT GTTGCTGTGG CTGGCAGCGA TTTTGGCAGT GCTAACGATT 
CCGTTGCATG GCTTGGTATT GCGTGGTAAG CCCGCCGATT TGGGCTTATT GCCTGATGGC 
GGATCGCTGG CAGTGGCAAC CGTTACGCCA AATCCCACGA TTCAGCCTTC GATGTCGTTG 
GGAAATGCCA TTCGAGCAAG CTCATTTTGG TGGTTGGCGC TGGCTTTTGG CCTGACCACG 
ATGGCAACAT TCACCTTAGG CGTGCATTTG ATTTCAGCGA TTCAAGCCCA AGGCTATGCC 
CCAGAGATTC AAGCCTTGGC TGTGGCCTTG CTGGGTGGTT CGCAAATTCC CAGCCGAATT 
GTGATTGGAA GTGTTGGGCG ACGTTGGCCC CAAGTCCAAT TAGCATGGAT GTTGTGTTTG 
CTGCAAAGTG CTGCGTTTGC CATCTTCCTG TTTGTGCCCA ATGTGACAGG GCTACTGCTG 
TTTGCTTGCT TGTTTGGGGC GGGATCTGGC GCGTTGACCC CGACACGAGC AGCATTGGTT 
GCCGATGTTT TTGGCACAGC CCAATATGCC AGTATCAGCG GGGCGTTGGC ATTGTTGACC 
ACAACAGCTC GGGCCTTGGC TCCAGTTTTG GCTAGCCTGT TGGTGGGATT GTTGCATAGC 
TATCAACCGC TGTTTGGCTT GCTGTTGCTG ATGTGTTTGA TCAGCGCAGC GGCAATTTAT 
TTGATTCGAG GTGCAAGTAA TGGCTAA

Protein sequence

MRRSPFYGWW IVSMLGFTEM TSWGVIYYAF SVLLTPMQRE LGWSQAHFTG GFSLALFISG 
IVALPVGRWL DQHGARGLMT LGSCLAAILV VAWANVQSLL AWYLIWAGLG LAMAAILYEP 
AFAVVATWFQ QKRQHALTIL TVGGGLASVV YVPLVTRLLG TLNWREVLLW LAAILAVLTI 
PLHGLVLRGK PADLGLLPDG GSLAVATVTP NPTIQPSMSL GNAIRASSFW WLALAFGLTT 
MATFTLGVHL ISAIQAQGYA PEIQALAVAL LGGSQIPSRI VIGSVGRRWP QVQLAWMLCL 
LQSAAFAIFL FVPNVTGLLL FACLFGAGSG ALTPTRAALV ADVFGTAQYA SISGALALLT 
TTARALAPVL ASLLVGLLHS YQPLFGLLLL MCLISAAAIY LIRGASNG