Gene Hoch_1561 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hoch_1561
Symbol
ID	8543943
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Haliangium ochraceum DSM 14365
Kingdom	Bacteria
Replicon accession	NC_013440
Strand	+
Start bp	2128771
End bp	2130033
Gene Length	1263 bp
Protein Length	420 aa
Translation table	11
GC content	74%
IMG OID	646386270
Product	major facilitator superfamily MFS_1
Protein accession	YP_003266005
Protein GI	262194796
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.224234
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	25
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCAAGCGA GCATCGGAAT CGCCAACACC GTCGAGCGCA GCGAGGTGCA CGCCGGCCAT 
CGCGCCCCCG CGACTGCCGC CGCGGCGCCC GCGCCCGACA CGGGACCGCC GGCGTCGTTG 
GTGGCGCTGC TGGCGGCCAG CGCCGGTTTT GCGGTGGCCG CGCTGTACTA CAGCCAGCCG 
ATCCTGGGCG TGCTGGGCGC GGACCTGGGC GCGTCGGCGA GCACGATGGG CCTCTTGCCG 
ACGCTCACGC AGCTCGGCTA CGCGCTCGGC ATCTTGTTTC TGGTGCCGCT CGGCGACCGC 
TGGGACCGCC GCCGCGTCAT CGTGGCCAAG GCACTATTAC TAATGATGGC CCTGGTCGGC 
GCCGCGCTCG CGCCTTCGAC CGCGTGGCTG CTGGCGGCGA GTCTGGCCAT CGGTCTGTGC 
GCGACCCTGG CCCAGGACAT CGTGCCGGCG GCGGCGACGC TGGCCCCGGG CGCCAGCCGC 
GGCCGCGTGG TGGGCGCGAC CATGACCGGC CTGCTGCTGG GGATTCTGCT GTCGCGCGTG 
GTCGGCGGCG TGGTCGCCGA GGCCTTTGGC TGGCGCGTGA TGTTCGCGGG CGCGGCGCTG 
AGCATCGCCG CGGTGGCGCT GGCCTCGTGG CTGTGGCTGC CGCGCTTCGC GCCGACTACG 
ACGCTCGGCT ATCGCGCGCT GCTGGCCTCG TTGTTGGCGC TGTGGCGGCG CTATCCGGCG 
CTGCGCCGGG CGACCGCGGC GCAGGCGCTC CTGGCCGTGG GCTTCAGCGC GTTCTGGTCG 
ACGCTGGCCA TCATGCTGCA CGAGCCGCCG TTTGAGCTCG GCAGCGCGGC TGCGGGCGCG 
TTTGGCATCG CGGGGGCGGC CGGTGCCCTG GCCGCGCCGT TGGCCGGACG CCTGGCCGAT 
CGCCGGGGAC CGCGCTGGGT CGCGCAGTCC GGCGCGCTCA TCGCCTGCGT GTCGTTTGCG 
GCCATGTTGC TGGCGCCGCT GGTGTCGCCG CAGATGCAAC TCGGCCTGCT CATGGCGGCC 
GCCCTGGGCT TTGATCTCGG CATCCAATCG GCCCTCATCG CCCATCAGAC CATTGTCTAT 
GATCTCGAGT CCGGGGCCCG CAGCCGCCTC AACGCCGTGC TCTTCGTCGG CATGTTCGCG 
GGCATGGCGG CCGGCGCCGC GCTCGGCGGT GTGGCCCTGG CCCGCTGGGG CTGGCAGGCG 
GTCGTCGCCC TGGCCGCGCT CACGGCCGGC GGCGCCTACG CGCTGCGCCG CTGGGCGCGC 
TGA

Protein sequence

MQASIGIANT VERSEVHAGH RAPATAAAAP APDTGPPASL VALLAASAGF AVAALYYSQP 
ILGVLGADLG ASASTMGLLP TLTQLGYALG ILFLVPLGDR WDRRRVIVAK ALLLMMALVG 
AALAPSTAWL LAASLAIGLC ATLAQDIVPA AATLAPGASR GRVVGATMTG LLLGILLSRV 
VGGVVAEAFG WRVMFAGAAL SIAAVALASW LWLPRFAPTT TLGYRALLAS LLALWRRYPA 
LRRATAAQAL LAVGFSAFWS TLAIMLHEPP FELGSAAAGA FGIAGAAGAL AAPLAGRLAD 
RRGPRWVAQS GALIACVSFA AMLLAPLVSP QMQLGLLMAA ALGFDLGIQS ALIAHQTIVY 
DLESGARSRL NAVLFVGMFA GMAAGAALGG VALARWGWQA VVALAALTAG GAYALRRWAR