Gene Hoch_1747 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hoch_1747
Symbol
ID	8544129
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Haliangium ochraceum DSM 14365
Kingdom	Bacteria
Replicon accession	NC_013440
Strand	-
Start bp	2379265
End bp	2380656
Gene Length	1392 bp
Protein Length	463 aa
Translation table	11
GC content	71%
IMG OID	646386454
Product	major facilitator superfamily MFS_1
Protein accession	YP_003266189
Protein GI	262194980
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.192343
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	27
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGACGAGCG AGCCAGAATC CCCGCGCGCC GAGAGCGCGG CCGCGGCGGC CGCCGAGTCC 
GCCGCGGCCG CCGCGGGCTG GCGGCGCTTC GTGCTGCTGT GGCTGGGACA GTCGGTGTCC 
CTCACGGGCT CGAGCCTGAC CTCGTTCGCG CTCGGGCTCT GGGTGTACCA GACCACCGGC 
GCGGTGGCGC AGTTCGCGCT GATCATGCTG TGTAGCGCGC TGCCGCCGAT CCTGCTCACC 
CCGGTCACCG GTCCGCTGAT CGACCGTCAC GACCGGCGGC GCGTCATCTT GCTCAGCGAC 
TCCATCGCCG GCCTGGCCAC GCTGAGCATC GCGCTGTTGC TGTTCAGCGG CAAGCTCGCG 
GTCTGGCACA TCTATCTCAA CGCCATCCTG GTGGCCGTGT GCGGCTCGTT TCAGGCGCCC 
GCGTATGTGG CCTCGATACC GCGCCTGGTG CCCGACCAGC GCCTGTCGCG CGCCAACGGC 
ATGGTGCAAG TCGGCCACGC CTTCGCGCAG CTCTTCACCC CGCTCGCGGC CACCTCACTG 
CTGGCGCTGG CCGGTCTGCA CGCGGTGCTG CTCGTCGACG GCGTCACCTT CCTGTTCGCG 
GTGACCACGC TCCTGCGCAT CCGCCTGCCG GGCCCCGCGA GCGCTCCGGC CGCGCACGCG 
CAGCGCGACG ACTTGCGCAC CGCTCTGCGC GAGGGCCTGC GCTTCATCTG GCAGCACACC 
GCGCTGCGCG CGCTGATTGC GTATCTCGCC GTCACCAACC TGGTCATCGG CATCGTCGAG 
GTGCTGGTGA CGCCGCTGGT GCTGTCGCTG AGCACGGTGC AGATGCTCGG CGTCATCATG 
ACCATCGGCG GCCTCGGCTT CCTGGCCGGC AGCTTGCTCG CCAGCCTGTG GGGCGGGCTG 
CCGCAGCGCA TCCGCGTGGC CCTGGCCTTC GAGGGCCTGT GCGGCGTCAG CCTGGTCCTG 
GCCGGTCTGG TCACCTGGGT GCCGGCGCTG CCCGTCATCG CGTTCTGCTT CTTCTTCGGC 
GTCCCGCTGT TCAGCAGCAT CGCCACCACC CTGCTGCAGC GCCACGTCCC CGACAACCTG 
CGTGGCCGGG TGTTCTCTCT GCTCGGTACC GTCACGCAGG CGTCGGCGCC GCTGGCGTAC 
GCGGTTTCCG GACCGCTGGC CGATCTCGTC TTCGAGCCGG CCATGATGCC GGGCGGCGCA 
CTGGCGGACA TCTTCGGCCC GGTCTTCGGC GTCGGTCCGG GCCGCGGTAT CGGCCTGATG 
TTCGTCGTCT CGGGCGCTCT CACCATACTC ATCTGTGTGC TGGGCGCGCG CTATCGTCCG 
CTGCTCCGGC TTGACACGCG CCCGGCCCAC GCCGACGCTC CCCCCTCCCA ACCACCTTCG 
CGAGATCTAT GA

Protein sequence

MTSEPESPRA ESAAAAAAES AAAAAGWRRF VLLWLGQSVS LTGSSLTSFA LGLWVYQTTG 
AVAQFALIML CSALPPILLT PVTGPLIDRH DRRRVILLSD SIAGLATLSI ALLLFSGKLA 
VWHIYLNAIL VAVCGSFQAP AYVASIPRLV PDQRLSRANG MVQVGHAFAQ LFTPLAATSL 
LALAGLHAVL LVDGVTFLFA VTTLLRIRLP GPASAPAAHA QRDDLRTALR EGLRFIWQHT 
ALRALIAYLA VTNLVIGIVE VLVTPLVLSL STVQMLGVIM TIGGLGFLAG SLLASLWGGL 
PQRIRVALAF EGLCGVSLVL AGLVTWVPAL PVIAFCFFFG VPLFSSIATT LLQRHVPDNL 
RGRVFSLLGT VTQASAPLAY AVSGPLADLV FEPAMMPGGA LADIFGPVFG VGPGRGIGLM 
FVVSGALTIL ICVLGARYRP LLRLDTRPAH ADAPPSQPPS RDL