Gene Acry_1598 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acry_1598
Symbol
ID	5162219
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Acidiphilium cryptum JF-5
Kingdom	Bacteria
Replicon accession	NC_009484
Strand	+
Start bp	1765299
End bp	1766669
Gene Length	1371 bp
Protein Length	456 aa
Translation table	11
GC content	71%
IMG OID	640553513
Product	general substrate transporter
Protein accession	YP_001234723
Protein GI	148260596
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.0615669
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCAGCGTT CCTCCCTCGC CATCCTCGAC GACCAGTCCT TCGGCACCTT CCACTGGCGC 
GCCGTGTTCA CCACCGGCAT GGGCGTGCTC GCCGACGGCT ACGACCTGTC CTCGATCGGC 
ATCGTCCTGC CGACCGTGCT CGCCTCCTTC GGCCTGACGA AGATCGACAG CCTCGAATCC 
GGCCTGCTCG CCGGCTCCGC CCTGGTCGGC GCCGCCCTCG GCGCGCTGAT CTTCGGCTTT 
CTCGGCCAGC GCGGCCGCAA GACCTTCTAC GGGCTCGACG TCGCGCTGAT GGCGATCGCG 
GCGGTCGCCC AGGCCTTCGC CCCCAACCTC GCCTGGCTGA TCGCGATCCG CTTCATCCTC 
GGCATCGGCG TTGGCGCCGA CTACGTGCTC TCCCCCACCA TCATGGCCGA GCACGCCAAC 
CGGCGCGACC GCGGCCGCGC CCTCGGCGTC GGCTTCTGCC TCACCTGGTG GCTCGGCGCG 
GCCCTCGCCG GCCTGCTCGC CCTCGTCCTG CACGCGCTCG GCGTGGCGCC GGACATGGTC 
TGGCGCATCG TCCTCTCCGC CGGCGCGCTG CCCGCGCTCT CGGTGCTCTG GCTGCGCCGC 
CGGATGCCGG AGACCGCGCG CTACCTCGCC CGCGTCGCCG GCGACCAGGA TGCCGCCGAA 
ACCGTCATCC GCGGCATCAC CGGCACCGGC CACGCCGCCC CCGAGGCCGA CCGCCGCGAG 
GTGATGGCGG TGCTCCGCCG CCATGCCGGG CAGATCTTCG CCGCCGCCCT GCTCTGGTTC 
ATCTTCGACA TCGTGATCTA CTCGACCGTC CTGTTCGGCC CCTCGCTGAT CGCCCACGGC 
CTTGGCCTGA GCCCGACGAT GTTCTCCCTG CTGATGACCT TCGCCTTCAT CATGCCGGCG 
GTGCTGATCG GCGCCTTCGC CCTGCTCGAC CGCTTCGGCC GCAAGGCGGT GCAGATCGGC 
GGCTATGCCG GCGCCGCCCT TCTCCTCGTC ATCTTCGCGC TGATCCACAA GGATATCGGC 
CAGAACCCGG TGCTCGGCCT CGTCGTCTAC GGCCTGTTCA ACGTGATGAT CATGGGCCCC 
AGCATGGTCA GCGGCGCGGC GATGCTCGGC GTCGAGCTGA GCCCGACCCG CATCCGCACC 
ATGGCGCAGA GCTTCACCGT GGTCGGCGGC CGCCTCGGCG CCTCGCTCAG CGCCTTCGTC 
TTCCCGCTGG TCTTCGCCAA GCTCGGCGAG GTGGCGGCGA TCGGCGTGCT CGCCGGCCTC 
TCGGTCCTCG GCGCCATCCT CACCTACGCG CTGATCCCCG AGACCGCCGG CCGCTCGCTC 
GAAGACCTGA ACGACGAGGC CGAGGCCCTC GCCCCCGCGG CCGCGCAATG A

Protein sequence

MQRSSLAILD DQSFGTFHWR AVFTTGMGVL ADGYDLSSIG IVLPTVLASF GLTKIDSLES 
GLLAGSALVG AALGALIFGF LGQRGRKTFY GLDVALMAIA AVAQAFAPNL AWLIAIRFIL 
GIGVGADYVL SPTIMAEHAN RRDRGRALGV GFCLTWWLGA ALAGLLALVL HALGVAPDMV 
WRIVLSAGAL PALSVLWLRR RMPETARYLA RVAGDQDAAE TVIRGITGTG HAAPEADRRE 
VMAVLRRHAG QIFAAALLWF IFDIVIYSTV LFGPSLIAHG LGLSPTMFSL LMTFAFIMPA 
VLIGAFALLD RFGRKAVQIG GYAGAALLLV IFALIHKDIG QNPVLGLVVY GLFNVMIMGP 
SMVSGAAMLG VELSPTRIRT MAQSFTVVGG RLGASLSAFV FPLVFAKLGE VAAIGVLAGL 
SVLGAILTYA LIPETAGRSL EDLNDEAEAL APAAAQ