Gene Acry_1047 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acry_1047
Symbol
ID	5159495
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Acidiphilium cryptum JF-5
Kingdom	Bacteria
Replicon accession	NC_009484
Strand	-
Start bp	1167951
End bp	1169168
Gene Length	1218 bp
Protein Length	405 aa
Translation table	11
GC content	72%
IMG OID	640552965
Product	major facilitator transporter
Protein accession	YP_001234182
Protein GI	148260055
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCATCGA TCGCCGCCCC TCCCACCGCC ACGACCGCGA CCGACCGCGA GGCCGCGAAG 
GTCATGGCGG CGGGCATCGC CAGCATGGTC CTCACCGTCG GCCTCGCCCG CTTCCTCTAC 
ACGCCGCTGC TGCCGGTGAT GCAGGAGCAG GCGCATCTCT CCGTCACCGG CGGCGGCTGG 
CTCGCCACCA TCAACTACGC CGGCTACATG ACGGGCACGC TGCTGATCGC CGCGATCGGC 
GACTTGCGCA CCCGTTTCCT GTTCTACCGC GCCCTGCTGG TCATCGCCGT CATCACCACG 
GCGGCGATGG GCCTGACCAC CAGCCTCGTC GCCTGGGCGG TGCTGCGCTT CTTCGCCGGA 
ATGACGGCGG TGGGCGCGCT GCTGCTCGGC ACCGGGCTGA TGCTCGCCTG GCTGCGCCAT 
CACGGCAGGC GGCTCGAACT CGGCGTGCCC TTCGGCGGCC TCGGCCTCGG CATCGTCGTC 
TCCGGCCTGC TGCCGATGGC GATGGCCTTC CGGCTCGACT GGTCCGGCGA GTGGATCGCC 
TCCGGCCTGT TCGGCATCGT CTTCCTGATC CCCGCCTGGA TCTGGATGCC GATGCCCCCG 
CAAGCCGACG CCGCCGGCCC CGCCGCCCTG GCGGACACGC CGCCGGTCGC CCGCTGGATG 
GCGCTGTTCG TCGCCGCCTA TTTCTGCGCC GGCGTCGGCT ATGTCGTCAG CGCCACCTTC 
ATCGTCGCCC TGGTGGCGCA TCTGCCGGCG CTGCGCGGCA TGGGGAACCT GGTCTGGGTC 
GTGGTCGGCC TCGGCGCGAT CCCGACCGCT CCGCTCTGGG ACCGCGTCGC CCGCCGCACC 
GGCGACATCA GGGCGCTGCT CGCCGCCTTC GCCCTGCTCA CGCTCAGCAT CGCAATCGGC 
GCGACCACGC GCGGCGTCGC CCTCTCGCTG GTCGGTGCCG CCCTCTACGG ATGTTCGTTC 
AACGGCATCA CCAGCATGAC GCTGACGATC ATCGGCCGGC TCTACCCGCG CAACCCCTCG 
AAGGCGATGG CGCGGATGAC GATCAGCTTC GGCGCCGCGC AGATCATCGC GCCCGCCGTC 
TCGGGCTATA TCGCCGCGCT CACCGGCAGC TACGACGGCG CGCTGTGGAT GGCCGCCGCG 
GTGATGGTCA CCGGCATGGC CTGCCTGCTG CTGCTCCCGC GCCGGCGCAC CCAGGCGGCA 
GCCGAAGCCG CCGCCTGA

Protein sequence

MSSIAAPPTA TTATDREAAK VMAAGIASMV LTVGLARFLY TPLLPVMQEQ AHLSVTGGGW 
LATINYAGYM TGTLLIAAIG DLRTRFLFYR ALLVIAVITT AAMGLTTSLV AWAVLRFFAG 
MTAVGALLLG TGLMLAWLRH HGRRLELGVP FGGLGLGIVV SGLLPMAMAF RLDWSGEWIA 
SGLFGIVFLI PAWIWMPMPP QADAAGPAAL ADTPPVARWM ALFVAAYFCA GVGYVVSATF 
IVALVAHLPA LRGMGNLVWV VVGLGAIPTA PLWDRVARRT GDIRALLAAF ALLTLSIAIG 
ATTRGVALSL VGAALYGCSF NGITSMTLTI IGRLYPRNPS KAMARMTISF GAAQIIAPAV 
SGYIAALTGS YDGALWMAAA VMVTGMACLL LLPRRRTQAA AEAAA