Gene Caci_4579 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caci_4579
Symbol
ID	8335933
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Catenulispora acidiphila DSM 44928
Kingdom	Bacteria
Replicon accession	NC_013131
Strand	+
Start bp	5211136
End bp	5212731
Gene Length	1596 bp
Protein Length	531 aa
Translation table	11
GC content	69%
IMG OID	644957680
Product	major facilitator superfamily MFS_1
Protein accession	YP_003115282
Protein GI	256393718
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2271] Sugar phosphate permease
TIGRFAM ID	[TIGR00711] drug resistance transporter, EmrB/QacA subfamily

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	24
Fosmid unclonability p-value	0.375982
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCCGAAG CCGCACCGGT CCACGGCCGG TCGAAGAACC TCGTCCTGGC GGCGATGATC 
TTCGCGGTCG CGATGACCTT CATCGACCAG ACCATCGTCT CCATCGCGGT GCCGGAGATC 
CAGACCAAGC TGGGGCTGTC GGCGACCGGC GTGCAGTGGG CGGTCAACGC CTATCTGCTG 
GCGCTGGCCT CGCTGTTCGC GTTCGGCGGC CGGCTGGCCG ACACGCTGGG GCACCGCAAG 
ATGGTGACGG TCGGCGTCAT CATCTTCGCC GGCGCCTCCG CGCTGTGCGG CGCCACGCCG 
AAGGGCTCGC TGGCCGAGGC CTGGCTCATC GCCTTCCGGG CGCTGCAAGG TCTGGGCGGT 
GCGATCATGT TCCCGGCGGC GCTGGCGATC GTCGTGCAGA CCTACGAGGT GCGCGAGCGG 
GGCAAGGCAC TGGCCACGTT CTTCGGCATC TCCGGCGCGC TGACCGCGAT CGGCCCGATC 
ATGGGCGGCT TCCTCACGCA GTGGACCTGG CGCGCGATCT TCTGGGTCAA TCTGCCGGTC 
GCGGCGATCG CGATCCTGCT CATCGCGCTG TCCAAGCCGG TCACCGACTT CCGCCCGGCC 
AAGATGGACT ACCGCGGGCT CGCGCTGATC ACCGGCGGCA TCGTCCTGGG CGTCTTCGGC 
TTCCAGCAGG CTCCGCTGTG GGGCTGGACC AACCCGGCGA TCGGCCTCTG CATCGCCGCC 
GGCCTCATCC TGCTCATCGT CTTCTACCGG GTCCAGCGCC GGACCTCCTC GCCGCTGATC 
GACATGGACA TCTTCCGCAA CCGCACGTTC CTGGTCGAGA ACATGGTCCT GGGCGTGGCG 
ATGCTGGTGT TCGTCCCGCT GTTCCTGTTC TCCAGCGAGT ACGCGCAGAT CTCCCTGGGC 
AAGGAGGCCA AGGACGCCGG CGTGTTCCTG CTCTTCTTCT TCATCGGCTT CGCCGTCGCC 
ACCCAGATCG GCGGCCGCAT GCTGGACCGC ATCGGCGCCA AGCGCCCGGT CAGCATCGGC 
TGCGCGGTGG CCGCGGTCGG CTTCTTCCTG TGGGCGCAGA AGGTCACCAC GCTGGACTTC 
GGCAAGCAGC AGTGGTTCAT CGTCCTGGCC GGCGCCGGCA TGGGCCTGAT GCTCTCCCCG 
GCCAGCACCG ACGCGGTGAA CCAGGCCGGC CGCTACTCCT ACGGCGAGGC CACCGGCATC 
ACCCAGACCA TCCGCAACTA CGCGGCGAGC CTGGGCCTGG CGGTCCTCGG CACGACGCTG 
GTGACCCGGA TGCGCACGAA CGTCGCCGAC CAGATGGTCG CCGAGCTGCA CGTCCCGCGC 
GCCGTCGCCG ATCAGCAGGC GGCGAGCCTG GCACAGATGC AGGGCGGCAA GTCCTCCGGC 
GGCTCCTCGG GCGGCGGAAC CACCGACCTG TCGCAGATCC CGCACTTCTA CCGGCTGGCC 
TTCGCCCAGT CGACCGAGAC GATCTTCTAC ATCATGGCCG GGATCATGGC AGTGGCCGCG 
GTCATCGCCT TCGTCGGTCT CCAGGGCGGC GTCGCCCCGC AGACCGCCGA CGAGGCCGAA 
GTCACCGCTC CGGTTCCGAC TCCGGGCGCA GCGTAA

Protein sequence

MSEAAPVHGR SKNLVLAAMI FAVAMTFIDQ TIVSIAVPEI QTKLGLSATG VQWAVNAYLL 
ALASLFAFGG RLADTLGHRK MVTVGVIIFA GASALCGATP KGSLAEAWLI AFRALQGLGG 
AIMFPAALAI VVQTYEVRER GKALATFFGI SGALTAIGPI MGGFLTQWTW RAIFWVNLPV 
AAIAILLIAL SKPVTDFRPA KMDYRGLALI TGGIVLGVFG FQQAPLWGWT NPAIGLCIAA 
GLILLIVFYR VQRRTSSPLI DMDIFRNRTF LVENMVLGVA MLVFVPLFLF SSEYAQISLG 
KEAKDAGVFL LFFFIGFAVA TQIGGRMLDR IGAKRPVSIG CAVAAVGFFL WAQKVTTLDF 
GKQQWFIVLA GAGMGLMLSP ASTDAVNQAG RYSYGEATGI TQTIRNYAAS LGLAVLGTTL 
VTRMRTNVAD QMVAELHVPR AVADQQAASL AQMQGGKSSG GSSGGGTTDL SQIPHFYRLA 
FAQSTETIFY IMAGIMAVAA VIAFVGLQGG VAPQTADEAE VTAPVPTPGA A