Gene Caci_8266 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caci_8266
Symbol
ID	8339645
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Catenulispora acidiphila DSM 44928
Kingdom	Bacteria
Replicon accession	NC_013131
Strand	+
Start bp	9577117
End bp	9578532
Gene Length	1416 bp
Protein Length	471 aa
Translation table	11
GC content	72%
IMG OID	644961352
Product	major facilitator superfamily MFS_1
Protein accession	YP_003118930
Protein GI	256397366
COG category	[E] Amino acid transport and metabolism
COG ID	[COG3104] Dipeptide/tripeptide permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.193695
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	0.361913
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCACCA CGACCATCCG CTCCGAGGCA GCCACACCGG CCTCAGACGC CCTGGGAATC 
GCAGCGCTCC CGGACCAGCC GCGCCCGGCG CAGCCGTCGG CCTCACGCCC GAGCCGCCAG 
AGCCGCCCGA GCCGCTCGCG CGCCCCGCTG TCGGTGTTCG CCGGCTTCCC CCGCGCGATC 
TGGGTGGTCT TCGCCGGCAC CGTCGTGAAC CGCGTCGGCT TCCTGGTCGG ACCGTTCCTC 
GTGTTCTTCC TCGGCTCCCG CGGCATCCCC TCGTCACAGA CCCCTTACGT CCTCGGCGCA 
CTCGGCGCCG GCAACCTCGT CGGCCCGGCC GTCGGCGGCT GGCTCGCCGA CCGCCACAGC 
CGCAAGCTGA CCATGCTCGC CGGCCTGCTC GGCACCGCCG CCGCCCAAGG CGCGCTCTTC 
GCCGCCCCGA ACGTCGCGAC CATGGCCCTG GCCGCGATAG CACTGAGCGC CACGGCGACC 
ATGGTGTCGC CGGCGGCATC GGCGATCCTC ACCGACGACG TCGGACCCGC CCGCCGCCGC 
GAAGCCTTCG CCCTGATCGG CTGGGCGGTG AACATCGGCA CGGCCGTCGC CGGAGTCCTC 
GGCGGCTACC TCGCGGCCCA CGGCTACTGG ATGCTGTTCG CGATCGACGC CGGAACCTCG 
CTGGGATACG CGGTGATCGT CGCGATGCTG CTCCCGGCGG ACCGCACGCG CCACGACGCT 
TCCCAGACCC CTGAGTCCCT GACGTCTGCT TCCCAGACTC TCGCCGCTCA GAGCTCAGAT 
TCCCCGACCT CTGCCGCCAC CCCCACCAGC TCCGGCTACG GCATCGTCTT CCGCGACCGC 
CTGACCCGCA GACTCCTCAT CCTGTTCGCC GTCCAACTCT TCATCTACTC CCTGACCGAG 
AGCGCCCTCC CCCTCGCCAT CCGCACCGAC GGCCTGTCCC CCACCGTCAT GGGCCTGGCC 
GCCGCCGTCA ACGCAGGACT GGTCGTCGCC CTCCAACCCC TGGCCACAAC CCTCGTGTCC 
CGCTTCCCCC GCACCCAGGT CTTCCTCACC GGCGGCATCC TGACCACCAC CGGCATAGCC 
CTCACCGGCC TCGCCCACAC CCCCACCGCC TACGCCGCAA CCGTCACCAT CTGGTCCCTC 
GGCGAAGTCA TCATCGGCGG CATCCCCGCC AGCCTCATAG CCAACCTCGC CCCCGCCACC 
GCCCGCGGCC GCTACCAAGG CGCCTTCAGC TGGGCCTGGG GCGTCTCCCG CTTCCTAGCC 
CTAGCCGCCG GCACAACCGC CTTCACCCTC ATCAGCCCAG CATTCCTCTG GTGGACCGCC 
CTCCTCGCCG GCACCGCCGC CAACATCGGC ATCATGCTGC TCAGCCCGGC GATCGACCGG 
CGGACGTCAG CGATCGACGA GCCGGCCACA CGGTGA

Protein sequence

MTTTTIRSEA ATPASDALGI AALPDQPRPA QPSASRPSRQ SRPSRSRAPL SVFAGFPRAI 
WVVFAGTVVN RVGFLVGPFL VFFLGSRGIP SSQTPYVLGA LGAGNLVGPA VGGWLADRHS 
RKLTMLAGLL GTAAAQGALF AAPNVATMAL AAIALSATAT MVSPAASAIL TDDVGPARRR 
EAFALIGWAV NIGTAVAGVL GGYLAAHGYW MLFAIDAGTS LGYAVIVAML LPADRTRHDA 
SQTPESLTSA SQTLAAQSSD SPTSAATPTS SGYGIVFRDR LTRRLLILFA VQLFIYSLTE 
SALPLAIRTD GLSPTVMGLA AAVNAGLVVA LQPLATTLVS RFPRTQVFLT GGILTTTGIA 
LTGLAHTPTA YAATVTIWSL GEVIIGGIPA SLIANLAPAT ARGRYQGAFS WAWGVSRFLA 
LAAGTTAFTL ISPAFLWWTA LLAGTAANIG IMLLSPAIDR RTSAIDEPAT R