Gene Caci_8042 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caci_8042
Symbol
ID	8339420
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Catenulispora acidiphila DSM 44928
Kingdom	Bacteria
Replicon accession	NC_013131
Strand	+
Start bp	9334468
End bp	9335778
Gene Length	1311 bp
Protein Length	436 aa
Translation table	11
GC content	69%
IMG OID	644961127
Product	major facilitator superfamily MFS_1
Protein accession	YP_003118706
Protein GI	256397142
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	33
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATCACGC GGGGGGCAAA CGCGGAGGCG GACAGTATCG CGGCTCGTCA TGACACTCCG 
AAGCACACGC CCAGCTGGCT CCGCCGCGCG CTGCCGGACA CCGGACCGCA GCGCGCGCTG 
GTGATGTCGA GTTTCGTGAA CCGCATCGGC ACCGGGATGT TCCTGGCGAC CTCCGCTTTG 
TACTTCACGG TGATCGTGGG CATACCGGCG CGACAAGTCG GCACGGGGTT GAGCATCGCC 
GGTCTGGCCG CACTGCTCGG CTCGGTTCCG GCGGGGACGC TCGCCGACCG CGTCGGTCCG 
CGCACCGTCC AGCTGGTCAC GCTCGCGGTG CAGACCGTCA CGATGGCGCT GTTCGTAGTC 
GTGCACTCGT GGTGGGCGTT CACCGTGGTG GCGGCTTTGG ATTACGTCGC GGACGCGGCG 
AACAACGCGG CGCGCGGGGC GTTGATAGGC CGCATCGGGG GCGAGCGGCC GGGACTGTTC 
CGCGCGAAGC TGCGGACGTT CGTGAGCGTC GGGGTGGTCG CCGGAACGCT GCTCGCGGCG 
GTCGCGATCC AGATCGGGAC GCGCGGCGCG TATGTCACGG TGATTCTGGT GAACGCGGTG 
TCGTATGTGG TCTGCGCGCT GTTGCTGCTG CGGGTCCCGA ACTTCGGGGC GTTGCCGAAG 
CCTGCCGGAA CGCGGCGGTT CGCGGCGTTG GCGGACCGGC CGTATGCGGC GTTCGCGGCT 
CTCAATGGTC TGATCAACCT GCAAGCGGTC GTGGTGACGC TGGTGATTCC GCTGTGGATC 
GCGTCGCGGA CACAGATCCC GCATTGGGCT GCCGCTGCGG TGTTCGGGCT GAACTTCTTG 
GTGGGCACGG CGCTGATGCA GCCGGTGGGT CGGCGTATAA AGACGACGGA GCAAGGCGGA 
AAAGCAATGC GCGTCGCCGG GCTCGCGATC GCCGTCGGCT GCGCGGTGTT GGCTGGAAGC 
AACTCGGGAC CGCGATGGTC CGAGACGCTG GTGTTGTTCG TGGGCGCAGC GGTGTTGTGC 
GCCGCCGGGG TGTGGGTGAC CGCCGCCGGT TTCTCGCTGA GTTTCGAGCT GGCGCCCGCT 
CACGCGCAGG GGCAATACCA AGGCGTCACG CTGCTCGGGC TTGACGCCGC GGGCGCTGTC 
GGACCGGCGT TGCTGACCGC GCTGGTGCTG GGACTCGGCG CGCCGGGGTG GGTGGTGCTC 
GGTCTGGGCT TCGCCGCCGC CGGGCTGATG GGACCGGCGG TGACGCGATG GGCTGAGCGG 
ACTCGGCCGA CGGTTGTCAG TGTCGGCGAT GCCGCGCCGG AACCGGCTTA G

Protein sequence

MITRGANAEA DSIAARHDTP KHTPSWLRRA LPDTGPQRAL VMSSFVNRIG TGMFLATSAL 
YFTVIVGIPA RQVGTGLSIA GLAALLGSVP AGTLADRVGP RTVQLVTLAV QTVTMALFVV 
VHSWWAFTVV AALDYVADAA NNAARGALIG RIGGERPGLF RAKLRTFVSV GVVAGTLLAA 
VAIQIGTRGA YVTVILVNAV SYVVCALLLL RVPNFGALPK PAGTRRFAAL ADRPYAAFAA 
LNGLINLQAV VVTLVIPLWI ASRTQIPHWA AAAVFGLNFL VGTALMQPVG RRIKTTEQGG 
KAMRVAGLAI AVGCAVLAGS NSGPRWSETL VLFVGAAVLC AAGVWVTAAG FSLSFELAPA 
HAQGQYQGVT LLGLDAAGAV GPALLTALVL GLGAPGWVVL GLGFAAAGLM GPAVTRWAER 
TRPTVVSVGD AAPEPA