Gene CPR_1574 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CPR_1574
Symbol
ID	4206383
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium perfringens SM101
Kingdom	Bacteria
Replicon accession	NC_008262
Strand	-
Start bp	1764529
End bp	1766226
Gene Length	1698 bp
Protein Length	565 aa
Translation table	11
GC content	30%
IMG OID	642566125
Product	major facilitator transporter
Protein accession	YP_698890
Protein GI	110803512
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID	[TIGR00711] drug resistance transporter, EmrB/QacA subfamily

Plasmid Coverage information

Num covering plasmid clones	4
Plasmid unclonability p-value	0.000345614
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAGAAAA AATCAGTTGG AATTACAATG GCTGTCTTCT TGTTAGGAAT CTTCATGGGT 
GCTATTGACT CTGGTATAGT TTCACCAGCA AGAGATATAA TAGCTAATGG ATTAAAAGTT 
TCACAAAATG CTAGTGTCTG GGTTGTAACA ATATATACCT TAGCATATGC AGTATCAATG 
CCTCTTATAG GAAAACTTTC TGATAAATAT GGTAGAAAAA AAATTTACAT GGTTTCAATA 
ACTCTATTTG GACTAGGTTC TTTACTATGT GGAATATCAG ATTATGTAAA TAGTTATACA 
TTCTTATTAT TTTCAAGAGT TATAGAAGCA GTAGGTGGCG GAGGTATAAT GCCAATAGCT 
ACAGCGTACA TAGGAACATC ATTCCCAGTT GAAAAAAGAG GTTCAGCGCT AGGAATGATT 
GGAGGGGTAT ATGGAATAGC AACAGTTGTA GGACCAACCT TAGGTTCAGG AATACTTTCT 
ATCTTTGGAG ATAAAAACTG GGGATTTTTA TTCTTAGTAA ATGTTCCAAT CAGTATAATA 
ATATTACTTA TGGCAACTAA ATTAGAAGAA AATACTTCTG CACAAGGAAT TAAGAAATTA 
GATGTTTGTG GTTCAGGAGT ATTAACAATA TTAATTTTAT CTTTAATGTA TGGAGCTACA 
AACTTAAAAT TCTATGATTT TGCTAATTCA ATAAAATCAC TAGATGTTTG GCCATATCTT 
TTAATATTTA TAATATCAAT TCCAATATTA GTTTTGGTGG AAAAGAAAGC AGAAGATCCA 
GTAATAAACT TATCTTACTT TACTAATAAG GAAATAGCTA TAACTTTAAT ATTAAGTTTT 
GTTGTAGGTT GTGGATTAAT GGCAACAGTA TTTATTCCTC AATTTAGTGA AAATATATTA 
AGAACACCAA TGGGTAGTGG TGGATATATA GTTACAATAT TTGCAATATT TGTAGGTATA 
GCAGCACCTT TAGGTGGAAA ATTCATAGAT AAAATAGGAG TTAAAAAAGT ACTATTAATA 
GGTATGTCTT TAGTTATAAT AGGTAACCTT TATCAAGGAT ACGTAACAAC TAAACACCCA 
GGTATGGTTA ACTTAATAAT AGGTTTAGCT ATTATGGGAT TTGGCTTAGG ATTCTCTATG 
GGAACACCAA TAAATTACTT AATGCTTAGT TTAGTACCAG ATAATGAGGC TACAGTTGGA 
CAATCAGCAG TATCATTAAT TAAATCCATA GGTATTGCAG TATCACCAAA TATTCTTATT 
AACTTTATAT CAGATGCAGG TAGAAGAGTA CCAGGAGCAT TACAAAAAGT TATGCCACAT 
ATAGATGGAA TGTCTAATAT TATGTCAAAT AGTGGTGGTG CTTCAAATTT TAATAATTCA 
ATGGCAAATG CCAGTGTTAC TAATATATTT AGTCTTATAA AAGAAATGGT ACAATCACAA 
TTTGCAGCTT TAGGAGATAA GTTTTCAAAT AATCCTCATA TGAATATTGG TATGATTGAA 
AAATCATATA TGCAAAGTTT AGATGGAGCT AAAGGTGCAA TAGAAACAGC CTTCCAAAAA 
ACTATGAATA CAGGGTACAC TAAATTATTC GTAACATGTG CTATTATAGC TTTAATAGGG 
CTAATATTAA CAGCTATGTT AAATAATAAT TTAATAACAA TGAAAAATAG AAGATTAGAA 
AAGAAGGAAA AAAACTAA

Protein sequence

MKKKSVGITM AVFLLGIFMG AIDSGIVSPA RDIIANGLKV SQNASVWVVT IYTLAYAVSM 
PLIGKLSDKY GRKKIYMVSI TLFGLGSLLC GISDYVNSYT FLLFSRVIEA VGGGGIMPIA 
TAYIGTSFPV EKRGSALGMI GGVYGIATVV GPTLGSGILS IFGDKNWGFL FLVNVPISII 
ILLMATKLEE NTSAQGIKKL DVCGSGVLTI LILSLMYGAT NLKFYDFANS IKSLDVWPYL 
LIFIISIPIL VLVEKKAEDP VINLSYFTNK EIAITLILSF VVGCGLMATV FIPQFSENIL 
RTPMGSGGYI VTIFAIFVGI AAPLGGKFID KIGVKKVLLI GMSLVIIGNL YQGYVTTKHP 
GMVNLIIGLA IMGFGLGFSM GTPINYLMLS LVPDNEATVG QSAVSLIKSI GIAVSPNILI 
NFISDAGRRV PGALQKVMPH IDGMSNIMSN SGGASNFNNS MANASVTNIF SLIKEMVQSQ 
FAALGDKFSN NPHMNIGMIE KSYMQSLDGA KGAIETAFQK TMNTGYTKLF VTCAIIALIG 
LILTAMLNNN LITMKNRRLE KKEKN