Gene CPF_1028 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CPF_1028
Symbol
ID	4201164
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium perfringens ATCC 13124
Kingdom	Bacteria
Replicon accession	NC_008261
Strand	-
Start bp	1179642
End bp	1180868
Gene Length	1227 bp
Protein Length	408 aa
Translation table	11
GC content	34%
IMG OID	638081909
Product	multidrug resistance protein
Protein accession	YP_695474
Protein GI	110799410
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID	[TIGR00880] Multidrug resistance protein

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.0302699
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACTAAAT TTAAATCATA TAATAAAGAA AAAAATGAAG AAACATTGGA TAAGAAGGCT 
TTCATCTTTG GTCTTATGTC TGTATTTCTT TGTGGAATGG GCTTTAGTAT TATATCCCCT 
GTTGTTCCAT TTTTAGTGGA GCCTTATGTA AGCAATACTA GTGAACAAGC TTTCTTCGTT 
ACTCTACTAA CCTCAGTTTA TGCAGTTTGT GTATTTTTTG TAGCTCCTGG ACTTGGTGCT 
TTAAGTGATA GATATGGACG TCGCCCCATA CTTTTAATAT GCCTTTTAGG TTCCTCAATT 
GGATACTTAA TCTTTGGTAT AGGTGGCTCT ATATGGGTAC TATTTCTTGG ACGTATAATA 
GATGGTGTAA CAGGTGGGAG CATAAGCACA ATTTTTGCAT ATTTTGCAGA TATAACTCCT 
AAGGAAGAAA GGACTAAATA CTTTGGATGG ATAAGTGCAA GTGCAGGTAT AGGTGCTGCC 
ATTGGCCCTA CTCTAGGTGG AGCGCTTGCC AAATTTGGCT ATGCTGTGCC AATGTATTTT 
GGAGCAATAA TAACCTTATT AAACTTTATT TATGGAATCT TATATATGCC TGAAAGTCTT 
CATGAAAATA ATAAGCTTAA GAAAATCACC CTTGTAAGAC TTAATCCATT TACACAGCTT 
ATGAGTGTAC TTTCTATGAA AAACTTAAAA AGACTACTTA TTTCAGCCTT CTTAATTTGG 
ATACCTAATG GATCTTTACA ATCAATTTTT TCACTATTTA CAATGGATAC TTTCAATTGG 
ACACCTACAT TAATAGGACT TATGTTTTCA ATTATGGGTA TTCAAGATAT TATTTCACAG 
GGCTTAATAA TGCCAAAGCT TTTAATGAAA CTTAGTGATG TAAAGATAGC AATCCTTGGA 
ATGGTCTCTG AGATTATAGG ATATGCTCTT ATTGCAGCAT CAGCTATTTT CACATTCTAT 
CCTTTTTTCA TAGTTGGCAT GTTTATATTT GGTTTTGGAG ATTCAATTTT TGGTCCCTCA 
TTTAATGGAA TGCTCTCTAA GTCTGCTAAT TCTAGTGAAC AAGGAAGGAT TCAAGGAGGT 
AGCCAAGCTC TTCAATCTCT AGCAAGAATA ATTGGCCCTA TTTTAGGAGG ACAAATCTAT 
GTATCTCTAG GTCATTCCTC CCCTGCTTTT ACGGGTATGA TTCTAATAAT ATTGGCCATA 
CCAATTTTGT ATAAGAGTAT TAGATAG

Protein sequence

MTKFKSYNKE KNEETLDKKA FIFGLMSVFL CGMGFSIISP VVPFLVEPYV SNTSEQAFFV 
TLLTSVYAVC VFFVAPGLGA LSDRYGRRPI LLICLLGSSI GYLIFGIGGS IWVLFLGRII 
DGVTGGSIST IFAYFADITP KEERTKYFGW ISASAGIGAA IGPTLGGALA KFGYAVPMYF 
GAIITLLNFI YGILYMPESL HENNKLKKIT LVRLNPFTQL MSVLSMKNLK RLLISAFLIW 
IPNGSLQSIF SLFTMDTFNW TPTLIGLMFS IMGIQDIISQ GLIMPKLLMK LSDVKIAILG 
MVSEIIGYAL IAASAIFTFY PFFIVGMFIF GFGDSIFGPS FNGMLSKSAN SSEQGRIQGG 
SQALQSLARI IGPILGGQIY VSLGHSSPAF TGMILIILAI PILYKSIR