Gene CPF_0159 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CPF_0159
Symbol
ID	4202395
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium perfringens ATCC 13124
Kingdom	Bacteria
Replicon accession	NC_008261
Strand	+
Start bp	187354
End bp	188841
Gene Length	1488 bp
Protein Length	495 aa
Translation table	11
GC content	32%
IMG OID	638081040
Product	amino acid permease family protein
Protein accession	YP_694623
Protein GI	110799203
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0531] Amino acid transporters
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGTGAGA GAAAAAGGTC GCTTAGTTCA GGGGCTTTAA TGCTTATGAC ATTTACGGCG 
GTATTTTCAT TCGGAAACAT AATTGATAGT AGTGTAAATA TTGGACTAGC TACAATACCA 
TCATACATAT TTGGTACAGT ATTTTACTTT TTACCATTTG CTTTGATGAT TGGTGAGTTT 
GCTTCAGCTA GTTCAGATTC TGAATCAGGT ATAAATAGTT GGATAAAGAA ATCTTTAGGA 
GCAAGATGGG CTTTCTTAGG ATCATGGTCT TATTTCTTTG TTAACTTGTT CTTCTTTACT 
TCATTATTAC CTAAAATATT AATTTATGCA TCTTATACCT TTGTTGGTAG AAACGTATTT 
GATGGAAAAA CAGTATTAAT TTCTGTTATA TCAATAGTAT TATTCTGGGC AGTAACTATA 
ATTTCTACTA AGGGTGTATC TTGGATTTCA AAAATAACAA GTATATCTGG TGTAGCTAGA 
ATAATTTTAG GTTTAGGATT CATAGTATTA TCTTTCGGAG TTATTTTATT CTTAGGAAAA 
GCTCCAGCTC AAGAATTCAC AGCAGAAACT ATTATGCCTA AGTTTAACTG GTCATATTTC 
ATGGTTTTAG CTTGGATTTT ACAAGCAGTA GGTGGTGCTG AAAGTATAGG TGTATATATT 
AAAGACGTAA AGGGTGGAAA TAAAACATTC ATAAGAACAA TGGTAATTTC AACTGCTATA 
GTTGGTGGTC TATATGCACT TGGAGCTGTT TCAGTAGGTT TAGTTGTACC TTCAGAAGTA 
TTACAAGGTA ATTTCTCAAA TGGTTTATTT GATGCCTTTG CAATATTAGG TGCAAACTAT 
GGAGTAGGTA ACATAATAAC TAACATAGTT GGATTCATAA TGATGCTTGC TTCTTTAGGT 
TCATTAGTTT TATGGACTGC AGCACCTGTT AAAGTATTAT TCTCTGAAAT TCCTGAAGGA 
ATCTTTGGTA AATGGATTGC TAAAACAGAT AAAAAAGGAA CTCCTGTAAA TGCTTTATAT 
GTACAAGCTG TAATAGTAAC AGTATTACTA TTAGTACCAG CTTTAGGAAT AGGTTCAGTT 
GATAGCTTAC TTGAAATGTT AATAAACATG ACTGCTTCAA CTTCATTAAT TCCAGTATTA 
TTCTTCTTAG TTGGATACAT TGTATTAAGA GCTAAGAAAG ACCATATGGA AAGATCATTT 
AAAGTTGGAT CTAAAAACTT TGGAATAGCA ATTGGAGTAC TATTACTTGC TTTATTCGTA 
TTCGTATTTG TAATATCTTC AATTCCAGCT CCACAAGACT TTGCAGCTTA CTTTAATGGA 
ACATTAGCAG AAGGAGCAAC AAATCCTGTA TTTATACTTT TATACAATGT ATTAGGATTA 
GTATTCTTCT TAGGTTTTGC TGAAATATGC TGGAGAAAAT ATGAAAAGAA AGTTGGAAAA 
GCTGTAGCTA ATGAATGGGA TCAAGAAGAG GTTTCAGAAA TAGCTTAA

Protein sequence

MSERKRSLSS GALMLMTFTA VFSFGNIIDS SVNIGLATIP SYIFGTVFYF LPFALMIGEF 
ASASSDSESG INSWIKKSLG ARWAFLGSWS YFFVNLFFFT SLLPKILIYA SYTFVGRNVF 
DGKTVLISVI SIVLFWAVTI ISTKGVSWIS KITSISGVAR IILGLGFIVL SFGVILFLGK 
APAQEFTAET IMPKFNWSYF MVLAWILQAV GGAESIGVYI KDVKGGNKTF IRTMVISTAI 
VGGLYALGAV SVGLVVPSEV LQGNFSNGLF DAFAILGANY GVGNIITNIV GFIMMLASLG 
SLVLWTAAPV KVLFSEIPEG IFGKWIAKTD KKGTPVNALY VQAVIVTVLL LVPALGIGSV 
DSLLEMLINM TASTSLIPVL FFLVGYIVLR AKKDHMERSF KVGSKNFGIA IGVLLLALFV 
FVFVISSIPA PQDFAAYFNG TLAEGATNPV FILLYNVLGL VFFLGFAEIC WRKYEKKVGK 
AVANEWDQEE VSEIA