Gene CPF_2004 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CPF_2004
Symbol
ID	4202988
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium perfringens ATCC 13124
Kingdom	Bacteria
Replicon accession	NC_008261
Strand	-
Start bp	2242630
End bp	2244027
Gene Length	1398 bp
Protein Length	465 aa
Translation table	11
GC content	31%
IMG OID	638082873
Product	xanthine/uracil permease family protein
Protein accession	YP_696437
Protein GI	110799866
COG category	[R] General function prediction only
COG ID	[COG2252] Permeases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.461655
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGAAAATA AAATTCATGC TTTAAGGGAA GAAGGAAATT TACGTGTTTT ACCTGAGAAT 
AAAAGTGAAT ATAAGAGAGA ATTCTTAGCT GGAACAACAA GTTTCTTAGC AATGGCTTAT 
ATAATAGCTG TAAATCCATC TATATTAAGC GCAGCAGGAA TGCCAGCAGG TGCTATAGTA 
ACGGCAACAT GTATATCAGC AGTTATCGGA TGTTTAATAA TGGGGTTTTA TGCTAAATTA 
CCTTTTGGAC TAGCTCCTGG AATGGGACTA AATGCATTCT TTACTTTTTC AGTAGTTATA 
GGAATGGGAA TTTCTTGGGA AGTAGCTCTT ACAGCTGTTT TTGTAGAAGG AATAATATTT 
ATACTTTTAT CATTATTTAA AGTAAGAGAG GCTGTTGTTG ATGCAATTCC AATAAATTTA 
AAATATGCAG TTACAGCAGG GATAGGTCTT TTCATAGCTT TCATAGGATT TAATGGAGCT 
GGAGTTGTTA TTGGAAATCC AGATACAATG GTTGCTATGG GACAAGTTGG TCCTAAAATG 
TTAATAGCAA TGGTTGGACT TTGTATAATA GTAATTTTAG AAAAGAAAAA AGTTAAAGGT 
TCAATGCTAG TTGGTATAGT AGTTTCAACT CTTTTAGCTT GGGGATATGC TTTAATAAAT 
ACTGAAGCCG CAGCTAGTAT GGGAATCTAT TTACCAAATG GAATATTTAA ATTTGAATCA 
ATAGCTCCAA TAGCAGGTAA AGTTAATTTT TCATATTTAA CTTCACCACA GCATGTATTT 
AATTTTATAA CTATAGTTTT CACATTTTTA TTTGTTGATT TTTTTGATAC AGTAGGAACT 
TTAATAGGAG TAGCTTCAAG AGCTAATATG TTAGATAAGA AGGGAAGAGT TCCTAATGCA 
GGTAAAGCAT TAATGACAGA TGCTATAGCA ACTACGGCAG GGGCTTTACT TGGAACATCT 
ACTGTAACAG TTTATGTTGA AAGTGCTACT GGAGTTGAAG AAGGTGGTAG AACAGGATTA 
ACAGCTATAA CAATAGGAGC TTTATTTTTC GTAGCAATGT TTTTCTCACC AATATTTGTA 
GCAGTACCAG CATGTGCTAC TGCACCAGCT TTAATATATG TTGGATATTT AATGCTAACT 
AGTGTGTTAA AAATAGATTT TAGTGATATT ACAGATGCAG TACCAGCATT TTTAATAATA 
GCTTTAATGC CTTTAACTTA TAGCATAGGT GATGGATTAA CAATTGGAGT TTTAGCATAT 
GTAATATTAA ATATATTACA CAATATCTTT ACTAAAAATA AAAAAGATAA AAAAGAATTA 
TCAATGGTAA TGATAGTTTT AGCGATTATA TTTGTAATAA AACTTTGTCT ACCATTAATT 
ACACAGATGA TAGGTTAA

Protein sequence

MENKIHALRE EGNLRVLPEN KSEYKREFLA GTTSFLAMAY IIAVNPSILS AAGMPAGAIV 
TATCISAVIG CLIMGFYAKL PFGLAPGMGL NAFFTFSVVI GMGISWEVAL TAVFVEGIIF 
ILLSLFKVRE AVVDAIPINL KYAVTAGIGL FIAFIGFNGA GVVIGNPDTM VAMGQVGPKM 
LIAMVGLCII VILEKKKVKG SMLVGIVVST LLAWGYALIN TEAAASMGIY LPNGIFKFES 
IAPIAGKVNF SYLTSPQHVF NFITIVFTFL FVDFFDTVGT LIGVASRANM LDKKGRVPNA 
GKALMTDAIA TTAGALLGTS TVTVYVESAT GVEEGGRTGL TAITIGALFF VAMFFSPIFV 
AVPACATAPA LIYVGYLMLT SVLKIDFSDI TDAVPAFLII ALMPLTYSIG DGLTIGVLAY 
VILNILHNIF TKNKKDKKEL SMVMIVLAII FVIKLCLPLI TQMIG