Gene CPF_0542 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CPF_0542
Symbol	treC
ID	4202044
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium perfringens ATCC 13124
Kingdom	Bacteria
Replicon accession	NC_008261
Strand	+
Start bp	645087
End bp	646754
Gene Length	1668 bp
Protein Length	555 aa
Translation table	11
GC content	28%
IMG OID	638081424
Product	alpha,alpha-phosphotrehalase
Protein accession	YP_694996
Protein GI	261876150
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG0366] Glycosidases
TIGRFAM ID	[TIGR02403] alpha,alpha-phosphotrehalase

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.764323
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAGATT TTAAGAAAAG TGTTGTTTAT CAGATATATC CAAAATCATT TAAGGATTCA 
AATGGAGATG GTCTTGGAGA TTTAAGAGGA GTAATTGAAA AATTAGATTA TCTTAAAAAT 
TTAGGAGTAG ATTATATTTG GATGACTCCA TTTTATGTAT CTCCTCAAAA AGATAATGGA 
TATGATATAG CAGATTATTA TAAAATTGAT CCTAGATATG GAACTATGGA AGATTTTGAA 
GAATTGGTTA AAGAAGCTAA AGGCAGAAAT ATAGATATTA TGCTTGATAT GGTTTTTAAT 
CATACTTCTA CAGAGCATGA ATGGTTTAAA AGAGCTTTAA AGGGCGAAGA AAAATATAAA 
AATTATTACA TTTTTAAAGA AGGAAAAAAA GGAGAACCAC CAACAAATTG GATTTCAAAG 
TTTGGAGGGA ATGCTTGGGA GTATGTTGAG GAGCTAGGAG AGTATTACCT ACATTTATTT 
GATGTTTCAC AGGCTGATTT AAACTGGGAT AATAAAGAAT TAAGAGAAGA AATCTATAAA 
GTGGTGAATT TCTGGATAGA TAAAGGGGTT AAAGGATTTA GATTAGATGT TATAAACCTT 
ATTTCTAAGC CAGAAAAATT TGAAAATGAT TATGAAGGAG ATGGAAGAAG ATTTTATACT 
GATGGGCATA GAATACATGA GTATTTAAAA GAACTTAATG AAAGAACTTT TGGTAAAGAT 
GTAGAAATAG TAACTGTTGG TGAAATGTCA TCAACAACTA TAGAAAACTG TATAAAATAT 
TCTAATCCTA AGGAAAAAGA ATTATCAATG GTATTTAATT TTCATCATTT AAAGGTTGAT 
TATAAAGATG GTCAAAAATG GTCTTTAATG GATTTTGATT TTATTGAATT AAAAAAACTT 
TTTAATAATT GGCAAAGAGG AATGATTAAT GGAGGAGGCT GGAATGCTGT TTTTTGGTGT 
AACCACGATC AACCAAGAGT TAATTCAAGA TTTGGAGATG TAAAGAAATA CTTTAATGAA 
TCTTCAAAAA TGCTAGCGAC TTCAATTCAT ATGATGAGTG GAACTCCTTA TGTATATCAA 
GGAGAAGAAA TTGGAATGAC AAATCCAGGT TTTGAAAGTA TTGAAGAATA TAGAGATGTA 
GAATCAATAA ACTATTTCAA TATTTTAAAA GAAGAGGAAA TTGATGAAAA AGAAATAATG 
GAAATCCTTA AGAGCAAATC AAGAGATAAC TCAAGAACTC CTGTTCAATG GAATGAAGAA 
AAAAATGCTG GGTTTACTAC AGGAACTCCT TGGATAAATA TTGCTAATAA TTATAGAGAA 
ATAAATGTTG AAAGAGCTTT AGAAAATAAG GATTCTGTAT TTTATCATTA TAAGAAACTT 
ATTGAATTAA GAAAGAATGA AGATGTAATA GCCTATGGAG ATTACATTCA GTTTTTAGAA 
GATCATCCTA AAGTTTATGC TTATGAAAGA AATTATAATG GTGAAAAGTT ACTTGTTATA 
AATAACTTCT ATGGAGAAGA GTGCTTAGTA GATTTATCAA AGGAAATTGA AGGGCTAGAA 
AATTACAATA AGAGTATTTT AATATCTAAT TATAAGGATA GTACATTAGA TTTATTAAGT 
TTAAAGTTAA GACCATATGA ATCAATAGTT TATAAATTAG AAAAGTAA

Protein sequence

MKDFKKSVVY QIYPKSFKDS NGDGLGDLRG VIEKLDYLKN LGVDYIWMTP FYVSPQKDNG 
YDIADYYKID PRYGTMEDFE ELVKEAKGRN IDIMLDMVFN HTSTEHEWFK RALKGEEKYK 
NYYIFKEGKK GEPPTNWISK FGGNAWEYVE ELGEYYLHLF DVSQADLNWD NKELREEIYK 
VVNFWIDKGV KGFRLDVINL ISKPEKFEND YEGDGRRFYT DGHRIHEYLK ELNERTFGKD 
VEIVTVGEMS STTIENCIKY SNPKEKELSM VFNFHHLKVD YKDGQKWSLM DFDFIELKKL 
FNNWQRGMIN GGGWNAVFWC NHDQPRVNSR FGDVKKYFNE SSKMLATSIH MMSGTPYVYQ 
GEEIGMTNPG FESIEEYRDV ESINYFNILK EEEIDEKEIM EILKSKSRDN SRTPVQWNEE 
KNAGFTTGTP WINIANNYRE INVERALENK DSVFYHYKKL IELRKNEDVI AYGDYIQFLE 
DHPKVYAYER NYNGEKLLVI NNFYGEECLV DLSKEIEGLE NYNKSILISN YKDSTLDLLS 
LKLRPYESIV YKLEK