Gene CPF_1738 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CPF_1738
Symbol
ID	4202015
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium perfringens ATCC 13124
Kingdom	Bacteria
Replicon accession	NC_008261
Strand	-
Start bp	1959096
End bp	1960064
Gene Length	969 bp
Protein Length	322 aa
Translation table	11
GC content	30%
IMG OID	638082610
Product	hypothetical protein
Protein accession	YP_696174
Protein GI	110800348
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0715] ABC-type nitrate/sulfonate/bicarbonate transport systems, periplasmic components
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.0611482
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGTATTAT TTTCATTAAG TATATTAGTA GGATGTAATA CTTCTAAGAA AGAAGAAGCT 
AAGGCACCAG AAGAAAAAAC ATCCATAGAA ATAGTAGTAC CAGATGGACT TCCAGCTATT 
AGTATAGTTA AAATGATAAA AGAAAAACCA GAAATAATAA AAGGCTTAGA TATAAATTAT 
TCAATAGTAA AGGGATCAGA TGCTTTAGTT TCTAAGGTGT TAAAAGGAGA GGGAGATATA 
TGTATAGTTC CTTCAAATGT AGCTGCTATT GCATATAACA AGGAAGCTAA ATATAAACTT 
GCAGGAACAG TAGGTTTTGG TTCATTATAT GTTATAAGCA GTGATGATTC TGTTAATAGC 
TTAGAAGATC TTAAAGGAAA AGATGTTTAC AATGTTGGTC AAGGATTGAC TCCAGATTTA 
ATATTTAAGA TATTACTTCA AAATGATGGA ATAAATCCTG AAAAAGATTT AACATTAAGT 
TATGTAAATG CAGCTTCAGA ATTAGCTCCT TTATTTATAG AGGGAAAAGC TAAATATGCA 
GTTGTTCCAG AACCTATGTT AACTCAAATA ATGACAAAGA AACCAGAAAC AAAAATAGTA 
GCATCATTAA ATGAACAGTG GAAAAAAATG AGTGATTCAA AAATGGGATA TCCTCAGTCT 
AGTGTTATAG TTAAAGAGGA CCTAGCAAAA AATAATTCAG AGGCTGTTCA AAAGATCTTA 
AAGGAAATAG ATAATAGTAC TAAGTGGGCA AATGAAAATA AAGAAGAAGC AGGTGCCTTT 
GCAGAAGAAG TTGGCATAAC AGGCAAAAAA GAAATAATAG CTAAATCTCT AGAAAGAGCA 
AATTTAAATT ACGTAAGTGC TTTAGATAGT GAAAGTGAAT ATATTAAATA TTATGACAAG 
ATTTACAGCT TAGAGCCTAA AGCTATAGGA GGTAAAAAGA TAAATGAAGA AATTTTCTTA 
CAAAAATAA

Protein sequence

MVLFSLSILV GCNTSKKEEA KAPEEKTSIE IVVPDGLPAI SIVKMIKEKP EIIKGLDINY 
SIVKGSDALV SKVLKGEGDI CIVPSNVAAI AYNKEAKYKL AGTVGFGSLY VISSDDSVNS 
LEDLKGKDVY NVGQGLTPDL IFKILLQNDG INPEKDLTLS YVNAASELAP LFIEGKAKYA 
VVPEPMLTQI MTKKPETKIV ASLNEQWKKM SDSKMGYPQS SVIVKEDLAK NNSEAVQKIL 
KEIDNSTKWA NENKEEAGAF AEEVGITGKK EIIAKSLERA NLNYVSALDS ESEYIKYYDK 
IYSLEPKAIG GKKINEEIFL QK