Gene CPR_1838 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CPR_1838
Symbol
ID	4204650
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium perfringens SM101
Kingdom	Bacteria
Replicon accession	NC_008262
Strand	-
Start bp	2028598
End bp	2029884
Gene Length	1287 bp
Protein Length	428 aa
Translation table	11
GC content	26%
IMG OID	642566388
Product	hypothetical protein
Protein accession	YP_699152
Protein GI	110802341
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	2
Plasmid unclonability p-value	0.00000272519
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAATTT TATTTATAGC TTGTTATTCT CCTATGATAA ATAATTCAGC ATCAATTGAA 
ACTCTTATGT ACTTAAATAA TTTATGTAAT ATAGAGAATA ATTGTGTGCA TCTTTTAACT 
GTAGACTTTC CTAAAAACTC TATATACTAT GATGAGGAAA TATTAAAGCT TTTAGATAGT 
AAAGTAAAGG TTCATGCTAT TGAAGGTGGA AAATTATTTA ATAAGATTAT GCCAAAAAAA 
TCTATAGGGG CAAAGGAAGA TGAGAAGTCT TCTAACACAA AATCTAGTAG TAAAATTAAA 
CTTATGAGGA AGATTAAAAA TAAAATAATT TTTCCTGATA TGTATTATAA CTGGAGCTTT 
AAAGCTTCAA AGTATAGCAT AGAACTTATG AATAAAGAAA AGTTTGATGT TATATTTTCT 
ATGCATGAGC CACCATCTAG TCACCTTTGT GCTTTAAGAA TAAAAAAGCA CTTTAAAGAG 
ATTCCTTGGG TTTTATATTG GAGCGATCCT TGGCTTAAGG ATCCATCAAG AGAGAATATT 
GGTTTTATAA GAAAATTCAT AGAAGGTAGA CAAGAAAAAT CAGTAGTATT AAATGGGGAT 
AGACATATAT TTGTAACTGA AGAGAATAAA AAAGATTTTA TGGAAAAATA TAATGTAAAA 
GAAGATAAAA TGTTTATCGT AACTAGGGGA TACAATAAAG CCATATATGA AGAAATTGAA 
AGGGCAGAAA AGCCAGAACT TTTAAAGGAT AATAAGATAA ACTTAATTTA TGCTGGAGAA 
ATTTTCAGTA AAATTAGGGA TTTAAAACCT TTTATAAAAG CTTTAAAAGA ATTAGAGAAA 
AGAGATCAGG AGCTATTTAA TAGATTAAAC ATAATATTTT TTGGAAACAT AGATGATGAA 
AATATTAAAG AAGAATTAAA AAAGTTTTCT AACGTTAGTG TTAATGGAAG AATTGACTAT 
AAGGAAGCTT TAAGATATAT GATACATGGA GATGTTCTTC TTGTTTTAGG AAACAAAAAT 
TCTAAGCAAA TACCTGCTAA AATATATGAC TATTTAGGAA CAAAGAATCT TATTATAGTT 
ATATTAGGAG ATGAAAATGA TCCTATTAAG AATGTTGCAC TTAATAAAGA AAAGTGTATA 
GTTAGTGAAA ATAATTATGA GGCTATAATA GATGACTTAA ATAAATGTAG AGATTTAATA 
GATTCAGGGA AGAAATTTAA GGCAAATGAA GAATATGAAT GGAGTAGTAT AGGTAAGAGG 
CTAAATAATA TACTAAAATT AAAATAG

Protein sequence

MKILFIACYS PMINNSASIE TLMYLNNLCN IENNCVHLLT VDFPKNSIYY DEEILKLLDS 
KVKVHAIEGG KLFNKIMPKK SIGAKEDEKS SNTKSSSKIK LMRKIKNKII FPDMYYNWSF 
KASKYSIELM NKEKFDVIFS MHEPPSSHLC ALRIKKHFKE IPWVLYWSDP WLKDPSRENI 
GFIRKFIEGR QEKSVVLNGD RHIFVTEENK KDFMEKYNVK EDKMFIVTRG YNKAIYEEIE 
RAEKPELLKD NKINLIYAGE IFSKIRDLKP FIKALKELEK RDQELFNRLN IIFFGNIDDE 
NIKEELKKFS NVSVNGRIDY KEALRYMIHG DVLLVLGNKN SKQIPAKIYD YLGTKNLIIV 
ILGDENDPIK NVALNKEKCI VSENNYEAII DDLNKCRDLI DSGKKFKANE EYEWSSIGKR 
LNNILKLK