Gene CPR_1835 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CPR_1835
Symbol
ID	4204461
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium perfringens SM101
Kingdom	Bacteria
Replicon accession	NC_008262
Strand	-
Start bp	2025699
End bp	2026796
Gene Length	1098 bp
Protein Length	365 aa
Translation table	11
GC content	32%
IMG OID	642566385
Product	GTP-dependent nucleic acid-binding protein EngD
Protein accession	YP_699149
Protein GI	110801535
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0012] Predicted GTPase, probable translation factor
TIGRFAM ID	[TIGR00092] GTP-binding protein YchF

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.259258
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAATTAG GAATGGTTGG ATTACCAAAT GTTGGTAAAA GTACATTATT CAATGCTATT 
ACAAAAGCAG GAGCTGAATC AGCAAACTAT CCTTTCTGTA CAATAGAACC AAACGTAGGT 
GTTGTAAGTG TACCAGATAA GAGATTAGAT GTTTTAGAAA AAATATATAA TACAAAGAAA 
AAAGTATATA CTGCAATAGA GTTTTATGAT ATAGCAGGAT TAGTTAAAGG TGCTAGCAAA 
GGTGAAGGAT TAGGAAATAA ATTCTTATCA CACATAAGAG AAGTTGCAGC TATAGTTCAT 
GTTGTAAGAT GTTTTGACGA TGAGAATGTT GTTCACGTAG AAGGTTCTGT AGATCCAATA 
AGAGATATAG AAACTATAAA CTTAGAGCTT ATCTTTGCAG ACTTAGATGT TCTTGAAAGA 
AGAATGGAAA AGACTATGAA GTTAGTAAGA TCAGGTGATA AAACTGCTAA GTTTGAGTAT 
GATGTAATGG AAAGATTAAA AGCTCACTTA GAAGCAAATA AACCAGCTAG AACTTTAGAA 
GCTACTGAAG ATGAAGAAGC TTTCGTAAAA AGTTTATTCT TAATAACTTC AAAACCAGTT 
TTATATGCTT GTAACATATC AGAAGATGAT ATGATGGAAG GAAACTTAGA TAATGAGTAT 
GTTAAAAAAG TTAGAGCATA TGCTGAAACT GAGAATTCAG GAATCATGGT TGTTTGTGCT 
AAACTTGAAG AAGAATTATC AGGATTAGAT GAAGAAGAAA AAGCTGAAAT GTTATCTGAG 
TATGGATTAG AAGAATCAGG TCTTGATAAA CTTATACAAG CAAGTTATAA ATTATTAGGA 
TTAATGAGTT ACTTAACTGC AGGTGTACAA GAAGTTAGAG CTTGGACAAT AAAACAAGGA 
ACTAAAGCTC CACAAGCAGC AGGTAAAATT CATTCTGATA TAGAAAGAGG GTTCATAAGA 
GCAGAGGTAG TTTCTTATGA TGATTTAGTA GAATGTGGTT CAGAAGCAGC TGCTAAAGAA 
AAAGGTGTTT ACAGATTAGA AGGTAAAGAA TACGTAATGA AAGATGGAGA CATAGTTAAC 
TTCAGATTCA ACGTATAA

Protein sequence

MKLGMVGLPN VGKSTLFNAI TKAGAESANY PFCTIEPNVG VVSVPDKRLD VLEKIYNTKK 
KVYTAIEFYD IAGLVKGASK GEGLGNKFLS HIREVAAIVH VVRCFDDENV VHVEGSVDPI 
RDIETINLEL IFADLDVLER RMEKTMKLVR SGDKTAKFEY DVMERLKAHL EANKPARTLE 
ATEDEEAFVK SLFLITSKPV LYACNISEDD MMEGNLDNEY VKKVRAYAET ENSGIMVVCA 
KLEEELSGLD EEEKAEMLSE YGLEESGLDK LIQASYKLLG LMSYLTAGVQ EVRAWTIKQG 
TKAPQAAGKI HSDIERGFIR AEVVSYDDLV ECGSEAAAKE KGVYRLEGKE YVMKDGDIVN 
FRFNV