Gene Ppro_2337 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ppro_2337
Symbol
ID	4574497
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Pelobacter propionicus DSM 2379
Kingdom	Bacteria
Replicon accession	NC_008609
Strand	-
Start bp	2523418
End bp	2524341
Gene Length	924 bp
Protein Length	307 aa
Translation table	11
GC content	63%
IMG OID	639756387
Product	CRISPR-associated Cas1 family protein
Protein accession	YP_902002
Protein GI	118580752
COG category	[L] Replication, recombination and repair
COG ID	[COG1518] Uncharacterized protein predicted to be involved in DNA repair
TIGRFAM ID	[TIGR00287] CRISPR-associated endonuclease Cas1 [TIGR03638] CRISPR-associated endonuclease Cas1, ECOLI subtype

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.00747033
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCCGAAC CAATTCTTCC TCCCCTGAAA CCGCTCCCCA TCAAGGACCG CATCTCGGTG 
ATCTATGTGG AGCGTGGCAA CCTGGATATC CTTGACGGGG CGTTCGTGGT GGTGGATGCC 
ACCGGCGTGC GTACCCACAT ACCCATCGCT ACGGTGGCCT GCCTGATGCT GGAACCGGGG 
GCGCGGGTGT CACATGCGGC CGTTGTGCTG GCGGCGCGGG TAGGGTGCCT GCTGGTCTGG 
ATCGGAGAGG CCGGGGTGCG GTTGTACGCG GCGGGACAAC CGGGAGGGGC TCGTTCCGAT 
CGGTTACTGT ACCAGGCCAA GCTGGCTCTG GACGATACGG CCCGGCTCAA GGTGGTGCGC 
AAGATGTACG CCCTGCGCTT CAAGGAGGAA CCGCCTGAAC GGCGCAGCGT GGAACAGTTG 
CGCGGAATCG AAGGGGTGCG GGTGCGCAAG ATGTACGAAC TGCTGGCCCG CCAGTACGGT 
GTGGAGTGGA AAAACCGTAA TTATGATCAT AGCGAATGGG GGAGCGGCGA CCTGCCCAAC 
CGCTGTCTCT CGTCGGCCAC CGCCTGTATT TACGGTATCT GTGAGGCCGC CATTCTGGCG 
GCGGGGTATG CGCCTGCCGT GGGGTTCATT CACACCGGCA AGCCGCAGTC TTTTGTCTAC 
GATATCGCCG ATATCTTCAA GTTCGAGACG GTGGTGCCGG TGGCTTTCCG TGTTGCCGCC 
AAAAAGCCGC GCAACCCGGA GCGGGAGGTG CGGCTGGCTT GCCGGGATTC GTTCCGCCAG 
ACCAAACTTT TGCAGCGGAT TATCCCCACC ATTGAGCAGG TGCTGGCCGC TGGTGAAATG 
GAGCTGCCCA AGGCGCACGA GGAGGCGGTT GCGCCGGCCA TACCCAACAA GGAGGGGATC 
GGGGATGCTG GTCATCGTGG TTGA

Protein sequence

MAEPILPPLK PLPIKDRISV IYVERGNLDI LDGAFVVVDA TGVRTHIPIA TVACLMLEPG 
ARVSHAAVVL AARVGCLLVW IGEAGVRLYA AGQPGGARSD RLLYQAKLAL DDTARLKVVR 
KMYALRFKEE PPERRSVEQL RGIEGVRVRK MYELLARQYG VEWKNRNYDH SEWGSGDLPN 
RCLSSATACI YGICEAAILA AGYAPAVGFI HTGKPQSFVY DIADIFKFET VVPVAFRVAA 
KKPRNPEREV RLACRDSFRQ TKLLQRIIPT IEQVLAAGEM ELPKAHEEAV APAIPNKEGI 
GDAGHRG