Gene Elen_1976 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Elen_1976
Symbol
ID	8416287
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Eggerthella lenta DSM 2243
Kingdom	Bacteria
Replicon accession	NC_013204
Strand	-
Start bp	2314538
End bp	2315437
Gene Length	900 bp
Protein Length	299 aa
Translation table	11
GC content	60%
IMG OID	645024953
Product	CRISPR-associated protein, Csd2 family
Protein accession	YP_003182329
Protein GI	257791723
COG category	[L] Replication, recombination and repair
COG ID	[COG3649] Uncharacterized protein predicted to be involved in DNA repair
TIGRFAM ID	[TIGR01595] CRISPR-associated protein, CT1132 family [TIGR02589] CRISPR-associated protein, Csd2 family

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.856064
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	52
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCGATA CGATCAAGAA CCGTTACGAC TTCGTCGTGT ACTTCGATGT GGAGAACGGT 
AACCCCAACG GCGATCCCGA TGCCGGCAAC ATGCCGCGCA TCGATCCCGA GACGAGCCTC 
GGCATCGTGA CTGACGTGTG CTTGAAGCGC AAGATCCGCA ACTACGTGGA GACGGTGAAG 
GAAGGCGAGC GGGGTTTCGA GATATACATC AAGGACGGCG TGCCGCTCAA TGCGAGCGAC 
CGACGGGCGC TCGACGAGTT CGGCGTGGGA ACCGATGATA AAGCCATCAA AAAACTCAAG 
AAAGACGATC CTGCGCTCGA CGAGAAGATT CGCGATTTCA TGTGCGAGAC ATTCTATGAT 
GTGCGCACGT TCGGTGCGGT GATGACCACG TTCGTCAAAG GCGCGCTCAA CTGCGGGCAG 
GTGCGCGGGC CGGTGCAGCT GACGTTCGCG CGCAGCGTCG ATCCTATCAT TCCGCAGGAG 
GTCACCATCA CGCGCGTAGC CATCACCACC GAAGCCGATG CCGAGAAGAA GGGCACCGAG 
ATGGGTCGCA AGTACGTGGT TCCCTATGCG CTCTATCGCG GGGAGGGCTA CGTTTCGGCG 
AACTTGGCGC GCAAATCGAC GGGATTCTCG GAGGACGACC TCGCCCTTCT GTGGGATGCT 
ATCGTCAACA TGTTCGAGCA CGATCACTCG GCTGCGCGCG GCAAGATGGC GGTTCGTGCG 
CTCGTGGTGT TCAAGCATGA CAGCGAGCTT GGCAATGCGC CGTCGTACAA GCTGTTCGAC 
GCTGTTTCAA CCCAGAAGAA AGCCGGCGTG GAGGCTCCGC GTTCCATCGA CGACTACGAG 
GAGATCACCG TTGACGAGGG CGCCGTGCCC GAGGGAGTCA CGGTTCTGAG GATGGTGTAG

Protein sequence

MSDTIKNRYD FVVYFDVENG NPNGDPDAGN MPRIDPETSL GIVTDVCLKR KIRNYVETVK 
EGERGFEIYI KDGVPLNASD RRALDEFGVG TDDKAIKKLK KDDPALDEKI RDFMCETFYD 
VRTFGAVMTT FVKGALNCGQ VRGPVQLTFA RSVDPIIPQE VTITRVAITT EADAEKKGTE 
MGRKYVVPYA LYRGEGYVSA NLARKSTGFS EDDLALLWDA IVNMFEHDHS AARGKMAVRA 
LVVFKHDSEL GNAPSYKLFD AVSTQKKAGV EAPRSIDDYE EITVDEGAVP EGVTVLRMV