Gene Sfum_1355 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sfum_1355
Symbol
ID	4460525
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Syntrophobacter fumaroxidans MPOB
Kingdom	Bacteria
Replicon accession	NC_008554
Strand	+
Start bp	1682181
End bp	1683233
Gene Length	1053 bp
Protein Length	350 aa
Translation table	11
GC content	62%
IMG OID	639702123
Product	CRISPR-associated Cas1 family protein
Protein accession	YP_845481
Protein GI	116748794
COG category	[L] Replication, recombination and repair
COG ID	[COG1518] Uncharacterized protein predicted to be involved in DNA repair
TIGRFAM ID	[TIGR00287] CRISPR-associated endonuclease Cas1

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.403808
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGAAAGAA CGTACATCCT GGAGCAGGGA GCGTATTTGC GCAAAGCGGG CAATCACCTG 
GTCGTGACCA AGAACCGGGA GATCATAGCG GAGATCCCGC TGGAAGGCCT CAGCCAGCTC 
ACCCTGGTGG GCTTTTCCTC CCTCAGCGGA GCGGTCCTGG AAGTGCTCAT CCGCCACCGC 
ATCGAAACGG TGTTGCTCAG CCCCAGGGGA CAGTTTCGCG CCAGGCTCAT GGTGGATGAA 
CACAAGCACG TCCAACGACG GCAGGGTCAG TACGTCAAGC TTTCCGGGGC CGATTTCGCA 
CTGAGGACCA CTCAGAGCAT CGTCCGGGGA AAGCTGCGAA ACACGGCCCG CTTTCTGGCA 
CTGCGAGGAA GCAGGTACGG GAGCGAGGCG CTCCACCGGG CGGCGGCACA GATCAAGGGA 
CTGTCGGCTC TCGTCGATCG ACAGAAAGAC ATGGACCTGC TGCGCGGGAT CGAGGGGCAT 
GCGGCGAACC TGTACTTCGA AGTGTTCCCG CTCCTCGTCC GGGTCCCGGG TTTTGAATTC 
AACGGCCGCA ACCGGCGTCC GCCCCTCGAC CCGCTCAATG CGCTTCTCTC GTTTGTCTAC 
ACCCTGCTCA CGCAGGAGGT CCTGACGGCC ATCAAGGTCG TGGGGTTGGA CCCTTACCTC 
GGCTGCCTTC ACGCGGTCGA CTACGGCAGG CCCTCGCTGG CCTGCGACCT GGTGGAGGAA 
TGGCGCACTT TCCTGGGCGA CCGGCTCGTG CTGGCGCTCG TCAACCGTCG CGTCATCGGC 
CTCGACGATT TCGTCTACCG TCCCACCCCG TGCGCGGACG CAGTAGACGA AGAGGAGCTG 
AAGCATCGCC GGCCGGTGGA GATGAAACCG AAGATCGCCC GGGCATTCAT CGAAGCTTAT 
GAGAAGTGGA TGGCAAGCCG TATTCTGGAC CCGGGTTCGA GGGAAAGGAC GGACTATCGC 
GGGCTCATTC AGCGCCAGGT CTGGAAATTC TGTCATTATC TCGTGGGGGA CCGCGACTCT 
TATGAGCCGT TCATCTGGTC GGAGGTCTCC TGA

Protein sequence

MERTYILEQG AYLRKAGNHL VVTKNREIIA EIPLEGLSQL TLVGFSSLSG AVLEVLIRHR 
IETVLLSPRG QFRARLMVDE HKHVQRRQGQ YVKLSGADFA LRTTQSIVRG KLRNTARFLA 
LRGSRYGSEA LHRAAAQIKG LSALVDRQKD MDLLRGIEGH AANLYFEVFP LLVRVPGFEF 
NGRNRRPPLD PLNALLSFVY TLLTQEVLTA IKVVGLDPYL GCLHAVDYGR PSLACDLVEE 
WRTFLGDRLV LALVNRRVIG LDDFVYRPTP CADAVDEEEL KHRRPVEMKP KIARAFIEAY 
EKWMASRILD PGSRERTDYR GLIQRQVWKF CHYLVGDRDS YEPFIWSEVS