Gene GSU1387 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GSU1387
Symbol
ID	2687896
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sulfurreducens PCA
Kingdom	Bacteria
Replicon accession	NC_002939
Strand	+
Start bp	1516947
End bp	1518041
Gene Length	1095 bp
Protein Length	364 aa
Translation table	11
GC content	55%
IMG OID	637126062
Product	CRISPR-associated Cse4 family protein
Protein accession	NP_952440
Protein GI	39996489
COG category
COG ID
TIGRFAM ID	[TIGR01869] CRISPR system CASCADE complex protein CasC/Cse4

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAGAACT TCATCAACTT TCACATCCTG ATTTCCCACA GTCCCTCCTG CCTTAACCGC 
GACGATATGA ACATGCAGAA ATCTGCTGTT TTCGGTGGTG AGCGGCGGGT GCGCGTTTCC 
AGTCAAAGCC TCAAACGGGC CATCCGAAAG AGTGATTACT ATCGTCAGCA CCTTGGCGAA 
GCGAGTGTGC GCACCAAGAA GTTGGACGAA CTGATCGCGA TCATAAATGA TCGTCTGGCC 
GGACGCTACG ATACCGACCT CCTGAAGAAG ACTGTTGGGC TGCTGGCCGG CAAGGAGTTA 
AGTGTCGAGG TTGCGACAGA AGGTGATGCC GTGGCGCCGT GGGCAATCGA AGAGGTGGCA 
TGGTTCTGTG AGCAGGTCAA GAGGATGGTG GCGCAAGGAC AGGACGAAAA AGCTCTGGGC 
AAATTGTTGA AGAATGAAAC GGCTGCCATG CGGCAGGCTC TGGCATCCGG TGTTGATATT 
GCACTTTCCG GCCGCATGGC GACGTCAGGT CTCATGAGTG AACTCGGCAA GGTCGATGGT 
GCCTTGGCCG TTGCCCATGT CTTGACCACC CACAGCGTTG ATGCGGATAT CGACTGGTTC 
ACTGCCGTGG ATGACTTGCA GGAACTGGGC TCCGGTCATC TCGATACGCA GGAATTTTCC 
AGCGGGGTCT TTTATCGTTA TGCCAGCCTC AACGTGAAGC AGTTGCAGGA AAACCTGGGC 
AATGCCCCGC GCGAGAAGGC ACTGGAGATC GGCGCTCATC TGCTTCACAT GCTGGCAACG 
ATTGTCCCTT CAGCCAAACA GCAGAGCTTC GCAGCTCACA ACCTGGCCGA CCTTGCCCTG 
GTTTCCTTTT CCGATATCCC GGTATCGCTC GCAAATGCAT TCGAAAAACC TGTCCGTAGC 
GTCAATGGCA GCGGCTTCAA AGAGCCTTCC ATTGCTGAAC TGCATAACTA CTGGCAGCAG 
ATCCATACAG GTTACGGCCT TTCCGAGCGG TGCGGCGAGT TCATCCTCGG TCAGAGTAGC 
GTCCCTGAAG GGATCACCCG GAAGAGTACT ATTGAAGAAC TCAAAACCTG GGTGATGAAC 
AACGGAGAGG GGTAA

Protein sequence

MKNFINFHIL ISHSPSCLNR DDMNMQKSAV FGGERRVRVS SQSLKRAIRK SDYYRQHLGE 
ASVRTKKLDE LIAIINDRLA GRYDTDLLKK TVGLLAGKEL SVEVATEGDA VAPWAIEEVA 
WFCEQVKRMV AQGQDEKALG KLLKNETAAM RQALASGVDI ALSGRMATSG LMSELGKVDG 
ALAVAHVLTT HSVDADIDWF TAVDDLQELG SGHLDTQEFS SGVFYRYASL NVKQLQENLG 
NAPREKALEI GAHLLHMLAT IVPSAKQQSF AAHNLADLAL VSFSDIPVSL ANAFEKPVRS 
VNGSGFKEPS IAELHNYWQQ IHTGYGLSER CGEFILGQSS VPEGITRKST IEELKTWVMN 
NGEG