Gene GSU0053 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GSU0053
Symbol
ID	2688405
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sulfurreducens PCA
Kingdom	Bacteria
Replicon accession	NC_002939
Strand	+
Start bp	69225
End bp	70316
Gene Length	1092 bp
Protein Length	363 aa
Translation table	11
GC content	54%
IMG OID	637124718
Product	hypothetical protein
Protein accession	NP_951115
Protein GI	39995164
COG category
COG ID
TIGRFAM ID	[TIGR02570] CRISPR-associated protein, GSU0053 family, N-terminal domain

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAACGATC TCGTGCAGAA GTATGACCAT TGGTTGGAAA ACTCCGGACC TGCGGCACTG 
GTTATTCGCG AACAACTGAT GCCCGTCGAG GGACGTGACG GTGTGCTGTT TCCAGCGACC 
TTTGCCGATA CCGGCTACAA CATCGACAAA TTCGACGATG GCGGCAATGT CTGCCTGATC 
GACAGTGTCG GGTCCCAGGC AAACAGGATC GAGCCGATCT TCATGACTAA GGATTACGCT 
GGCCTTGTCC CCCAAATAGT GGTCCAGGCG GGAAACAAAA AAGTAAATCT TCTCGAAGCA 
GGGCATCGAG CCGGGGACGC GATTATTCGC TGTTCTGAGT TGCAGCAAAC CCTTAGGGCT 
GCGTTCAACA ACGTTCTGAA TGGCAATGCA GAGCCACTAG CCCGTATAGC ACCCACCTCG 
CTTGTGTTTG GCGTGTGGGA TTCACGAGAT ACCCAAGCCA AATTGCCCAG ACTCGTTGCC 
TCGACCATAA GGGCCTACAA TGTTCGCCCT CTCACCCGCT CTGCCCAGTA TGTGCCGGCT 
GTTGACTACA ACGCCGAAGG GCTTTTGGAA GAGCCCGGTG ACTTGCGAGA TGCTGAAGGC 
AAAGTCAAGA GCAAGCACCC GTTTGCCCAA CGCGGGTTTG TGCATGTCCC GGCGACAGGT 
GCTCTCGGCG GCGTAATCGC CACCGGGGGG ATTCGCCGTG ACGCCACACT CCACCTTGCC 
GCGCTCCGCT TGCTTTCGGC AGGCCAAGAC GAAGCAAAGT CCAAGGCCCT TCGCCGCTAT 
ATACTCAGTC TTGCCTTAAC AGCATTTACT GTGCCTGTAA CTGGCTATCT GCGTCAGGGC 
TGCAATCTTG TGCTCGACCC TGAAAACCCC CTTGAGTTTA AAGAGGTTTT TAATGATGGG 
ACGCGCAATG ACGTCGGTAT TACGCACACC GAAGCGATTG TCTATGCAAA GGCAGTTGCA 
AAGGAGTTTG GCATTGACCC CGAGCGTAAC CTTGACGAAA AAAAAGCCCC GGATCGAGAA 
GTACCGTTTG ACAAGGTACT GGCGAAAAAA GATGTGAGCG ATGCCGGAGG CTCTAAGAAA 
AAAGCAAAAT GA

Protein sequence

MNDLVQKYDH WLENSGPAAL VIREQLMPVE GRDGVLFPAT FADTGYNIDK FDDGGNVCLI 
DSVGSQANRI EPIFMTKDYA GLVPQIVVQA GNKKVNLLEA GHRAGDAIIR CSELQQTLRA 
AFNNVLNGNA EPLARIAPTS LVFGVWDSRD TQAKLPRLVA STIRAYNVRP LTRSAQYVPA 
VDYNAEGLLE EPGDLRDAEG KVKSKHPFAQ RGFVHVPATG ALGGVIATGG IRRDATLHLA 
ALRLLSAGQD EAKSKALRRY ILSLALTAFT VPVTGYLRQG CNLVLDPENP LEFKEVFNDG 
TRNDVGITHT EAIVYAKAVA KEFGIDPERN LDEKKAPDRE VPFDKVLAKK DVSDAGGSKK 
KAK