Gene GSU3373 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GSU3373
Symbol	sun
ID	2686993
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sulfurreducens PCA
Kingdom	Bacteria
Replicon accession	NC_002939
Strand	+
Start bp	3707306
End bp	3708652
Gene Length	1347 bp
Protein Length	448 aa
Translation table	11
GC content	65%
IMG OID	637128067
Product	Sun protein
Protein accession	NP_954413
Protein GI	39998462
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0144] tRNA and rRNA cytosine-C5-methylases
TIGRFAM ID	[TIGR00446] NOL1/NOP2/sun family putative RNA methylase [TIGR00563] ribosomal RNA small subunit methyltransferase RsmB

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGAACCAAT CCACTGCCGA CCCGCGCCGT TCGGCTTTTG ATATCCTCGT CCGCATTGAA 
CGGGAGCGAA CCTTCGCCGA ACCGCTCATC GACAGGGAAT TGTCCGGTGG CGCCCTGAAG 
GGACCAGACC GGGGGCTCCT GACCGAGCTC GTCTATGGGG TGCTGCGTCG AACAGCGACC 
CTCGACTACC TGGTGGACCT GTTCTGCGCC ACTCGCGCCG CCAAGCTGGA GCGATCAGTG 
CTGATCCTGC TCCGTCTGGG GCTTTACCAG ATTTTCTTCC TTGACCGGAT TCCGGTGTCC 
GCCGCAGTCA ACGAAACGGT AACGCTGGCC CGTGAAAAAT CACCACGGGC CAGCGGCCTC 
GTAAACGCAG TCCTGCGACG GTCCGACCGG GAACGGTCAT CGATCGCCTG GCCTGACCGG 
GTGCGGGACC CGGCCGGCTA CCTCGCCCTC CGTCACTCCC ATCCCCGCTG GATCGTGGAA 
GGGTGGATCG CCCAGCTGGG GTTCGAAGAG GCGGAGGCGC TTGCCGAGGT CATGGCCGCG 
CCCCCTCCCC TGACCCTCCG GGTCAATACC CTGCGGACCT CCCGCGAGGC ATACCTTGAA 
CTCCTGCGGG AGGCAGGCAC GGAAGCGGAG CCCACGCGCC ATTCCCCCCA CGGCATCCGT 
ATTCTCTCAC GGACAGCGGT GCCGGCGCTG CCGGGCTTTG GCGAGGGGCT CGTCATCGTG 
CAGGACGAAT CCTCTCAACT GGCATCGCTC CTCCTGGAGC CCCGGAGCGG TGAACGGGTC 
CTCGATGCCT GCGCTTCCCC CGGCGGCAAG GCGACCCACC TTGCCCAGAT CATGGCCGAC 
AAGGGAGAGG TCATTGCCTG GGACGTGTCG GAGAAAAAGC TCTCTCCGAT TGCTGAAAAT 
GCCCGCCGTC TGGGCATCGG CATCATTCGG CCCGCCATGG CCGATGCCCG GAATCCGGAG 
CAGAACGCCG CTCCCTTCGA CAGGATTCTG GTGGACGCCC CCTGCTCGGC ACTGGGAGTG 
CTGCGCCGCA CCCCTGAGGG GAAGTGGTGG AAGACCCCTG ACGACGTGGC ACGGCTGGCC 
CAGAGCCAGT GCCGGATACT GGCGGGGGCC GCCTCCCTGC TGAAGCCGGG CGGCACGCTC 
CTCTACTCCA CCTGCTCCAC CACAACGGAC GAAAATGAGT CAATTATCGA GGATTTCCTT 
TCGCGCCGCG CCGATTTTAT GTTAGAAGAC TTGAATTATC TTTTCCCCGG CCTGTCAGAA 
TGCATCACCG ACCGGGGTAT GTTCCGCAGC TGGCCCCACC GCCACGGCAT GGACGGTTTT 
TTCGCCGCCC GCCTGCGTCG GGCCTGA

Protein sequence

MNQSTADPRR SAFDILVRIE RERTFAEPLI DRELSGGALK GPDRGLLTEL VYGVLRRTAT 
LDYLVDLFCA TRAAKLERSV LILLRLGLYQ IFFLDRIPVS AAVNETVTLA REKSPRASGL 
VNAVLRRSDR ERSSIAWPDR VRDPAGYLAL RHSHPRWIVE GWIAQLGFEE AEALAEVMAA 
PPPLTLRVNT LRTSREAYLE LLREAGTEAE PTRHSPHGIR ILSRTAVPAL PGFGEGLVIV 
QDESSQLASL LLEPRSGERV LDACASPGGK ATHLAQIMAD KGEVIAWDVS EKKLSPIAEN 
ARRLGIGIIR PAMADARNPE QNAAPFDRIL VDAPCSALGV LRRTPEGKWW KTPDDVARLA 
QSQCRILAGA ASLLKPGGTL LYSTCSTTTD ENESIIEDFL SRRADFMLED LNYLFPGLSE 
CITDRGMFRS WPHRHGMDGF FAARLRRA