Gene GSU1005 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GSU1005
Symbol
ID	2685628
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sulfurreducens PCA
Kingdom	Bacteria
Replicon accession	NC_002939
Strand	-
Start bp	1085392
End bp	1086369
Gene Length	978 bp
Protein Length	325 aa
Translation table	11
GC content	65%
IMG OID	637125675
Product	dihydrouridine synthase family protein
Protein accession	NP_952059
Protein GI	39996108
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0042] tRNA-dihydrouridine synthase
TIGRFAM ID	[TIGR00737] putative TIM-barrel protein, nifR3 family

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.667167
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATCCGTT CTCTTACCAT AGGCTCCCTG ACCCTGGGAA ACAATCTCAT CCTCGCCCCC 
ATGGCCGGGA TAACCAACCT TCCCTTCCGC CTCCTGGCCC GCGAACAGGG GGCAGGTCTC 
TGCTTCACCG AGATGGTGAG CGTGAACGGC CTTGTCCGGG AAGGTAAAAA GAGTTTCGAA 
CTCCTGCGGA GCGTGCCGGG GGATCGCCCC CTCGGCATCC AGCTTTTCGG GGACGACCCG 
GACGTCATGG GCCGGGTGGC GGCCACTGTG GACGGATACG GGGACCTCAT CGACATCAAC 
ATGGGATGCC CCGTGAAGAA GGTGGTGGGG ACCGGCGCCG GGAGCGCCCT CATGCGTGAG 
CCGGACAAGG TGCGGGCCAT TGTCAGGGCC GTCCGGCGAG CCACGCGGCT GCCGCTGACC 
GTGAAGATCA GGAGCGGGTG GAGCTGCGAA GATGCCAACT TTATCCAGAT TGCCCGGATT 
GCCGAGGAAG AGGGATGCAA TGCAGTTACG CTCCATCCCC GGAGCAGGGC ACAGATGTTC 
GAAGGCACGG CCGACTGGAC GAAGCTCGCC GAACTGAAGC AGGCCGTCGC CATACCGGTC 
ATCGGCAGCG GCGACCTCTT CAGCGCGGCC GACGTGGCCG CCATGCTCGA CCGGACCGGC 
TGCGACGGGG TCATGATCGC CCGAGGTGCT CTGGGAAATC CGTGGATCTT CAGGCAGGCC 
CTGGACCTGA TGGCCGGACG CGAGCCGGCG GCGGCCTCCC CGGCCGAACG GTTGGCGGTG 
GCCCGGAGGC ATCTGGCCCT GTTCACGGAA ATGGCCGGCG AACGGGTAGC CGCGAGAGAG 
ATGCGCAAGC ACCTGGGGTG GTACTCCCAC GGACTCCCCG GTGCGGCACA GTTCCGGAAG 
GAAATCAACG AGATTGAGGG CAATGGCGCC CTGATGGAAG CAGTGAGCCG CTTTTTCACG 
GCTGTGGGGG CGCCATGA

Protein sequence

MIRSLTIGSL TLGNNLILAP MAGITNLPFR LLAREQGAGL CFTEMVSVNG LVREGKKSFE 
LLRSVPGDRP LGIQLFGDDP DVMGRVAATV DGYGDLIDIN MGCPVKKVVG TGAGSALMRE 
PDKVRAIVRA VRRATRLPLT VKIRSGWSCE DANFIQIARI AEEEGCNAVT LHPRSRAQMF 
EGTADWTKLA ELKQAVAIPV IGSGDLFSAA DVAAMLDRTG CDGVMIARGA LGNPWIFRQA 
LDLMAGREPA AASPAERLAV ARRHLALFTE MAGERVAARE MRKHLGWYSH GLPGAAQFRK 
EINEIEGNGA LMEAVSRFFT AVGAP