Gene GSU1183 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GSU1183
Symbol
ID	2688369
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sulfurreducens PCA
Kingdom	Bacteria
Replicon accession	NC_002939
Strand	+
Start bp	1290337
End bp	1291623
Gene Length	1287 bp
Protein Length	428 aa
Translation table	11
GC content	61%
IMG OID	637125857
Product	O-acetyl-L-homoserine sulfhydrylase
Protein accession	NP_952236
Protein GI	39996285
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2873] O-acetylhomoserine sulfhydrylase
TIGRFAM ID	[TIGR01326] OAH/OAS sulfhydrylase

Plasmid Coverage information

Num covering plasmid clones	3
Plasmid unclonability p-value	0.112948
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCCGACA TCCAAAAAGG CTTCGATACC CTCGCACTCC ACGCCGGCCA GGATCCGGAT 
CCCACGACGC TGTCGCGTGC GGTTCCCATT TACCAGACCT CTTCCTATGC GTTCCGCAGC 
TCCGAACACG CGGCCAATCT CTTTGGTCTC CGGGAGTTCG GCAATATCTA CACGCGGATC 
ATGAATCCGA CCTGCGATGT ACTGGAAAAG CGCCTGGCGG AACTTGACGG CGGAGTGGGC 
GCGCTTGCTC TCGCCTCGGG GCAGGCGGCA ATCACGTATG CGGTGCTTAA CATCGCCGGC 
GCCGGGCAGA ATATCGTCTC CACCAGCTAT CTCTATGGCG GAACCTACAA CCTCTTCCAC 
TATACTCTGC CAAGATTGGG GATATCGGTC CGGTTCGTCG ACACTTCTGA CCCTGAAAAC 
GTCCGTCGGG CCATGGATGA AAACACTCGC CTGGTCTACA CCGAATCGGT AGGGAACCCG 
AAAAACAATG TGGACGACTT CGAGTCCATT GCCCGGATCG CCCATGAGGC GGGAATCCCG 
TTCATAGTGG ACAACACCGT TACCACTCCG TACCTGTTCA GGCCTTTTGA CCATGGGGCC 
GACATCGCCG TCTATTCCCT CACCAAATTC ATCGGTGGCC ACGGTACGAG CATCGGGGGG 
GCGGTGGTAG ACAGCGGACG TTTTCCCTGG AACAACGGCC GGTTCCCCGA GTTCACGGAA 
CCGGATCCCT CCTACCATGG TTTGCGCTAC TGGGAGGCCC TGGGGAACCT CTCCTACATC 
CTCAAGATGC GGATCACGCT CCTGCGCGAT ATGGGGGCCT GCCTCGCGCC GTTCAACGCA 
TTCCTCTTCC TCCAGGGGCT GGAGACCTTG CCGGTGCGCA TGGCACGCCA CGTTGACAAC 
GCGCGTACTG TTGCCGAGTG GCTGGAGCGG CATCCACTGG TCACCTGGGT CAACTATCCG 
GGCCTGCCCA GCCACCGGGA CCACGACAAT GCCGGCAAGT ACCTCCCCAA GGGCGCCGGT 
GCCATCATCG GCTTCGGAGT CAAGGGAGGG CTCGAGGCGG GCAAGAAGTT CATCGACAGC 
GTGAAGCTCC TGTCGCATCT TGCCAACATC GGCGACGCCA AGTCCCTCGT CATCCACCCG 
GCATCCACCA CGCACGAGCA GCTCACCGAT GAAGAGCGTC TCTCGGCCGG GGTAACGCCG 
GATTTCATCC GCCTTTCCGT CGGCATCGAG GATGTGGCCG ACATCATTGC CGACATCGAC 
CAGGCCCTGC ATGCCTCCCA ATCCTGA

Protein sequence

MSDIQKGFDT LALHAGQDPD PTTLSRAVPI YQTSSYAFRS SEHAANLFGL REFGNIYTRI 
MNPTCDVLEK RLAELDGGVG ALALASGQAA ITYAVLNIAG AGQNIVSTSY LYGGTYNLFH 
YTLPRLGISV RFVDTSDPEN VRRAMDENTR LVYTESVGNP KNNVDDFESI ARIAHEAGIP 
FIVDNTVTTP YLFRPFDHGA DIAVYSLTKF IGGHGTSIGG AVVDSGRFPW NNGRFPEFTE 
PDPSYHGLRY WEALGNLSYI LKMRITLLRD MGACLAPFNA FLFLQGLETL PVRMARHVDN 
ARTVAEWLER HPLVTWVNYP GLPSHRDHDN AGKYLPKGAG AIIGFGVKGG LEAGKKFIDS 
VKLLSHLANI GDAKSLVIHP ASTTHEQLTD EERLSAGVTP DFIRLSVGIE DVADIIADID 
QALHASQS