Gene GM21_3245 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GM21_3245
Symbol
ID	8138602
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sp. M21
Kingdom	Bacteria
Replicon accession	NC_012918
Strand	-
Start bp	3774676
End bp	3775959
Gene Length	1284 bp
Protein Length	427 aa
Translation table	11
GC content	57%
IMG OID	644870854
Product	O-acetylhomoserine/O-acetylserine sulfhydrylase
Protein accession	YP_003023029
Protein GI	253701840
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2873] O-acetylhomoserine sulfhydrylase
TIGRFAM ID	[TIGR01326] OAH/OAS sulfhydrylase

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	123
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCAGAAA ATTCGTTCGG ATTCGATACC CTTGCACTTC ATGCCGGCCA GACTGTAGAT 
CCTGCCACCC TGTCCCGTGC CGTTCCGATC TACCAGACAT CATCCTATGT CTTCAAGAAC 
TCCGAACACG CCGCCAACCT CTTCGGGCTC AAAGAGTTCG GCAATATCTA CACCCGTTTG 
ATGAACCCCA CCACCGACGT CCTTGAGAAG AGGGTGGCCG AACTGGATGG TGGTGTCGCC 
GCGCTCGCAG TAGCTTCCGG CCAGGCTGCC ACTACCTATG CGGTGTTGAA CATCGCCAGT 
GCAGGGCAGA ACATCATCTC CACCAGCTAT CTCTATGGTG GTACCTACAA CCTGTTCCAC 
TACACCCTGC CGAAACTCGG CATCACGGTG AAATTCGTTG ACTCCTCCGA CCCGGAGAAC 
ATCCGCAAAG CCATCGATGA GAACACCCGT TTGGTGTACA GCGAGGCCAT AGGCAACCCC 
AAGAACAACG TTGACGACTT CGAGGCCATT GCCAAGGTCG CGCACGATGC GGGCATCCCC 
TATATCGTGG ACAACACCGC GGCAACCCCT TTCGTATTCC AGCCGCTCAA GCATGGCGCA 
GACATCGTCG TCTATTCGCT GACCAAATTC TTGGGAGGTC ACGGAACCAG CATTGGCGGC 
TGCGTAGTCG ATGGCGGAAC CTTTCCGTGG AACAACGGCA AGTTCCCCGA GTTCACCGAG 
CCGGATCCCT CCTACCACGG GTTGAAGTTC TGGGACGCGT TAGGCAACAT TTCCTACATC 
ATCAAGATGA GGGTAGAGCT TCTGCGCGAC ATGGGCGCCT GCATTTCACC CTTCAACGCT 
TTCCAGATCA TCCAAGGCAT AGAGACCCTG CATGTCAGGA TGCAGCGTCA CGTGGAGAAC 
GCGCAGAAGG TCGCCGAATG GTTGGAGCAG AATCCACTGG TGAGCTGGGT CAACTATCCC 
GGTCTGCCGA GCCATAAGGA CCACGCCAAC GCCAAGAAGT ACCTGAACGG CGCAGGTGCC 
ATCATCGGCT TCGGCATCAA GGGAGGCCTT GAGGCAGGCA TGAAGTTCAT CGACAACGTC 
AAGCTGCTGT CGCACCTGGC CAACATCGGC GATGCCAAGA GCCTCGTGAT CCATCCGGCG 
TCCACCACTC ACCAGCAACT CTCCGCAGAA GAGCAATTGG CCACCGGCGT GAGCCCCGAC 
TTCATCAGGC TCTCTATAGG TATAGAAGAC GTCAAAGACA TCATAGCCGA CATAGAGCAG 
GCCCTGAAAG CGGCACAAGC CTAG

Protein sequence

MSENSFGFDT LALHAGQTVD PATLSRAVPI YQTSSYVFKN SEHAANLFGL KEFGNIYTRL 
MNPTTDVLEK RVAELDGGVA ALAVASGQAA TTYAVLNIAS AGQNIISTSY LYGGTYNLFH 
YTLPKLGITV KFVDSSDPEN IRKAIDENTR LVYSEAIGNP KNNVDDFEAI AKVAHDAGIP 
YIVDNTAATP FVFQPLKHGA DIVVYSLTKF LGGHGTSIGG CVVDGGTFPW NNGKFPEFTE 
PDPSYHGLKF WDALGNISYI IKMRVELLRD MGACISPFNA FQIIQGIETL HVRMQRHVEN 
AQKVAEWLEQ NPLVSWVNYP GLPSHKDHAN AKKYLNGAGA IIGFGIKGGL EAGMKFIDNV 
KLLSHLANIG DAKSLVIHPA STTHQQLSAE EQLATGVSPD FIRLSIGIED VKDIIADIEQ 
ALKAAQA