Gene GM21_2238 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GM21_2238
Symbol
ID	8137577
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sp. M21
Kingdom	Bacteria
Replicon accession	NC_012918
Strand	+
Start bp	2612243
End bp	2613496
Gene Length	1254 bp
Protein Length	417 aa
Translation table	11
GC content	63%
IMG OID	644869853
Product	O-acetylhomoserine aminocarboxypropyltransferase
Protein accession	YP_003022045
Protein GI	253700856
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2873] O-acetylhomoserine sulfhydrylase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	69
Fosmid unclonability p-value	0.429197
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGGGGAGA AAGAAAAAAA ACTGAGATTC AACACCAAAC TGATCCACGG CGGCACCTCG 
CCCGGGCCCT CCGGCGCCAC CAAGACCCCG ATAGTACAGG CATCCGCCTT CGCTTACGAC 
ACAGCGGAAG CGCTGGAAGA CATCTTCAGG GGAAGAGCAG TGGGCCAGGT GTACACTAGG 
ATAGGCAACC CCACCATGGA CACCCTGGAG AAGAGGCTGG CCGCGATCGA GGACGGCATC 
GCAGCCGTCG TCACCTCTTC TGGCATGGCG GCGATCACCA CCGCGGTCAT GGGAGTGGTA 
AGAAGCGGCG ACGAAGTCCT CTCCTCATCC TCGCTTTTCG GGGGGACCTA CTCGCTTTTC 
CACGACACCC TGGCCAACTT CGGGATCTAC ACCCGCTTCG TCGACCCTGT CGACCTTGCC 
GCGGTCGAGG CGGGGATCAA CGACAAAACC CGACTGATCT TCGTGGAAAC CATCGGCAAC 
CCGAAGATGG ACGTTCCCGA CATAGCCGCT TTCGCAGCCA TCGCCAGGAA ACACGGCATA 
CCGCTCATGG TCGACGCCAC CGTTTCCACG CCGTATCTCG CGCGGTCCAA GGAGCTCGGG 
GCCGACATCA TCGTCCATTC CACCAGCAAG TACATAAACG GCACCGCCAA CTCCATCGGC 
GGCGCCATCA TAGACGCAGG GAGCTTCAAC TGGCAGAGCC CGAAGTTCCC GCACTTCGAG 
GAGTTTTACC GCAGGTACCG CGGCTTCGCC TTCACGGCAC GGGTCCGCAA GCTGATCCAC 
AAGGATTTCG GCGCCTGCGC CGCGCCGCTC AACTCCTTCC TTTTGGGCGA GGGGCTGGAG 
ACGCTCTCCC TGCGCATGGA GCGGCACTGC GCCAACGCCC TCCAAGTGGC CCGCTTCCTT 
CAGGCGCACG AAAAGGTCGC CTGGGTCAAC TACCCCGGCC TCGACGACTC CCCCTTTCAC 
GAGGTGGCGA AGCGCCAGTT CGACGGCCGC TTCGGCGGGC TCCTGACCTT CGGACTCGCG 
GACAGGGCCG CCGCCTTCCG GGTCATCAAC AACCTGCGGC TGGCCAAGAA TCTCGCCAAC 
ATCGGTGACA CCAAGACCCT GGTGATCCAC CCGGCGAGCA CCATCTGCGC CGATTACACC 
CCCGAGGTGA AGGCGCTCAT GGGAGTGAGC GAGGAGCAGG TCAGGGTCTC GGTGGGTATC 
GAGGACATCG AGGATATCCT GGAGGATTTT GCGGCCGCGC TGGAAGAGGC CTGA

Protein sequence

MGEKEKKLRF NTKLIHGGTS PGPSGATKTP IVQASAFAYD TAEALEDIFR GRAVGQVYTR 
IGNPTMDTLE KRLAAIEDGI AAVVTSSGMA AITTAVMGVV RSGDEVLSSS SLFGGTYSLF 
HDTLANFGIY TRFVDPVDLA AVEAGINDKT RLIFVETIGN PKMDVPDIAA FAAIARKHGI 
PLMVDATVST PYLARSKELG ADIIVHSTSK YINGTANSIG GAIIDAGSFN WQSPKFPHFE 
EFYRRYRGFA FTARVRKLIH KDFGACAAPL NSFLLGEGLE TLSLRMERHC ANALQVARFL 
QAHEKVAWVN YPGLDDSPFH EVAKRQFDGR FGGLLTFGLA DRAAAFRVIN NLRLAKNLAN 
IGDTKTLVIH PASTICADYT PEVKALMGVS EEQVRVSVGI EDIEDILEDF AAALEEA