Gene GM21_0120 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GM21_0120
Symbol
ID	8135423
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sp. M21
Kingdom	Bacteria
Replicon accession	NC_012918
Strand	-
Start bp	152224
End bp	153288
Gene Length	1065 bp
Protein Length	354 aa
Translation table	11
GC content	68%
IMG OID	644867740
Product	short-chain dehydrogenase/reductase SDR
Protein accession	YP_003019964
Protein GI	253698775
COG category	[R] General function prediction only
COG ID	[COG0300] Short-chain dehydrogenases of various substrate specificities
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	76
Fosmid unclonability p-value	0.718494
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAATTCT CCCGAAAGAA TTCGAATCTC CTCCCCATGC TCCTGCTGGG TCCGAGCGCC 
TTCTTGCTCT GGAGCCTGCG CCGGCGCGCC CGCCGCATGG ACTTCTCCGG CAGGAGCGTG 
GTGATCTCGG GGGGCTCCCG CGGGCTCGGG CTGGAACTGG CCCGCCAACT GGGGAGGGAG 
GGGGCGAAGC TGGTGCTCCT GGCCCGCAAC CAGGAGGAGC TGGAGCGGGC CCGCGCCGAA 
CTCGCGCAAG CAGGCGCCGA CGTCCTCACC CTCCCCTGCG ACGTCGGTAG CCACCAGCAG 
GTCGAGGAGG CGGTGACCGC GATCCTTGAG CTGCGCGGCA CCATCGACGT CCTGATCAAC 
GTGGCCGGCG TGATCCAGGT GGCGCCGTTC GAGAACCTGG AGTTCAAGGA CTTCCAGGAA 
TCGGTCGACG TGCACGCCTG GGGGCCGTAC CACCTGATGC GCGCCGTGGT GCCGCAGATG 
CAGCGCCGGC GCACCGGGCG CATCGTGAAC ATCTCCTCGA TAGGGGGACT GGTCGCCGTC 
CCGCACCTGT TGGCCTACAC CATGGGGAAG TTCGCCTTGA CCGGGCTCTC CGACGGCTTC 
CGCGCCGAGC TTGCCAAGGA CGGCATCTAC GTCACAACCG TGGCGCCCGG GCTGATGCGG 
ACCGGCTCCC ACGTCAACGC CCAATTCAAG GGGCAGTACC GCAAGGAGTA CGCCTGGTTC 
GCCATTTCCG GCGCCAACCC CATGCTCTCG ACCGCGGCGC CCGCCGCCGC CAAAAGGATC 
GTCGAAGGTT GCCGCTACGG CGAAGCCAGA GTCATCATCA ACTGGCCGGC GCGCCTGCTC 
CATGCCGCCA ACGCGCTATT CCCCGGCCTC ACCTCCTTCG GCACCGGCAT CGCCGCGCGG 
CTGTTGCCGG CCCCCTCGAA GGAACCGGAG GGGAGCGCGC CGCATCCGGG GTGGGAAAGC 
CGCTCTCCGC TGGCGCCCTC CATGCTCACC CGCTCAAGCG ACCTGGCTAT CGAGCCGAAT 
CACGAAGAGA TCGCCGCACC CCTGCCCCGC AAGGTGGCAG ACTGA

Protein sequence

MKFSRKNSNL LPMLLLGPSA FLLWSLRRRA RRMDFSGRSV VISGGSRGLG LELARQLGRE 
GAKLVLLARN QEELERARAE LAQAGADVLT LPCDVGSHQQ VEEAVTAILE LRGTIDVLIN 
VAGVIQVAPF ENLEFKDFQE SVDVHAWGPY HLMRAVVPQM QRRRTGRIVN ISSIGGLVAV 
PHLLAYTMGK FALTGLSDGF RAELAKDGIY VTTVAPGLMR TGSHVNAQFK GQYRKEYAWF 
AISGANPMLS TAAPAAAKRI VEGCRYGEAR VIINWPARLL HAANALFPGL TSFGTGIAAR 
LLPAPSKEPE GSAPHPGWES RSPLAPSMLT RSSDLAIEPN HEEIAAPLPR KVAD