Gene GM21_2119 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GM21_2119
Symbol
ID	8137455
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sp. M21
Kingdom	Bacteria
Replicon accession	NC_012918
Strand	+
Start bp	2476859
End bp	2477851
Gene Length	993 bp
Protein Length	330 aa
Translation table	11
GC content	67%
IMG OID	644869734
Product	3-beta hydroxysteroid dehydrogenase/isomerase
Protein accession	YP_003021929
Protein GI	253700740
COG category	[G] Carbohydrate transport and metabolism [M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0451] Nucleoside-diphosphate-sugar epimerases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	81
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAGGCTC TGGTCACCGG CGGTGGAGGC TTCTTAGGCT CCGCCATAGT GCGCCAATTG 
CTGGCCCGGG GGGACCAGGC GGTCAGCTTC TCGCGCGGCG AGTACCCGGA GTTGGCCGCG 
CTCGGCGTGG AACAGCGCCG GGGCGACCTG TCGGATCTGG AAGCGGTGGC GGAGGCGGCC 
CGGGGGTGCG ACGTCGTTTT CCATGTCGCC GGGAAGGCTG GGATCTGGGG GAAGTTCGAG 
GAATACTACC TAGCCAACGT GACCGGCACC GAAAACGTCA TCGAGGCGTG CCGCAGGCTC 
GGCATCGAGA GGCTCGTCCA TACCAGCTCC CCGAGTGTGG TATTCGACGG CTCCGACGTC 
GAGGGAGGGA ACGAATCGCT CCCCTACCCT GCGCATTTCG AGGCGCATTA CCCCCACACC 
AAGGCCCTGG CCGAACAGGC GGTGCTCGCG GCGAATACCC CTACGCTGGC GACGGTATCG 
CTGCGCCCCC ACCTGATCTG GGGCCCAGGC GACAACCACC TGGTGCCGCG CATCGTGGCG 
AAGGCGCGCT CGGGCGCCCT GAAGCGGATC GGCAACCACC CCTGCCTGGT CGACACCGTC 
TACGTCGATA ACGCCGCCGA GGCGCACCTG AATGCCGCCG ACCGGCTGCA ACCGGGGAGC 
GCACCGGCAG GAAAGGCGTA CTTCATCTCC AATGGCGAGC CGATCCCGCT CTGGGAGATG 
GTGAACCGGA TCCTCGCGGC CGCAGGAGTT CCCCCGGTGA CGCGCCAGGT TTCCCCTGGC 
CTTGCCTATG GCGCCGGCGT GATCTGCGAA ACCCTCTGGA GGGTGCTGCG CCTCTCCGGC 
GAGCCCCCGA TGACCCGTTT CGTCGCCAAG GAACTCGCCA CGGCGCACTG GTTCGACCTC 
TCCGCTGCGC GCACCGATCT CGGTTACCAT CCCCGCATAT CCATCGATGA AGGGCTTGAG 
CTGCTGCAAG CATCCCTGAG GCAAGGGCGG TGA

Protein sequence

MKALVTGGGG FLGSAIVRQL LARGDQAVSF SRGEYPELAA LGVEQRRGDL SDLEAVAEAA 
RGCDVVFHVA GKAGIWGKFE EYYLANVTGT ENVIEACRRL GIERLVHTSS PSVVFDGSDV 
EGGNESLPYP AHFEAHYPHT KALAEQAVLA ANTPTLATVS LRPHLIWGPG DNHLVPRIVA 
KARSGALKRI GNHPCLVDTV YVDNAAEAHL NAADRLQPGS APAGKAYFIS NGEPIPLWEM 
VNRILAAAGV PPVTRQVSPG LAYGAGVICE TLWRVLRLSG EPPMTRFVAK ELATAHWFDL 
SAARTDLGYH PRISIDEGLE LLQASLRQGR