Gene GM21_3526 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GM21_3526
Symbol
ID	8138898
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sp. M21
Kingdom	Bacteria
Replicon accession	NC_012918
Strand	-
Start bp	4068598
End bp	4069629
Gene Length	1032 bp
Protein Length	343 aa
Translation table	11
GC content	67%
IMG OID	644871145
Product	selenide, water dikinase
Protein accession	YP_003023305
Protein GI	253702116
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0709] Selenophosphate synthase
TIGRFAM ID	[TIGR00476] selenium donor protein

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	79
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACTGACA AGGTACGACT CACAACGATG GTGCAGGCGG CGGGTTGAGC TGCCAAGCTG 
GGCCCGGCGG GCCTGGAAGA AGCCATTCAC GACATAACGC GCTCGGATGA CCCCAACCTC 
ATCGTGGGGG TGGAAGGGGC GGAGGACGCC GGCATCTACC GGATCGGGGA TAACCTCGCC 
CTGGTGGAGA CGACGGATAT CATCACGCCG CTGGTGGACG ACCCCTTCAC CTTCGGCCGC 
ATCGCCGCGG CTAACGCCCT CTCGGACGTC TACGCCATGG GGGGGAGACC GGTGACGGCG 
ATGAACTTGG CCTTCTTCCC CGCCTGCTCG CTCCCGACAA AGGTCCTCGC CGCCATCCTG 
GCTGGGGGCT CGGACGCGCT CAAGGAGGCG GGGGCCTGCC TAGTCGGCGG GCACACGGTG 
GAGGACAACG AGCTCAAGTT CGGGCTCGCG GTGACCGGCC TCATCGACCC GGCTCGCGTG 
GTCAGAAACT GCACCGCCCG ACCGGGGGAC CTCATCGTCA TCACCAAGCC TCTTGGAACC 
GGCATCGTCT CCACGGCCAT CAAGGCGGAG ATGGTCGAAC CGGTGCTGGA GGCGGAGGCA 
ACCCGCTGGA TGACCATCCT CAACGCGCAG GCTGCGGAAC TGATGGTCGC CTGCCGCGCC 
ACGGCCGCCA CGGACGTGAC CGGATTCGGC TTCATCGGCC ATGCCTGCGA GATGGCTCTC 
GGGGCGAAGG TCACCTTCAG GATCGAACTT GCCCGGGTGC CGGTCATTCC GGGGGTCCCG 
GCGCTGATCG ACGACGGCCT CGTCCCCGCC GGCTGCTACC GAAACCGCCA GCACTATGAA 
CAACACGTCT CCGGAAAGAG CGGCGACCCC CTCTTGCCGC TCTTCGACCC CCAGACCTCG 
GGGGGGCTGT TGATCACCTT CGCTCCCGAC GACGCCCGCA CTTTCCTCTC CCGCGCCGGG 
GAGGAAGGGC TTTTCGCCGC CTGCATCGGC GAGGTCGAGC CCGCCGGAGG GACCCCTCTT 
GTCTTCGTCT AG

Protein sequence

MTDKVRLTTM VQAAGUAAKL GPAGLEEAIH DITRSDDPNL IVGVEGAEDA GIYRIGDNLA 
LVETTDIITP LVDDPFTFGR IAAANALSDV YAMGGRPVTA MNLAFFPACS LPTKVLAAIL 
AGGSDALKEA GACLVGGHTV EDNELKFGLA VTGLIDPARV VRNCTARPGD LIVITKPLGT 
GIVSTAIKAE MVEPVLEAEA TRWMTILNAQ AAELMVACRA TAATDVTGFG FIGHACEMAL 
GAKVTFRIEL ARVPVIPGVP ALIDDGLVPA GCYRNRQHYE QHVSGKSGDP LLPLFDPQTS 
GGLLITFAPD DARTFLSRAG EEGLFAACIG EVEPAGGTPL VFV