Gene GM21_1228 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GM21_1228
Symbol
ID	8136553
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sp. M21
Kingdom	Bacteria
Replicon accession	NC_012918
Strand	+
Start bp	1434561
End bp	1435763
Gene Length	1203 bp
Protein Length	400 aa
Translation table	11
GC content	63%
IMG OID	644868842
Product	GTP cyclohydrolase II
Protein accession	YP_003021047
Protein GI	253699858
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0108] 3,4-dihydroxy-2-butanone 4-phosphate synthase
TIGRFAM ID	[TIGR00505] GTP cyclohydrolase II [TIGR00506] 3,4-dihydroxy-2-butanone 4-phosphate synthase

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	52
Fosmid unclonability p-value	0.00154476
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGTCTGTTG CAAGCATAGA GGAAGCGATT GAGGAGATCA GGGCCGGCAG GATGGTCATC 
CTCGCGGACG ACGAGGATCG CGAGAACGAA GGCGACCTAA CCATGGCGGC ACAGTGCGTA 
ACGCCGGAGG CCATAAATTT CATGGCGAAA TACGGCCGCG GCTTGATCTG CCTCACCATG 
ACCTCGGAGC GTTGCGACCG CCTCGACCTG CAGCCGATGG TGCAGACCAA CACCTCTTCC 
TTCGGCACCG CCTTCACCGT TTCCATCGAG GCGAAGAAGG GCGTTACCAC CGGCATCTCG 
GCGGCGGACC GCGCCCATAC CATACTGACG GCCGTGGCAC CCGATGCCAC CGCGGCGGAC 
CTGGCGCGGC CGGGCCACAT CTTCCCGCTC AGGGCCCGCA ACGGCGGCGT CCTGGTGCGC 
TCCGGGCAGA CCGAAGGCTC GGTCGATCTG GCGCGTCTCG CCGGGTTGGA GCCTGCCGGC 
GTCATCTGCG AGATCATGAA CGACGACGGC ACCATGTCGC GCATGCCCGA GTTGAAGAAG 
TTCGCCAAGG AGCACGGCAT CAAGGTCTGC ACCGTCGCCG ACCTGGTCGC CTACCGCCTG 
AAGCACGAAT CGCTGGTGCG CCGCTCGGTC GACGTGGCGC TCCCCAGCCA GTATGGCAGC 
TTCCGCGCGG TAGCCTTCGA GAACGACATC GACAAGTTGG AGCATCTCGC GCTGGTCAAA 
GGGGACATCA AGGGTGACGA GCCAGTACTG GTGCGTGTCC ATTCCGAGTG CCTCACCGGG 
GATGTCTTCG GCAGCGTCAG GTGCGACTGC GCCGATCAAT TGCACAGCGC CATGGAGCGG 
ATCGAGAAGG AAGGGACGGG AGTCATCCTC TACATGCGCC AGGAAGGGCG CGGCATCGGG 
CTCACCAACA AGCTGAAGGC GTACGCGCTG CAGGACCAGG GGCACGACAC GGTTGAGGCG 
AACCTTGCCT TGGGCTTCAA GGCCGACCTG AGGGACTACG GCATCGGCGC GCAGATCCTG 
GTGAACCTGG GTATTAAGAA GATCCGGCTC ATGACCAACA ACCCGAAGAA ACTGGTAGGT 
CTCCAGGGGT ATGGCATCAA CATCGTCGAG CGCGTACCCA TCGAGATCGC CGCTTCCAAG 
AGCAACGAGA AGTACCTGAA GACCAAGCGC GAGAAGATGG GGCACCTGCT GGAAAACATA 
TAA

Protein sequence

MSVASIEEAI EEIRAGRMVI LADDEDRENE GDLTMAAQCV TPEAINFMAK YGRGLICLTM 
TSERCDRLDL QPMVQTNTSS FGTAFTVSIE AKKGVTTGIS AADRAHTILT AVAPDATAAD 
LARPGHIFPL RARNGGVLVR SGQTEGSVDL ARLAGLEPAG VICEIMNDDG TMSRMPELKK 
FAKEHGIKVC TVADLVAYRL KHESLVRRSV DVALPSQYGS FRAVAFENDI DKLEHLALVK 
GDIKGDEPVL VRVHSECLTG DVFGSVRCDC ADQLHSAMER IEKEGTGVIL YMRQEGRGIG 
LTNKLKAYAL QDQGHDTVEA NLALGFKADL RDYGIGAQIL VNLGIKKIRL MTNNPKKLVG 
LQGYGINIVE RVPIEIAASK SNEKYLKTKR EKMGHLLENI