Gene GM21_1226 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GM21_1226
Symbol
ID	8136551
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sp. M21
Kingdom	Bacteria
Replicon accession	NC_012918
Strand	+
Start bp	1432561
End bp	1433670
Gene Length	1110 bp
Protein Length	369 aa
Translation table	11
GC content	65%
IMG OID	644868840
Product	riboflavin biosynthesis protein RibD
Protein accession	YP_003021045
Protein GI	253699856
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0117] Pyrimidine deaminase
TIGRFAM ID	[TIGR00227] riboflavin-specific deaminase C-terminal domain [TIGR00326] riboflavin biosynthesis protein RibD

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	63
Fosmid unclonability p-value	0.078845
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCCGACC TACACCTTAA AATGATGCGC CTGGCGCTTT GCGAGGCCAG AAAGGGAGTC 
GGCAAGACGG CCCCCAACCC GGCCGTCGGC TGCGTCATCG TCCGGGACGG CGAAGTGGTC 
GGGACCGGCT GGCACAAAAA GGCGGGGACC CCGCACGCCG AGGTGCATGC GCTTAAGGCC 
GCCGGCGAGA AGGCGGCCGG CGCCGACGCC TACGTGACCC TTGAGCCCTG CTCCCATTTC 
GGCAAGACCC CCCCCTGCGC GAAAGCGCTC ATCGAGGCGA AAGTGGCGCG CGTCTTCGTC 
GCCATGGTCG ACCCCAACCC GCTTGTCTCC GGGAAGGGGA TCCAGATGCT CAAGGACGCG 
GGGATAGCAG TCGAGGTGGG ACTCTTGGAA GAGGAGAGCC GTGAGCTGAA CCTTCCCTTC 
ATCAAGTGGA TCCAGACCAG GCTCCCCTTC GTGGTGCTGA AGAGCGCGCT AACGCTGGAC 
GGCAAGAGCG CCACGGCAAG CGGCGACTCC AAGTGGGTGA CCAGCGACCG GGCCCGGCGT 
GAGGTGCACC GGCTGCGCGG CCGCCTGGAC GCCATCATGG TCGGCGTCGG TACCGTGGCG 
AAGGACGATC CGCTTTTGAC CTGCAGGGTC CCCGGCGGCA AAGATCCGCT GCGGGTGATA 
GTCGACTCGA CCCTCAGGAT ACCGCTGCAC GCCGCGGTCC TCGGAGTGCC TTCCAAAGCT 
CAGACGATCA TCGCCACCTG TAGCGGCGAC GAGGCAAAGA TGCAAGCGCT CAAGGCGCAC 
GGCGTCGAGA TCCTCACTTG CTGCGAGAGC GACGGGCGGG TCGACCTTGC CGATCTCTTC 
GTAAAGTTGG GTGCGCGCGG CGTGCAGTCC GTGCTGCTCG AAGGCGGAAG TCACCTGGCA 
GGGGCAGCTC TTCGTGCCGG GCTCATCGAC AAATGCATGA TCTTTCTGGC GCCGAAGCTC 
GTGGGAGGAG CAGGCATGGG GCTCTTCGCC GGCGAGGGGG CGACGCTGAT GGCAGACGCC 
ATACGGTTGG AGCAGATGAG GGTAAAGCGA GTGGGAGTCG ACCTCCTGGT GGAGGGAGTC 
CCCGCAAAAA CAAAAAGTCA GAACCACTAA

Protein sequence

MSDLHLKMMR LALCEARKGV GKTAPNPAVG CVIVRDGEVV GTGWHKKAGT PHAEVHALKA 
AGEKAAGADA YVTLEPCSHF GKTPPCAKAL IEAKVARVFV AMVDPNPLVS GKGIQMLKDA 
GIAVEVGLLE EESRELNLPF IKWIQTRLPF VVLKSALTLD GKSATASGDS KWVTSDRARR 
EVHRLRGRLD AIMVGVGTVA KDDPLLTCRV PGGKDPLRVI VDSTLRIPLH AAVLGVPSKA 
QTIIATCSGD EAKMQALKAH GVEILTCCES DGRVDLADLF VKLGARGVQS VLLEGGSHLA 
GAALRAGLID KCMIFLAPKL VGGAGMGLFA GEGATLMADA IRLEQMRVKR VGVDLLVEGV 
PAKTKSQNH