Gene Dshi_0039 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dshi_0039
Symbol	ribA
ID	5711661
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Dinoroseobacter shibae DFL 12
Kingdom	Bacteria
Replicon accession	NC_009952
Strand	+
Start bp	41277
End bp	42347
Gene Length	1071 bp
Protein Length	356 aa
Translation table	11
GC content	70%
IMG OID	641265933
Product	GTP cyclohydrolase II
Protein accession	YP_001531389
Protein GI	159042595
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0807] GTP cyclohydrolase II
TIGRFAM ID	[TIGR00505] GTP cyclohydrolase II

Plasmid Coverage information

Num covering plasmid clones	32
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	0.000270099
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGTCCCTGA CCCCCGATCC GCGCGAATTG CGCGCCCGTG CCTGGGCGGA CCTGCGCATG 
GGCGTGCCCG TGGTGCTGCA TTCCGAGGGC CGTGCGGTGC TGGCGCTGGC GGGCGAGACG 
CTCAAGCCTG CGCGATTGTC GGTGGTGGCG GGCATGGCGG AAGCGGTGCT CGCGATCACG 
GCGCGGCGGG CCGAGACCCT GCGCGCGGTG CCCTATGACG GGGATATCGC GCGGATCGCC 
CTGCCGGGCA ATGCGGATGC GCACTGGGTG CGGGCGGTGG CCGATCCTGC GGATGATCTG 
CGGATGCCGA TGAAGGGGCC GTTCCGGGTG CTGCGCGACG GAGACGCAGT GTTGCACCGG 
CTGGCGCTGA CCCTGTGCAA GGAAGCGCGG CTCTTGCCTG CGGCGGTGGT CGCGCCCGTG 
GTGCCCGGGT TCGGCCCGGC GGAGGGTCTG ACGGTTCTGG ATGCCGCCGA CCTGCGCGTG 
CCGATGGTGA TGGACGAGGT CGTCTCGGCC CGCGTGCCGC TGTCGGTGTC GGAGGCGGGG 
CGGCTGCATG TGTTCCGGCC CGAGGATGGC AGCGAGGAGC ATTACGCGGT CGAGATCGGC 
ACGCCGCCGC GCGACCAGCC GGTGCTGGCG CGGTTGCATT CGGCGTGTTT CACCGGTGAC 
CTGCTGGGGT CGCTGAAATG CGATTGCGGG CCGCAATTGC GTGGGGCGCT GGCGCAGATG 
GGGGCCGAAG GGGCGGGCGT ATTGCTGTAC CTGAACCAGG AGGGGCGGGG GATCGGGCTG 
GCCAACAAGA TGCGCGCCTA TGCCTTGCAG GACCAGGGGT TCGACACGGT GGAGGCGAAC 
CACCGGCTGG GCTTCGAGGA TGACGAGCGG GATTTCCGGA TCGGGGCGGA GCTTCTGCGG 
CGGCTGGGGT TTTCGGCCAC GCGGCTCATG ACGAACAACC CGGCCAAGGT GGCGATGATG 
GAGAATTGCG GGATCGCGGT GACCGAGCGC GTGCCGCTCA AGGTCGGGGA GACGCCGCAG 
AACGCCGGGT ACCTCGCGAC CAAGGCGGCG AAGTCGGGGC ATTTGTTGTA G

Protein sequence

MSLTPDPREL RARAWADLRM GVPVVLHSEG RAVLALAGET LKPARLSVVA GMAEAVLAIT 
ARRAETLRAV PYDGDIARIA LPGNADAHWV RAVADPADDL RMPMKGPFRV LRDGDAVLHR 
LALTLCKEAR LLPAAVVAPV VPGFGPAEGL TVLDAADLRV PMVMDEVVSA RVPLSVSEAG 
RLHVFRPEDG SEEHYAVEIG TPPRDQPVLA RLHSACFTGD LLGSLKCDCG PQLRGALAQM 
GAEGAGVLLY LNQEGRGIGL ANKMRAYALQ DQGFDTVEAN HRLGFEDDER DFRIGAELLR 
RLGFSATRLM TNNPAKVAMM ENCGIAVTER VPLKVGETPQ NAGYLATKAA KSGHLL