Gene Csal_2584 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Csal_2584
Symbol
ID	4027120
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chromohalobacter salexigens DSM 3043
Kingdom	Bacteria
Replicon accession	NC_007963
Strand	-
Start bp	2896656
End bp	2897816
Gene Length	1161 bp
Protein Length	386 aa
Translation table	11
GC content	65%
IMG OID	637967792
Product	GTP cyclohydrolase II
Protein accession	YP_574630
Protein GI	92114702
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0108] 3,4-dihydroxy-2-butanone 4-phosphate synthase [COG0807] GTP cyclohydrolase II
TIGRFAM ID	[TIGR00506] 3,4-dihydroxy-2-butanone 4-phosphate synthase

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCGCTTT CATCCAAACA GGGCTTGGCT TCCATCGACG CCATCGTCGA GGACATCCGC 
CAAGGCAAGA TGGTCATTCT CATGGACGAT GAGGATCGCG AGAACGAAGG CGATATCATC 
ATGGCCGCCG AGTGCGTCGA CGCCGAGCAC ATCAATTTCA TGGCGCGCTA CGCCCGCGGC 
CTGATCTGCC TGCCGATGAC CCGGGAGCGT TGCGAACGCC TCGAACTGCC CTTGATGGTC 
CGCGACAACG GCTCCGGTTT CGGTACCAAG TTCACCGTTT CCATCGAAGC CGCGCGCGGC 
GTGTCCACGG GGATCTCCGC CTCCGACCGT GCTCGCACCG TACGTGCGGC GGCGGCGCGC 
GACGCCGTGG CCGCGGATAT CGTCCAGCCA GGGCATATCT TTCCGCTGAT GGCCGAGCCG 
GGTGGCGTGT TGCGGCGCGC CGGGCATACC GAGGCGGCAT GCGACCTGGC CGCCATGGCC 
GGTTTCGAAC CGAGCGGCGT GATCTGCGAG GTCATGAACG ATGACGGCAG CATGGCGCGT 
CGCGACGAGC TCGAACGTTT CGCCGCCGAG CATGACATCA AGATCGGCAC CATCGCCGAT 
CTGATTCACT ACCGTATTCA CCACGAGCGC ACCGTCGACG AGGTCGAGCG CAGCGTCGTC 
GATACCGCTT TCGGCGAGTT GACCCTGCAC GTCTTCCGCG ACCGCATCCA GAATACGCAT 
CATCTGGCGC TGGTGAAGGG CACCCCGCGC ACCGAGTCGC CGACCACCGT ACGTGTGCAC 
ATCGCCGATA CGCTGCGCGA CCTGCTGATG CTGACCAGGC CGGATAGCCA CAGCTGGACC 
GCTGCCAGTG CCCTGGCCCA GATCGCCGAC GCCGAGGCGG GCGTGTTCGT GCTGCTCGAT 
GACGGCCGAC CGCGGCTCGA TCTGAAAGAC CAGCTCGACG TGCTGCTCGG ACGCAAGCCG 
GCCCCGCGTT CCAGCGAGTC CGACGGCGCC GGCAATTATC TGACCATCGG CACCGGCTCG 
CAGATTCTGC GCCAGCTGGG TGTGGGGCAG ATGCGGCTGT TGAGTTCGCC GTGGAAGTTC 
TCCGCGCTTT CCGGTTTCGA CCTCGAGGTC GTCGAACGGG TCGGAGGCGA TACCCCCGAG 
AGCGACCAGC CGGTAGAATA G

Protein sequence

MALSSKQGLA SIDAIVEDIR QGKMVILMDD EDRENEGDII MAAECVDAEH INFMARYARG 
LICLPMTRER CERLELPLMV RDNGSGFGTK FTVSIEAARG VSTGISASDR ARTVRAAAAR 
DAVAADIVQP GHIFPLMAEP GGVLRRAGHT EAACDLAAMA GFEPSGVICE VMNDDGSMAR 
RDELERFAAE HDIKIGTIAD LIHYRIHHER TVDEVERSVV DTAFGELTLH VFRDRIQNTH 
HLALVKGTPR TESPTTVRVH IADTLRDLLM LTRPDSHSWT AASALAQIAD AEAGVFVLLD 
DGRPRLDLKD QLDVLLGRKP APRSSESDGA GNYLTIGTGS QILRQLGVGQ MRLLSSPWKF 
SALSGFDLEV VERVGGDTPE SDQPVE