Gene Cag_1788 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cag_1788
Symbol
ID	3747208
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium chlorochromatii CaD3
Kingdom	Bacteria
Replicon accession	NC_007514
Strand	+
Start bp	2308541
End bp	2309782
Gene Length	1242 bp
Protein Length	413 aa
Translation table	11
GC content	47%
IMG OID	637774326
Product	3,4-dihydroxy-2-butanone 4-phosphate synthase
Protein accession	YP_380082
Protein GI	78189744
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0108] 3,4-dihydroxy-2-butanone 4-phosphate synthase [COG0807] GTP cyclohydrolase II
TIGRFAM ID	[TIGR00505] GTP cyclohydrolase II [TIGR00506] 3,4-dihydroxy-2-butanone 4-phosphate synthase

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCACACAG CTATTGATTC GATTGATGCC GCTCTTGAAG ATATTCGGCA GGGTAAATTG 
GTGATTGTTA TTGATGATGA AGATCGAGAA GATGAGGGTG ATTTTATTGG CGCTGCCGAT 
TTAGTTACCA CTGAAATGAT CAACTTTATT ACGCGCGAAG CTCGTGGCTT ACTGTGCGTT 
GCCGTAACCA TGGAGCGAGC AAAAGAGTTA CAGCTTGACC CTATGGTGCA GCGCAACACA 
TCGCAACACG AAACCAACTT TACTGTTTCG GTTGACGCTA TTGCTGAAGG CGTTACCACC 
GGTATTTCCG TGTATGACCG CACCATGACC ATTAAAATGT TAGGCGATCC CTCCACCAAA 
GCGGATGACT TTTCACGTCC CGGACACATT TTCCCTCTTC GAGCTATGAA TGGTGGTGTG 
CTTCGCCGCG TTGGGCACAC CGAAGCGGCA GTTGACCTTG CTCACCTTGC TGGACGCTCA 
CCCGTTGGCT TGCTCTGCGA AATTCTTAAT GAGGATGGCA GCATGGCGCG TTTGCCTGAG 
CTTATTAAAC TCAAGGAGAA GTTCGGCTTA AAGCTCATTA CCATTAAGGA TTTAGTTGCC 
TACCAAATGC AGCGTAATGC GTTAGTAAAG CGTGCCGTTG AATCGCGCTT ACCAACCGCT 
TATGGCGAAT TTAAACTCAT TGCTTACGAT TCATTTATTG ATCACCACAA CCATATTGCC 
TTTATAAAAG GGGATGTATC CACCGATGAA CCCGTGTTGG TGCGCGTCCA TTCACAATGC 
GCTACGGGCG ACACCTTTGC CTCACTCCGT TGCGATTGCG GGCATCAACT TGCCTCAGCA 
CTTACCATGA TTGAAAAGGA GGGGCGTGGC GTGCTGGTTT ATTTAATGCA AGAGGGGCGT 
GGTATTGGTT TAGTCAATAA GCTGAAAGCC TACAACTTGC AAGATGAAGG GCTTGATACC 
GTTGAAGCAA ACGAAAAGCT TGGCTTTAAA GCCGACTTGC GTGATTACGG CATTGGCGCT 
CAAATTCTTA AAGATCTTGG CATTCGTAAA ATGCGCTTAA TGACCAACAA CCCGAAAAAA 
ATTGTCGGGC TTGAAGGGTA CGGACTGGAA ATTGTAGAGC GTGTACCTAT TGAAATAGCA 
CCTAACGCCG TGAATGAAAG CTACTTGCAA ACCAAGCGCG ATAAAATGGG GCACATGCTT 
GGTTGTTCAT GCAGCTCAAC AGCTTCGCAT ACGCATAAAT AA

Protein sequence

MHTAIDSIDA ALEDIRQGKL VIVIDDEDRE DEGDFIGAAD LVTTEMINFI TREARGLLCV 
AVTMERAKEL QLDPMVQRNT SQHETNFTVS VDAIAEGVTT GISVYDRTMT IKMLGDPSTK 
ADDFSRPGHI FPLRAMNGGV LRRVGHTEAA VDLAHLAGRS PVGLLCEILN EDGSMARLPE 
LIKLKEKFGL KLITIKDLVA YQMQRNALVK RAVESRLPTA YGEFKLIAYD SFIDHHNHIA 
FIKGDVSTDE PVLVRVHSQC ATGDTFASLR CDCGHQLASA LTMIEKEGRG VLVYLMQEGR 
GIGLVNKLKA YNLQDEGLDT VEANEKLGFK ADLRDYGIGA QILKDLGIRK MRLMTNNPKK 
IVGLEGYGLE IVERVPIEIA PNAVNESYLQ TKRDKMGHML GCSCSSTASH THK