Gene Cag_0623 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cag_0623
Symbol
ID	3746938
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium chlorochromatii CaD3
Kingdom	Bacteria
Replicon accession	NC_007514
Strand	+
Start bp	897461
End bp	898561
Gene Length	1101 bp
Protein Length	366 aa
Translation table	11
GC content	50%
IMG OID	637773159
Product	riboflavin biosynthesis protein RibD
Protein accession	YP_378939
Protein GI	78188601
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0117] Pyrimidine deaminase [COG1985] Pyrimidine reductase, riboflavin biosynthesis
TIGRFAM ID	[TIGR00227] riboflavin-specific deaminase C-terminal domain [TIGR00326] riboflavin biosynthesis protein RibD

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.00992131
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCCCGCAC TTGAGCATAC GTTTTATATG CAGCGTGCTT TGGAGTTAGC GTTGCGTGGT 
GCTGGAAGGG TAAGCCCCAA TCCAATGGTG GGCGCTCTCT TAGTTCAAGA GGGGGAAATT 
ATTGGCGAAG GGTGGCATGA GCGTTATGGC GAAGCTCATG CAGAGGTGAA TGCGATTGCT 
GCCGTTACCA ATGAGGCATG GTTGCGTGAA GCGACGTTGT ACGTAACCTT AGAGCCATGT 
TCGCATTTTG GCAAAACACC TCCTTGCAGC GATTTAATTA TTGCAAAGCA AATTCCGCGC 
GTTGTGGTTG GCTGTCGCGA TCCATTTCCT GCTGTAGCAG GACGAGGTAT TGCAAAATTG 
CGTGCTGCGG GCATTGAGGT TATTGAAGGC GTTTTAGAAG CAGAATGTTT ACAAAGCAAC 
GAAGCGTTTA TCAAAAGCCA CACCGTTGGA TTGCCATTTG TAACGCTGAA GTTAGCGCAA 
ACTCTTGATG GCAAGTTAGC CACGGTAACG GGTGCATCGC GTTGGATTAC CGGAGAAGAG 
GCTCGTGCTG AGGTGCACCG TTTGCGAAGT GTGTATGATG CGGTGCTGGT GGGTGGCGCT 
ACAGCACTTG CCGATAATTC ACAACTTACG GTTCGCCAAG CCAACGGGCG CAATCCATTG 
CGCGTTGTGC TTGATCGTTC ACTTCAGTTG CCGCTTGAAA GCCTTATCTT TAACCATGAA 
GCGCCAACCT TGCTTTTTAC TTCTCTCTCT CAGCAGCACT CTCCAAAAGT GGAGGCGTTA 
CAAAAATTGG GCGTAAGCGT TCATGCTGTT AGCGAAAGTG CCGAGGGGTT GCAACTGCGT 
GAAGTGCTGG AAGAGCTGCA TCATCGGCAC ATCCTTTCCG TATTAGTAGA GAGTGGCAGT 
CGCCTTGGTG CTGCACTGTT GCAAGCAGGT TTTGTTGATA AACTCTTGAT TTTTATAGCG 
CCAAAGCTCT TTGGTGGCGA TGGATTAAGT GCCTTTGCTC CGCTTGGCGT AACGGTGCCC 
GACGAAGCAA TTGCACTACG CTTTGAGTTG CCACGCTTTT TTGGAAAAGA TTTGTTGCTT 
GAGGCTTACA TTAACTCTTA G

Protein sequence

MPALEHTFYM QRALELALRG AGRVSPNPMV GALLVQEGEI IGEGWHERYG EAHAEVNAIA 
AVTNEAWLRE ATLYVTLEPC SHFGKTPPCS DLIIAKQIPR VVVGCRDPFP AVAGRGIAKL 
RAAGIEVIEG VLEAECLQSN EAFIKSHTVG LPFVTLKLAQ TLDGKLATVT GASRWITGEE 
ARAEVHRLRS VYDAVLVGGA TALADNSQLT VRQANGRNPL RVVLDRSLQL PLESLIFNHE 
APTLLFTSLS QQHSPKVEAL QKLGVSVHAV SESAEGLQLR EVLEELHHRH ILSVLVESGS 
RLGAALLQAG FVDKLLIFIA PKLFGGDGLS AFAPLGVTVP DEAIALRFEL PRFFGKDLLL 
EAYINS