Gene Cag_1590 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cag_1590
Symbol
ID	3746665
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium chlorochromatii CaD3
Kingdom	Bacteria
Replicon accession	NC_007514
Strand	+
Start bp	2076972
End bp	2078339
Gene Length	1368 bp
Protein Length	455 aa
Translation table	11
GC content	44%
IMG OID	637774130
Product	zeta-carotene desaturase
Protein accession	YP_379888
Protein GI	78189550
COG category	[S] Function unknown
COG ID	[COG3349] Uncharacterized conserved protein
TIGRFAM ID	[TIGR02731] phytoene desaturase [TIGR02732] carotene 7,8-desaturase

Plasmid Coverage information

Num covering plasmid clones	35
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAGTAG CGATTTTTGG CGCCGGTGTA GCAGGGTTAA GTGCCGCAAT TGAATTAGTT 
GACCGGGGTC ATAGTGTTGA AATTTATGAA AAGCGCAAGG TACTTGGAGG AAAAGTTTCC 
GTTTGGAAGG ATAGCGATGG CGATTCAGTA GAGTCGGGAT TGCATATTGT TTTTGGCGGA 
TACGAACAGT TACAATCGTA CTTAAAGCGA GTTGGCGCTG AGGATAACTA TCAATGGAAA 
GATCATGCGC TGGTGTATGC CGAGCAAGAT GGCAAGCAGG TGGCTTTTCG TAAAGCGCTC 
AATATGCCAA GCCCGTGGGC TGAAGTGGTT GGTGGAATGC GCACCGACCT TTTAACGTTT 
TGGGATAAAA TTTCTTTACT CAAAGGATTA TACCCTGCCA TTACAGGTGA TGAAGCCTAT 
TTTCGTAGTC AAGATTACAT GACCTACTCC GAGTGGCATC GGCGCAATGG TGCTTCGGAA 
CATTCATTAC AACGCTTATG GCGTGCTATT GCATTGGCTA TGAACTTTAT TGAGCCAAAT 
GTAATTAGCG CTCGCCCTAT GATTACCATT TTTAAATATT TTGGTACCAA TTACAGCGCC 
ACCAAGTTTG GCTTTTTCCG CAAAAACCCC GGCGATTCAA TGATTGAGCC AATGCGCCAA 
TACATTCAAA GCAAGGGTGG ACGTATTTTT GTGGATGCAA AGTTAAGTCG TTTTGAACTA 
AATAGCGATG AAACTATTAA AGAGGCTGTG TTGCGTGATG GGCATAAAAT TGAAGCTGAT 
GCTTACATTT CAGCCCTACC TGTACATAGC ATCAAAAAAA TTGTACCAAC CACATGGCTC 
AAGCATAAGT ATTTCCGCAA TTTGCATGAG TTTGTGGGAA GCCCTGTAGC GAATTGCCAA 
ATTTGGTTTG ACCGTAAAAT TACCGATACC GATAATTTGA TGTTTTCGCA AGGCACCATT 
TTTGCCACCT TTGCCGATGT TTCTCTTACC TGCCCTGAGG ATTTTCAGCA AGGGATTGGT 
TCTGCAAATG GTGGAAGCGT GATGAGCTTA GTGTTAGCTC CAGCGCATCA GCTTATGGAT 
ATGCCGCAAG AGGTTATTAT TGATTTGGTA GTAAAGGATT TGCACGATCG CTTCCCTGCT 
TCTCGCAATG CAAAGGTGTT GAAATCAACC TTGGTGAAAA TTCCTCAATC GGTCTATAAA 
GCCGTACCTG ATGTTGATCA ATATCGTCCC GATCAAATAA GCCCCGTACG CAACTTCTTT 
CTTGCGGGCG ACTATACCGA CCAGCATTAT CTTGCTTCTA TGGAAGGAGC TGCTTTAAGC 
GGCAAGCAAG CGGCTGAAAA GTTGATGAGC AAAATTGGCA ACTCCTAA

Protein sequence

MKVAIFGAGV AGLSAAIELV DRGHSVEIYE KRKVLGGKVS VWKDSDGDSV ESGLHIVFGG 
YEQLQSYLKR VGAEDNYQWK DHALVYAEQD GKQVAFRKAL NMPSPWAEVV GGMRTDLLTF 
WDKISLLKGL YPAITGDEAY FRSQDYMTYS EWHRRNGASE HSLQRLWRAI ALAMNFIEPN 
VISARPMITI FKYFGTNYSA TKFGFFRKNP GDSMIEPMRQ YIQSKGGRIF VDAKLSRFEL 
NSDETIKEAV LRDGHKIEAD AYISALPVHS IKKIVPTTWL KHKYFRNLHE FVGSPVANCQ 
IWFDRKITDT DNLMFSQGTI FATFADVSLT CPEDFQQGIG SANGGSVMSL VLAPAHQLMD 
MPQEVIIDLV VKDLHDRFPA SRNAKVLKST LVKIPQSVYK AVPDVDQYRP DQISPVRNFF 
LAGDYTDQHY LASMEGAALS GKQAAEKLMS KIGNS