Gene Cag_0004 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cag_0004
Symbol
ID	3747797
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium chlorochromatii CaD3
Kingdom	Bacteria
Replicon accession	NC_007514
Strand	-
Start bp	4354
End bp	5295
Gene Length	942 bp
Protein Length	313 aa
Translation table	11
GC content	45%
IMG OID	637772527
Product	hypothetical protein
Protein accession	YP_378326
Protein GI	78187988
COG category	[R] General function prediction only
COG ID	[COG1090] Predicted nucleoside-diphosphate sugar epimerase
TIGRFAM ID	[TIGR01777] conserved hypothetical protein TIGR01777

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	0.128205
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAATAATC ACATTGTAAT AACAGGCGCA ACGGGCGTTA TTGGTGTTGA ACTTGCTCAA 
AAGCTCATAA AGCGCGGAGA AAAAGTGGTG CTGCTTGCAC GTTCACCAAA TGCCGCACAA 
CAAAAAATTC CGGGGGCAGC CGCTTATGTC CGTTGGGATT CTGATATGCA AGAGGGAGAA 
TGGAAAAGCA CTATCAGTGG AGCCAAAGCC GTTATTCATT TAGCAGGAAA ACCACTCCTT 
GAAAGTCGCT GGAACGAAGA GCATAAGCAA GAATGCTACC AATCGCGCAT TATAGGGACA 
CGTCATATTG TGGCGGCTAT TGCTGAAGCT GCTGAAAAAC CACAAGTTTT TATCTCCTCT 
TCAGCAATTG GCTATTACGG CTCCTTCGAT AAATGTAGCG ACACGGCTCC TCTTACCGAA 
TCAGGCAACA AAGGCAGCGA CTTTTTAGCC CACATTTGTA TTGATTGGGA AGAGGAGGCT 
CGTAAAGCTG AAAACCTTGT GCCTCGCTTA GTGTTTTTGC GGACTGGCAT TGTGCTCTCT 
ACACGCGGCG GCATGTTGCA AAAAATGATG ACTCCATTCC AATATTTTGC AGGTGGTCCA 
ATTGGAACAG GGTTACAGTG CATCTCATGG ATTCACATGG ATGACGAAGT CAACGCTATT 
ATTGCATCGC TTGATAATTC TGCTTACAAA GGAGCAATTA ATCTTGTAGC TCCAACGCCC 
GTTTCAATGA AAGAATTTGC AAGCAAACTT GGAGCTGTTA TGGGGCGACC TTCGCTTTTG 
CAAGTACCTG AATTTGCAGT CAAAATGCTT ATGGGCGAAG GGGGAGAATA TGCTGTTCGA 
GGGCAAAAAG TGCTTCCTAC CTTTCTTGAA AAACAAGGTT TTACATTCCG TTACCCTGAC 
CTTTCAAACG CACTTGGTGA TTTAATTAAG CACGGAAAGT AG

Protein sequence

MNNHIVITGA TGVIGVELAQ KLIKRGEKVV LLARSPNAAQ QKIPGAAAYV RWDSDMQEGE 
WKSTISGAKA VIHLAGKPLL ESRWNEEHKQ ECYQSRIIGT RHIVAAIAEA AEKPQVFISS 
SAIGYYGSFD KCSDTAPLTE SGNKGSDFLA HICIDWEEEA RKAENLVPRL VFLRTGIVLS 
TRGGMLQKMM TPFQYFAGGP IGTGLQCISW IHMDDEVNAI IASLDNSAYK GAINLVAPTP 
VSMKEFASKL GAVMGRPSLL QVPEFAVKML MGEGGEYAVR GQKVLPTFLE KQGFTFRYPD 
LSNALGDLIK HGK