Gene Cag_1229 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cag_1229
Symbol
ID	3748262
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium chlorochromatii CaD3
Kingdom	Bacteria
Replicon accession	NC_007514
Strand	-
Start bp	1631078
End bp	1632223
Gene Length	1146 bp
Protein Length	381 aa
Translation table	11
GC content	50%
IMG OID	637773762
Product	homocitrate synthase
Protein accession	YP_379533
Protein GI	78189195
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0119] Isopropylmalate/homocitrate/citramalate synthases
TIGRFAM ID	[TIGR02660] homocitrate synthase NifV

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCCAAATT CTGCAATGGA GCTGCGCAAA TCGTGGATTA TTGATACCAC CTTGCGCGAT 
GGCGAGCAAG CCCCTGGTGT GGTGTTTAGT GCGGAGGAGA AGCGCGATAT TGCAGCGCAA 
CTTGCGGCAG CAGGTGTTAG TGAATTGGAG GTTGGTTACC CCGCCATTAG TGGCGATGAG 
TTAGAAACCA TCCGCTCAAT TGTTGCTATG CGTCTGCCTT TGCGTGTAAC AAGCTGGGCG 
CGTGCAAAGT GGGATGATAT TGAGGCTGCT CGCCAAAGTG GCACCGAAGC GGTTCATATT 
AGTTTTCCTG TATCGGCGCT TTATTTGCAA TTAATGGAGC GCTCTTACGA GTGGGTGCAG 
GAGCAGTTAA GCGAATTAAT CGGCAAAGCC AAAGATTATT TCGAGTTTGT GAGTGTTGGG 
GCGCAAGATG CCACCCGTGC GGATATTGAG CTGCTTTCGC GCTTTGTTTG TGATGCAAGC 
GCGGCAGGCG CTCAGCGCAT TCGCCTTGCC GATACGGTGG GAATTGCCAC GCCAATTTCC 
GTGATGCACC TTATTGGGGA ACTGCAACGA GTTACTTCAG TGGATCTTGA ATTTCATGCT 
CATAACGATC TTGGTATGGC TACAGCAAAT GCGTTTACAG CCCTTGCTGT TGGTTGCCAA 
GCCGTTAGTG TGTCGGTAAC GGGGCTTGGC GAACGGGCGG GCAACGCTGC GCTTGAAGAG 
CTTGCAATTG CTTTGAAACT TTCGGGAGAG TTTGAAGCCA CCATAAAAAC TGAAATGTTG 
TCGAGCTTAT GCGAAACGGT AAGCAAAGCG GCTGGTAGGG TGATTGATGA GCGCAAAGCC 
GTGATTGGCA AAGCTGTTTT TCAGCACGAA TCGGGCATTC ACTGTGCCGC ATTGTTGAAG 
CATCCGCTCT CTTATCAGCC ATTTTTACCC GAACAAATTG GCGGTAGAGA GCATGAATTG 
GTGATTGGCA AGCATTCGGG AAGTGCGGCT ATTCAGCACT TTTTTGCCGA GCGAGGCATT 
CCGCTGAGCC GCAGCGAGGC AACACAGTTG TTAGCAAAGG TTCGCCAAAT GGCGACTGAA 
AAAAAAGGAT TGCTTACAGC TAAAGAACTT GAAGAGCTTT ATACAGAACT GTTTAATATT 
CATTGA

Protein sequence

MPNSAMELRK SWIIDTTLRD GEQAPGVVFS AEEKRDIAAQ LAAAGVSELE VGYPAISGDE 
LETIRSIVAM RLPLRVTSWA RAKWDDIEAA RQSGTEAVHI SFPVSALYLQ LMERSYEWVQ 
EQLSELIGKA KDYFEFVSVG AQDATRADIE LLSRFVCDAS AAGAQRIRLA DTVGIATPIS 
VMHLIGELQR VTSVDLEFHA HNDLGMATAN AFTALAVGCQ AVSVSVTGLG ERAGNAALEE 
LAIALKLSGE FEATIKTEML SSLCETVSKA AGRVIDERKA VIGKAVFQHE SGIHCAALLK 
HPLSYQPFLP EQIGGREHEL VIGKHSGSAA IQHFFAERGI PLSRSEATQL LAKVRQMATE 
KKGLLTAKEL EELYTELFNI H