Gene Cag_1968 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cag_1968
Symbol
ID	3747830
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium chlorochromatii CaD3
Kingdom	Bacteria
Replicon accession	NC_007514
Strand	-
Start bp	2500292
End bp	2501587
Gene Length	1296 bp
Protein Length	431 aa
Translation table	11
GC content	49%
IMG OID	637774504
Product	glutamate-1-semialdehyde aminotransferase
Protein accession	YP_380259
Protein GI	78189921
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0001] Glutamate-1-semialdehyde aminotransferase
TIGRFAM ID	[TIGR00713] glutamate-1-semialdehyde-2,1-aminomutase

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCCTCAAA TCACCCGTTC TATTGAACTC TTTGAAAAAG CAAAGAAGTT TATCCCCGGT 
GGCGTTAACT CACCAGTACG CGCCTTTAAA TCTGTTGGCG GCACACCAAT TTACATGGCA 
AAAGGCTCTG GCGCTTACAT GACCGACGTG GACGGCAACA CCTACCTCGA TTACGTTGGT 
TCATGGGGAC CATTCATTCT CGGCAGTATG CACCCACGCA TTACCGCTGC ACTTGAGTAC 
ACGCTAAAAA ATATTGGCAC CAGCTTTGGT ACACCAATTG AGATGGAAAT TGAAATTGCT 
GAACTGCTTT GCCAAATTGT GCCTTCACTT GAAATGGTGC GTATGGTAAA CAGCGGCACC 
GAAGCCACCA TGTCAGCCGT GCGCCTTGCA CGCGGTTACA CCGGTCGCGA TAAAATCATC 
AAATTTGAAG GTTGCTACCA CGGGCACGGC GATAGCTTCC TCATTAAAGC AGGTTCAGGC 
GCTCTTACGC TTGGTGCTCC CGATAGCCCT GGCGTTACCA AAGGCACAGC TCAGGACACT 
CTGAACGCAA CCTATAACGA CATCGAATCA GTAAAGTTGC TTGTTCAAGA GAACAAAGGC 
AACGTTGCTG CAATTATTAT TGAACCTGTT GCTGGTAACA CCGGTGTTAT TCCAGCCCAA 
CCCGGATTCC TTGCTGCACT CCGTCAGCTT TGCGACGAAG AAGGCATTGT GCTGATTTTT 
GACGAAGTGA TGTGCGGCTT CCGCGTAGCA CTTGGCGGCG CACAAAGCCT TTATGGCGTT 
ACCCCCGACC TTACCACAAT GGGCAAAATT ATTGGCGGTG GTCTGCCTGT TGGTGCATTT 
GGCGGCAAAC GCAAGCTCAT GGAGCGCGTT GCACCACTTG GCGACGTTTA CCAAGCTGGT 
ACGCTTTCAG GTAACCCGCT GGCACTGACC GCTGGTCTTG AAACCTTGAA AATTCTCATG 
GATGAGAATC CATATCCAGA GCTTGAAAGA AAAGCTGTTA TTCTTGAAGA GGGCTTTAAA 
GCAAACCTTG CAAAACTTGG CTTGAACTAT GTTCAGAACC GTGTTGGTTC CATGTCGTGC 
CTCTTCTTTA CCGAAACGCC TGTTGTGAAC TACACAACCG CTATTACGGC TGATACCAAG 
AAGCACGCCA AATACTTCCA CTCATTGCTC GATCAAGGCA TTTACACGGC TCCATCGCAG 
TTTGAAGCAA TGTTCATCAG CTCAGTAATG ACCGACGAAG ATTTGGATAA AACCATCAAA 
GCAAACTACA ACGCTTTGGT TGCTTCACAG CAATAA

Protein sequence

MPQITRSIEL FEKAKKFIPG GVNSPVRAFK SVGGTPIYMA KGSGAYMTDV DGNTYLDYVG 
SWGPFILGSM HPRITAALEY TLKNIGTSFG TPIEMEIEIA ELLCQIVPSL EMVRMVNSGT 
EATMSAVRLA RGYTGRDKII KFEGCYHGHG DSFLIKAGSG ALTLGAPDSP GVTKGTAQDT 
LNATYNDIES VKLLVQENKG NVAAIIIEPV AGNTGVIPAQ PGFLAALRQL CDEEGIVLIF 
DEVMCGFRVA LGGAQSLYGV TPDLTTMGKI IGGGLPVGAF GGKRKLMERV APLGDVYQAG 
TLSGNPLALT AGLETLKILM DENPYPELER KAVILEEGFK ANLAKLGLNY VQNRVGSMSC 
LFFTETPVVN YTTAITADTK KHAKYFHSLL DQGIYTAPSQ FEAMFISSVM TDEDLDKTIK 
ANYNALVASQ Q