Gene Cag_1901 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cag_1901
Symbol
ID	3747646
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium chlorochromatii CaD3
Kingdom	Bacteria
Replicon accession	NC_007514
Strand	-
Start bp	2420036
End bp	2421094
Gene Length	1059 bp
Protein Length	352 aa
Translation table	11
GC content	46%
IMG OID	637774438
Product	3-isopropylmalate dehydrogenase
Protein accession	YP_380194
Protein GI	78189856
COG category	[C] Energy production and conversion [E] Amino acid transport and metabolism
COG ID	[COG0473] Isocitrate/isopropylmalate dehydrogenase
TIGRFAM ID	[TIGR00169] 3-isopropylmalate dehydrogenase

Plasmid Coverage information

Num covering plasmid clones	46
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAACTATA AAATTGTCTC TATTCCGGGT GATGGTATAG GTACCGAAGT TGTTGCTGGC 
GCTGTTGCTG TATTACGTCA ACTTGAAAAA AAATATGGCT TTACCGTTGA GATTGAAGAG 
CATCTTTTTG GTGGCGCTTC TTACGATGTG CATGGTGAAA TGTTAACCGA TGCTACGCTT 
GAAGCCTGCA AAAATTGCGA TGCCGTGCTG CTTGGAGCTG TTGGTGGTCC AAAATGGGAA 
AACCTTCCCC ACGAGCACAA GCCTGAAGCT GCGTTGCTTA AAATCCGCAA AGAGCTTGGC 
TTGTTTGCCA ACCTTCGCCC AGCAAAAGTG TATGATGCCT TAGTTGATGC TTCATCACTA 
AAAGCGGATG TTGTGCGTGG CACCGATTTT GTGGTTTTTC GTGAGCTAAC GGGTGGTATT 
TACTTCGGTC AACCTCGTGG CTACGATGAG AACAAAGGCT GGAACACCAT GGTTTATGAA 
AAGTATGAGG TTGAGCGTAT TGCTCGCCTT GCTTTTGAAG CGGCTCGCCA ACGCCAAGGG 
CGCGTTATGT CTATTGATAA GGCAAACGTC CTTGAAGTAT CACAATTGTG GCGGAACGTT 
GTTCACGCTG TACACGCCGA TTACCAAGAT GTTGAATTGA GTGATATGTA TGTGGATAAT 
GCTGCAATGC AAATTGTACG TAATCCAAAA CAGTTTGACG TTATTGTTAC TGGCAACCTT 
TTTGGTGATA TTCTGAGCGA TATTTCAGGC ATGATTACTG GTAGCCTTGG CATGTTGCCT 
TCGGCAAGCA TTGGTTCTAA GCACGCACTA TATGAGCCAA TTCACGGCAG TGCCCCCGAT 
ATTGCAGGAC AAAACAAAGC AAACCCCATT GCAACCATTG CTTCGGTAGC AATGATGTTT 
GAACACAGCT TTAAGCGTAC CGATATTGCT CGTGATATTG AACAAGCCAT TGAAGCTGCC 
CTTGCTACCG GTGTAAGAAC GGCAGACATT GCAGCAGCCG GCGATACAGC AGTTTCAACC 
ACAGCAATGA CTGAAGCCAT TATCAGCCAA CTGAAGTAA

Protein sequence

MNYKIVSIPG DGIGTEVVAG AVAVLRQLEK KYGFTVEIEE HLFGGASYDV HGEMLTDATL 
EACKNCDAVL LGAVGGPKWE NLPHEHKPEA ALLKIRKELG LFANLRPAKV YDALVDASSL 
KADVVRGTDF VVFRELTGGI YFGQPRGYDE NKGWNTMVYE KYEVERIARL AFEAARQRQG 
RVMSIDKANV LEVSQLWRNV VHAVHADYQD VELSDMYVDN AAMQIVRNPK QFDVIVTGNL 
FGDILSDISG MITGSLGMLP SASIGSKHAL YEPIHGSAPD IAGQNKANPI ATIASVAMMF 
EHSFKRTDIA RDIEQAIEAA LATGVRTADI AAAGDTAVST TAMTEAIISQ LK