Gene Caci_6634 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caci_6634
Symbol
ID	8337998
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Catenulispora acidiphila DSM 44928
Kingdom	Bacteria
Replicon accession	NC_013131
Strand	-
Start bp	7642861
End bp	7643961
Gene Length	1101 bp
Protein Length	366 aa
Translation table	11
GC content	72%
IMG OID	644959728
Product	glutamate--cysteine ligase GCS2
Protein accession	YP_003117321
Protein GI	256395757
COG category	[S] Function unknown
COG ID	[COG2170] Uncharacterized conserved protein
TIGRFAM ID	[TIGR02050] uncharacterized enzyme

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	0.136582
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCCGCGA CTGTCCCGAT CGACCAAGTA CTCAGCATCG GTGTCGAAGA GGAATTCGTC 
CTCGCCGACG CCACCACCCG GGTGTCGGCG CCGCGGGCCG ACGACGTCGT GGAGAAGGCG 
CGGCTGCGGC TGGGCGACAA CGCTCAGCAC GAATTCTTCG CCACACAGGT GGAGTTCACC 
ACGCGGCCTC GCATGACCGC CGAGGAGGTG CGCGCCGAAC TCGTCCGGGG ACGCCAGGCC 
GGCGCGGCTG CCGCGGCGGA CACCGGCTGC CTGCTGGTCG CCGGGGGCAG CGCCGTGCTG 
AACCGCTCGC CGCTGCCCGT CGCGCCGAAC GCCCGCTACG AGACCATCGC GCGCCGCCAC 
CTCGGCGGCA TGCGCAGCGA GTCCAGCGGG TGCCACGTCC ACGTCGGTAC GCTGACGCGC 
GGCGACGCGC TGCTGCTGAG CAACCACCTG GGACCGTGGC TGCCGGCCCT GCAGGCGTTG 
TGCGTGAACT CGCCCTTCGC CGCCGGGGAG GACCGCCACT GCGCGAGCTG GCGCCACTTC 
GACATCCAGG CGCTGCCGAC CGTCGGGCCG ACGCCGATCC TGGACGAGCC GGCCTACGAG 
CGCACCGCGG ACAGGCTGGT CGCTGACAGG ACCCTGCTGG ACCGCAAGAT GATCTATTGG 
TACGCCCGGC CGTCCGAGCA CTGTCCCACC TTGGAGATCC GGATCGCCGA CGCCAACCCC 
GACCTCGACG TCGTCATGCT CTTCACGCTC CTGCTGCGCG GACTTGCGAC GACGTTGCTG 
GCGGAGGCGC GGTACGGCCG TCCGTGGCCC AGTATGGACC GACGGTTGCT GACCGAGGCC 
CACCGCAGGG TCGCGGTGGA CGGCCTGCCC GCCCTCACCA CCGATCCCCG GACCGGGATG 
CTGATCTCGA CGGCCGCACT GCTGGACCGA CTGGTCGAGC GCAGCCGCCC GGGCCTGGCC 
GCCGCGGGTG ACGAAGACCT CGTGGCAGCG CTGCTGGCCC GGTTCCACTC GCGCGGCACT 
CCTGCCGACC GGCAGCGTGC CGTGTATCGG GAGCGTGGAC GTCTGGCCGA TGTCGTGGAC 
TGGCTCGCGG TGCGGCCGTA G

Protein sequence

MAATVPIDQV LSIGVEEEFV LADATTRVSA PRADDVVEKA RLRLGDNAQH EFFATQVEFT 
TRPRMTAEEV RAELVRGRQA GAAAAADTGC LLVAGGSAVL NRSPLPVAPN ARYETIARRH 
LGGMRSESSG CHVHVGTLTR GDALLLSNHL GPWLPALQAL CVNSPFAAGE DRHCASWRHF 
DIQALPTVGP TPILDEPAYE RTADRLVADR TLLDRKMIYW YARPSEHCPT LEIRIADANP 
DLDVVMLFTL LLRGLATTLL AEARYGRPWP SMDRRLLTEA HRRVAVDGLP ALTTDPRTGM 
LISTAALLDR LVERSRPGLA AAGDEDLVAA LLARFHSRGT PADRQRAVYR ERGRLADVVD 
WLAVRP