Gene Caci_2033 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caci_2033
Symbol
ID	8333377
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Catenulispora acidiphila DSM 44928
Kingdom	Bacteria
Replicon accession	NC_013131
Strand	+
Start bp	2303274
End bp	2304845
Gene Length	1572 bp
Protein Length	523 aa
Translation table	11
GC content	68%
IMG OID	644955183
Product	glycine dehydrogenase subunit 2
Protein accession	YP_003112794
Protein GI	256391230
COG category	[E] Amino acid transport and metabolism
COG ID	[COG1003] Glycine cleavage system protein P (pyridoxal-binding), C-terminal domain
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	5
Plasmid unclonability p-value	0.00105152
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	25
Fosmid unclonability p-value	0.440854
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAGCGGGT CTTCGTCGCA GGGTCCTGTT TCGGCGGAGG ACGCGCGGAT CGCGCCGAAG 
CCTCGGTTGC GGCGGTTCCA TCAGGCGCGG TGGGACGAGC CGTTGATTTT TGAGCTGAGC 
AGTCCGGGGG AGCGGGGGGT CGGGGTTCCG GTCACCGACC TTCCGGTGCC TTCGCTGCCA 
GCGGGGTTGG CGCGTGCTGC GGCGCCCTTG CTGCCGGAGA TGTCGCAGCC GCATGTGCTG 
CGGCACTACA TGCGGCTTTC GCAGGAGACG TTGGGGGTCG ATCTGAACGT CGACATCGGG 
CAGGGCACGT GCACGATGAA GTACAGCCCG AAGGTGAACG ACTCCTTCGT CCGGGACGCG 
CGGATCGCCG AGCTGCATCC GTTGCAGGAC GAGGGGACGG TGCAGGGCGT GCTGGAGATT 
CTGTATCGGC TGGAGGGGTT GCTGAAGGAG ATATCCGGGA TGGACCGGGT GTCGTTGCAG 
CCGGGATCGG GGTCCTCGGC GATCTATGCG AACGTGTCGA TGATCCGGGC GTACCACGCC 
TCGCGGGGGG AAGGCGAGCT GCGGGACGAG GTCATCACGA CGCAGTTCTC GCACCCGACG 
AACGCGGCGG CGCCGAAGAC CGCCGGGTAC CGCGTCATCA CCCTGATGCC GGACGCCGAC 
GGGTATCCGG ACATCGAGGC GCTGCGGGCG GCGGTCGGCC CGCGGACGGC GGCACTGCTC 
ATCACGAACC CCGAGGACAC GGGCATCTTC AACCCGCGCA TCGAGGAGTT CGTGCGGCTG 
GTGCACGAGG CCGGCGGCCT GTGCTGCTAC GACCAGGCGA ACGCCAACGG GATCCTGGGG 
ATCACGCGCG CTCGCGACGC CGGCTTCGAC CTGTGCCACT TCAACCTGCA CAAGACGTTC 
TCCACACCGC ACATGTGCGG CGGTCCGGCG GCAGGCGCGT CCGCGGTGAC ATCGGCGCTG 
GAACCCTTCC TCCCGCGACC GACCGTGGAG TTCGACGGGA CACGGTACCG ACTGGACGAC 
GACCGCCCGG AGTCCATCGG GAAGATCCGC CCCTTCTACG GCGTGGTACC GAACCTCGTA 
CGCGCCTACG CATGGATCAT GGCCCTCGGC GGAGAAGGCC TACGCACGGT CGCCGAGACA 
GCGGCACTGA ACAACAACTA CTTGATTTCA AAGGTGCTGC AGATCAAGGG CGTCTCGCTG 
CCCTACGCAC AGGGCCGGCG CCGAGTGGAG CAAGCACGCT ACAGCTGGCA GAAGCTGAAC 
GCGGACACCG GCATCCACTC CGAGGAACTC GGCTACCGCG TAGCGGACTT CGGCACCCAC 
TACTGGACCA GCCACCACCC CTACCTGGTC CCGGAACCCA TGACCCTCGA GCCGACGGAG 
TCCTACTCGC AAGCGGACCT GGACGAATAC GCGGCGATCC TGGCCGAGGC CGCACGCGAG 
GCCTACGAGG ACCCCGAGCT GGTCCGCAGC GCACCCCACA ACGGCCCGAT CCACCGCATG 
CGAGACGCCT CGCTGGAGGA CCCGGGAACG TGGGCGGTGA CGTGGCGCGC GTACCGACGG 
AAGCTCGGGT GA

Protein sequence

MSGSSSQGPV SAEDARIAPK PRLRRFHQAR WDEPLIFELS SPGERGVGVP VTDLPVPSLP 
AGLARAAAPL LPEMSQPHVL RHYMRLSQET LGVDLNVDIG QGTCTMKYSP KVNDSFVRDA 
RIAELHPLQD EGTVQGVLEI LYRLEGLLKE ISGMDRVSLQ PGSGSSAIYA NVSMIRAYHA 
SRGEGELRDE VITTQFSHPT NAAAPKTAGY RVITLMPDAD GYPDIEALRA AVGPRTAALL 
ITNPEDTGIF NPRIEEFVRL VHEAGGLCCY DQANANGILG ITRARDAGFD LCHFNLHKTF 
STPHMCGGPA AGASAVTSAL EPFLPRPTVE FDGTRYRLDD DRPESIGKIR PFYGVVPNLV 
RAYAWIMALG GEGLRTVAET AALNNNYLIS KVLQIKGVSL PYAQGRRRVE QARYSWQKLN 
ADTGIHSEEL GYRVADFGTH YWTSHHPYLV PEPMTLEPTE SYSQADLDEY AAILAEAARE 
AYEDPELVRS APHNGPIHRM RDASLEDPGT WAVTWRAYRR KLG