Gene Caci_1946 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caci_1946
Symbol
ID	8333289
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Catenulispora acidiphila DSM 44928
Kingdom	Bacteria
Replicon accession	NC_013131
Strand	-
Start bp	2201182
End bp	2202951
Gene Length	1770 bp
Protein Length	589 aa
Translation table	11
GC content	67%
IMG OID	644955095
Product	aspartate aminotransferase
Protein accession	YP_003112707
Protein GI	256391143
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0436] Aspartate/tyrosine/aromatic aminotransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.346248
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	0.0292973
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGACCGCCA CCACTCCGGA GAAGAAGAGC GCCGCGCGCG CCAAGGCTGG CAGCGCCAGG 
AGCGCCAAGA GCGCTAGGGG CGCCACCGCC AAGAACAACA CCGCCGCTCC GCGCAAGCGT 
GTCCCCTCCA CGGTCACGTC GGCGGGCCTG TCCCGCGGCA AGATCAAGGA GTGGTCCGCC 
CTGAGTCCGT TCGAGCTCAA GGGTGAGCTG ATCGCGCTGG CGGCCGACAC GCACAAGAAG 
TCGGCCGCGC AGATGCTCAA CGCCGGGCGC GGGAACCCGA ACTGGATCGC GACCGGGCCG 
CGCGAGGCGT ATCTGGCGCT GGGTGCCTTC GCGCTGCAGG AGTCGCGGCG GGTCTGGACC 
ATGGACAACC TCGGCGGGAT GCCGGAGGTG GCCGGGAGCG GCGTGCGCTT CGACCGCTTC 
TGCCTGGCGA ATCCGGGGAT GACCGGGGTG CGGCTGCTGC GCGACATGGT GGACTACGGC 
GTCACCCAGC TGAAGTTCGA CGCCGACGCG TGGATCGGCG AGCTCACCGA CGCCTGGATC 
GGCGACCACT ACCCGGACCC GCCGCGGGCG CTCAAGCACT GCCAGAAGGT CGTGCGCGCC 
TATCTGGCCG AGGAGATGTA CGGCGGAAAG ACGCCCGGCA AGGTCGACGT CTTCCCGACC 
GAGGGCGGCA CGGCGGCGAT GTGCTACCTG TTCGACACGC TGGTCACCAA CGGCATCCTG 
CACCCCGGCG ACACCATCGC CCTGATGACG CCGATCTTCA CGCCCTACAT CGAGATCCCC 
GAGCTGGAGC GTTACTCCTT CAACGTAATC CAGGTGAAGT CGGACATGAT GACCGAGGAG 
GGCGTCCACA TGTGGCGCTA CCCCGACTCC GAGGTCGACC GGCTGGCGGA CCCGAAGGTC 
AAGGCCGTGA TGCTGGTGAA CCCCTCGAAC CCGCCGTCGA TGGCGATGTC CGACCGGGTC 
CGCGACCGCA TCGCCGACAT CATCCGGACC AAGAACCCGA ACCTGGCGAT CATCACCGAC 
GACGTCTACG GCACGTTCGT CCCCGGCTTC CGCTCCCTGG CCGCGACCTG CCCGCGCAAC 
ACGGCGCTGG TCTACTCCTG GTCCAAGCAC TACGGCGCGA CCGGCCACCG CCTCGGCGTG 
ATCGCGGTGG CCGAGGACAA CGTCTTCGAC CAGATGCTCG CCAAGCTCCC GAAGGCGAAG 
AAGGACGAGC TGCGCCGGCG TTACAGCACC CTGACTCTGC ACCCTGAGAA GACGAAGTTC 
ATCGACCGCC TGGTCGCCGA CAGCCGCGCG GTCGCGTTGA ACCACACCGC GGGCCTGTCC 
ACCCCGCAGC AGACGATGAT GATGCTGTTC TCCCTGTTCG ACCTGCTGCC GGAGGGCCAG 
GAGTACAAGG AGCTGCTGCG CACGATCGTC CACCGCCGCC TGGACCTGCT GATGGAGGGC 
ATCGGCGTCC ACCACATCAG CGACGACCCG GACCGCGCCT GCTACTACGT CGAGCTGGAC 
ATCCTCGCCG AGGCCGAGGC CTTCGAGAGC CGGGAGTTCG CCGACTTCCT GATGGAGACC 
TACGAACCCA CCGACGTGGT GTTCCGCCTG GCGCATCAGG CCTCTGTCGT GCTGCTGAAC 
GGCGGCGGCT TCGACGGACC GGGATGGTCG GTGCGGGTGT CGCTGGCGAA CCTGGACGAC 
TTGGACTACC TGAAGATCGG GCATCACCTG CACGCGATCA TGGAGGAGTA CAAGGAAGAG 
TGGCTGAAGA CCAAGACCAA GAAGAAGTGA

Protein sequence

MTATTPEKKS AARAKAGSAR SAKSARGATA KNNTAAPRKR VPSTVTSAGL SRGKIKEWSA 
LSPFELKGEL IALAADTHKK SAAQMLNAGR GNPNWIATGP REAYLALGAF ALQESRRVWT 
MDNLGGMPEV AGSGVRFDRF CLANPGMTGV RLLRDMVDYG VTQLKFDADA WIGELTDAWI 
GDHYPDPPRA LKHCQKVVRA YLAEEMYGGK TPGKVDVFPT EGGTAAMCYL FDTLVTNGIL 
HPGDTIALMT PIFTPYIEIP ELERYSFNVI QVKSDMMTEE GVHMWRYPDS EVDRLADPKV 
KAVMLVNPSN PPSMAMSDRV RDRIADIIRT KNPNLAIITD DVYGTFVPGF RSLAATCPRN 
TALVYSWSKH YGATGHRLGV IAVAEDNVFD QMLAKLPKAK KDELRRRYST LTLHPEKTKF 
IDRLVADSRA VALNHTAGLS TPQQTMMMLF SLFDLLPEGQ EYKELLRTIV HRRLDLLMEG 
IGVHHISDDP DRACYYVELD ILAEAEAFES REFADFLMET YEPTDVVFRL AHQASVVLLN 
GGGFDGPGWS VRVSLANLDD LDYLKIGHHL HAIMEEYKEE WLKTKTKKK