Gene Noca_4578 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Noca_4578
Symbol
ID	4598676
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardioides sp. JS614
Kingdom	Bacteria
Replicon accession	NC_008699
Strand	+
Start bp	4845978
End bp	4847138
Gene Length	1161 bp
Protein Length	386 aa
Translation table	11
GC content	76%
IMG OID	639779187
Product	aminotransferase, class I and II
Protein accession	YP_925760
Protein GI	119718795
COG category	[E] Amino acid transport and metabolism
COG ID	[COG1168] Bifunctional PLP-dependent enzyme with beta-cystathionase and maltose regulon repressor activities
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.764552
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

TTGAATGACT GCGTGACCAG GCAGTTGATC CGCGACCTCA CCGACGACCA GGCCCGCTCC 
GCGTTCCCGC TCAAGTGGGG TGCGGTCGAA CCCGGAGTGG TGCCGGGCTG GGTCGCGGAG 
ATGGACTACC GGCCCGCGCC GCCGATCGAG GAGGCCCTGG TCGCGACGGT CCGGCAGGGC 
GCGCTCGGGT ACGCCGCGTT CGGGGACGGC GGCCTCGGCG AGGCGTTCGC GGGGTTCGCG 
AAGCGGCACT GGGACTGGTC GGTCCCGGCC GAGTCCGTGC TGCCGACCGG CGGCGTCATG 
GGCGGGATCC GGCTGGCGCT CGAGGCGCTC TGCCCGCCCG GCCCGGTCGT GGTGCCGCTG 
CCCTGCTACC CGCCGTTCCG CGACGCCGTC GCGATCACCG GCCGCGAGCT GGTCACGGTC 
ACGGTCGACC CCGACGCCGA CGAGGCGGTG CTCGACCTGG CCGCCGTGGA GGCGGCGTTC 
GCGGCCGGCA CCCGGACCTT CCTGCTCTGC AACCCGCACA ACCCGCTGGG CCGGGCCTGG 
TCGCGCGAGG AGCTGACCGA GCTGGCGGAG CTGGCCCGGC GGTACGACGT GCGCGTGGTC 
TCCGACGAGA TCCACGCCCC GCTGGTGCTG GCCGGCGCGA CGTTCACGCC GTACCTCACC 
GTCGACGAGC GCGCGGTGGT CGTGACCAGC GCGTCGAAGA GCTTCAACGT CCCCGGGGTG 
CACGGCGCTC AGCTGGTGCT GCTCGACGCG GCCGACCGGG CGGTGTTCGC CGGGCTGCCG 
GTGCCGGCGC AGAACAGCTG GTCGTCGCTG GGCATCGTCG CCGGCGTGGC CGCCTGGCGC 
GACGGGGACG AGTGGCACGC GGCGCTCCTC GAGCGGCTGA CGGCGCAGCG CGCGCTGCTC 
GGCGACCTGC TCGCGACCCG GCTCCCCCGG GCCCGGATGC GGCCGCTGGA GGCGACGTAC 
CTCGCCTGGC TCGACCTGCG GGCGTACGGC GTCGACGACC CGGCCGCCGC CGGGCTCGCG 
CACGGGGTGC GGCTGGCGCC GGGCAGCGAC TACCAGCCGG GGCTGGACGG GCACGTGCGG 
CTCAACCTCG CGACGAACGC GGACCGGCTG GAGCTGATGG TCCACCGCCT GGCCACCGCC 
CTGACCTCGC GGAACTCCTA G

Protein sequence

MNDCVTRQLI RDLTDDQARS AFPLKWGAVE PGVVPGWVAE MDYRPAPPIE EALVATVRQG 
ALGYAAFGDG GLGEAFAGFA KRHWDWSVPA ESVLPTGGVM GGIRLALEAL CPPGPVVVPL 
PCYPPFRDAV AITGRELVTV TVDPDADEAV LDLAAVEAAF AAGTRTFLLC NPHNPLGRAW 
SREELTELAE LARRYDVRVV SDEIHAPLVL AGATFTPYLT VDERAVVVTS ASKSFNVPGV 
HGAQLVLLDA ADRAVFAGLP VPAQNSWSSL GIVAGVAAWR DGDEWHAALL ERLTAQRALL 
GDLLATRLPR ARMRPLEATY LAWLDLRAYG VDDPAAAGLA HGVRLAPGSD YQPGLDGHVR 
LNLATNADRL ELMVHRLATA LTSRNS