Gene Namu_4420 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Namu_4420
Symbol
ID	8450046
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nakamurella multipartita DSM 44233
Kingdom	Bacteria
Replicon accession	NC_013235
Strand	-
Start bp	4904157
End bp	4905326
Gene Length	1170 bp
Protein Length	389 aa
Translation table	11
GC content	71%
IMG OID	645043467
Product	Cystathionine gamma-synthase
Protein accession	YP_003203696
Protein GI	258654540
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0626] Cystathionine beta-lyases/cystathionine gamma-synthases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	34
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGCCTG CCCCCGGTCC CCACGACCCG CAGTCCCCGG GTTTTGCCAC CCGCGCCATC 
CACGCCGGCC AGGATCCGGA CCCGCTGACC GGAGCGGTGG CCGTGCCGAT CTACCAGACC 
TCGACGTTCG CGCAGGACGA GGTCGGCCAG CCGCGGGCCG GCTACGACTA CTCCCGCGCC 
GGCAACCCGA CCCGGACTGC GCTGGAACAG GCGCTGGCCG CCTTGGAGGG GGGTCGCTCG 
GGTTTCGCCT TCGCCTCCGG GATGGCCGCC GCCGATACCT ACATCCGCGC CGCGCTGCGA 
CCGGGCGACC ACCTGATCCT GCCCGACGAC GCCTACGGCG GCACCTTCCG CCTGGTCGAC 
AAGATCTGCG TGCCATGGGG TCTGACCTAC TCGACGGTGT CGCTGGGCGA CCTGGCCGCG 
GTCCGCGCGG CGATCCGGCC GACCACCAAG GTCATCTGGT GCGAGACGCC GACCAACCCG 
CTGCTGGGCA TCGCCGACAT TGCCGCACTG GCCGAGATCG CCCACGAGAG CGGTGCGAAG 
CTGTTGGTGG ACAACACCTT TGCCTCGCCC TACCTGCAGC AGCCGCTGGC TCTGGGAGCC 
GACGTGGTGC TGCACTCGAC GACCAAGTAC GTGGGCGGGC ATTCCGACGT GATCGGCGGG 
GCGTTGATCG TGGACGACCC GGAGTTGGCC GAGGCCCTGG CCTTCCACAG CAAGTCGATG 
GGCGCGGTGC CCGGCCCGGT CGACGCCTGG CTGACCCTGC GCGGCGTGAA AACCCTGGCC 
GTGCGGATGG ACCGGCACTG TGACAACGCC GAGCGGGTGG TGGAGCTGCT GGTCGGGCAC 
CCCCGGGTGG CCCGGGTCTA CTACCCGGGC CTGCCCGCCC ATCCGGGTCA CGCGATCGCG 
GCGCGGCAGA TGCGCCGGTC CGGCGGCATG GTGTCCTTCA GCGTGGTCGG CGGGCAGGAG 
GAGGCCCTCA AGGTGTGCCG GCGAACCCAG TTGTTCACGC TGGGGGAGTC GCTCGGTGGG 
GTGGAATCGT TGATCGAGCA TCCCGGGCTG ATGACCCACG CCAGCGTCGC CGGCTCCGCG 
CTGCAGGTGC CGGACGACTT GATCCGGCTC TCCGTCGGCA TCGAGGACGC CGACGACCTG 
CTGGCCGACC TGCGGGACGC CCTCGACTGA

Protein sequence

MTPAPGPHDP QSPGFATRAI HAGQDPDPLT GAVAVPIYQT STFAQDEVGQ PRAGYDYSRA 
GNPTRTALEQ ALAALEGGRS GFAFASGMAA ADTYIRAALR PGDHLILPDD AYGGTFRLVD 
KICVPWGLTY STVSLGDLAA VRAAIRPTTK VIWCETPTNP LLGIADIAAL AEIAHESGAK 
LLVDNTFASP YLQQPLALGA DVVLHSTTKY VGGHSDVIGG ALIVDDPELA EALAFHSKSM 
GAVPGPVDAW LTLRGVKTLA VRMDRHCDNA ERVVELLVGH PRVARVYYPG LPAHPGHAIA 
ARQMRRSGGM VSFSVVGGQE EALKVCRRTQ LFTLGESLGG VESLIEHPGL MTHASVAGSA 
LQVPDDLIRL SVGIEDADDL LADLRDALD