Gene Noca_4341 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Noca_4341
Symbol
ID	4596859
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardioides sp. JS614
Kingdom	Bacteria
Replicon accession	NC_008699
Strand	-
Start bp	4588817
End bp	4590247
Gene Length	1431 bp
Protein Length	476 aa
Translation table	11
GC content	72%
IMG OID	639778951
Product	adenylosuccinate lyase
Protein accession	YP_925525
Protein GI	119718560
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0015] Adenylosuccinate lyase
TIGRFAM ID	[TIGR00928] adenylosuccinate lyase

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.272251
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGACCGTCC CCAACGTCCT GGCCACCCGC TACGCCTCCG CCGAGCTGGC GCGGATCTGG 
TCGCCGGAGC ACAAGATCGT GCTGGAGCGG CAGCTCTGGA TCGCGGTCCT GGAGGCGCAG 
CGCGACCTCG GGATCGCGGT GCCGGACGGT GTCGTCGAGG CCTACCGCGG CGTCGCGGAG 
CTCGGTGAGA AGGGGGTGGA CCTCGAGTCG ATCGCGGCCC GCGAGCGGGT GACCCGGCAC 
GACGTGAAGG CCCGGATCGA GGAGTTCTCG GCGCTGGCGG GTCACGAGCA CATCCACAAG 
GGCATGACCT CGCGCGACCT CACCGAGAAC GTCGAGCAGC TGCAGGTCAG GCAGAGCGTG 
GCGCTGGTCC GCGACCGGGC GGTCGCGGCA CTGGCCCGGC TCGCCCGGCT GGCCGCCGAG 
CACGAGGCCA CCGTGATGGC CGGACGCAGC CACAACGTCG CCGCCCAGGC GACCACGCTC 
GGGAAGCGGT TCGCGACCGT GGCCGACGAG ATGCTGGTCG CCCTCGACCG GGTCGAGGAC 
CTGCTGGTGC GCTACCCGCT GCGCGGGATC AAGGGGCCGA TGGGGACCGC GCAGGACATG 
CTCGACCTGC TCGACGGCGA CGCCGCCAAG CTGGCCGAGC TCGAGCAGCG GGTCGCGGCG 
CACCTGGGCT TCGAGCGGGT GCTGACCAGC GTCGGGCAGG TCTACCCGCG CAGCCTCGAC 
CTCGACGTCG TCAGCGCCCT GGTCCAGCTG GTGTCCGGAC CGTCGAACCT CGCGACCACG 
ATCCGGCTGA TGGCCGGCAA CGAGCTGGTG ACCGAGGGCT TCAAGGAGGG CCAGGTCGGC 
TCCTCGGCGA TGCCGCACAA GATGAACAGC CGCTCCGCCG AGCGGGTCAA CGGGCTCTCG 
GTCGTGCTCC GCGGCCACCT CTCGATGGTC AGCGAGCTGG CCGGCGACCA GTGGAACGAG 
GGCGACGTCT CCGACTCCGT CGTCCGCCGG GTGGCCCTGC CGGACGCGTT CTTCGCCGCC 
GACGGGCTGT TCGAGACGTT CCTGACGATC CTCGACGAGT TCGGGGCCTT CCCGGCCGTC 
ATCCAGCGCG AGCTGGACCG CTACCTGCCG TTCCTCGCCA CCACGAAGGT GCTGATGGCC 
GCGGTTCGCA ACGGGGTGGG CCGGGAGGCC GCCCACGAGT CGATCAAGGA GGCGGCGGTC 
GGCACCGCCC TCGACATGCG CCGCGGCCAG GCCGACAACG ACGTCTTCGC CCGGCTGGCC 
GCCGACACCC GGCTGGGGCT GACCTCCGAC CAGCTGGCGT CCCTGGTGGC CGAGCCGATC 
ACGTTCACCG GCGCGGCGGT CGCGCAGGTG CAGGCCGTCG TACGCCGGGT CGCCGAGGTG 
ACCGACCGGC ACCCCGCGGC CGCGGCGTAC GCACCCGGCG ACATCCTCTA G

Protein sequence

MTVPNVLATR YASAELARIW SPEHKIVLER QLWIAVLEAQ RDLGIAVPDG VVEAYRGVAE 
LGEKGVDLES IAARERVTRH DVKARIEEFS ALAGHEHIHK GMTSRDLTEN VEQLQVRQSV 
ALVRDRAVAA LARLARLAAE HEATVMAGRS HNVAAQATTL GKRFATVADE MLVALDRVED 
LLVRYPLRGI KGPMGTAQDM LDLLDGDAAK LAELEQRVAA HLGFERVLTS VGQVYPRSLD 
LDVVSALVQL VSGPSNLATT IRLMAGNELV TEGFKEGQVG SSAMPHKMNS RSAERVNGLS 
VVLRGHLSMV SELAGDQWNE GDVSDSVVRR VALPDAFFAA DGLFETFLTI LDEFGAFPAV 
IQRELDRYLP FLATTKVLMA AVRNGVGREA AHESIKEAAV GTALDMRRGQ ADNDVFARLA 
ADTRLGLTSD QLASLVAEPI TFTGAAVAQV QAVVRRVAEV TDRHPAAAAY APGDIL