Gene Noca_4473 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Noca_4473
Symbol
ID	4596992
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardioides sp. JS614
Kingdom	Bacteria
Replicon accession	NC_008699
Strand	-
Start bp	4728175
End bp	4729635
Gene Length	1461 bp
Protein Length	486 aa
Translation table	11
GC content	74%
IMG OID	639779084
Product	succinate semialdehyde dehydrogenase
Protein accession	YP_925657
Protein GI	119718692
COG category	[C] Energy production and conversion
COG ID	[COG1012] NAD-dependent aldehyde dehydrogenases
TIGRFAM ID	[TIGR01780] succinate-semialdehyde dehydrogenase

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.623002
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCTGACT TCACCCTCGC GCAGATCCCC GACCTGCCGC TCGACCTCTG CGTCGGCGGG 
AAGGAGGTCC CGGCGTCCGA CGGGGGCCGC TTCGACGTGC TCGACCCGGC CACCGGTGCC 
GTCCTCACCT CGGTCGCCAA CGGCACGGTC GAGGACGCCC TCGCCTGCGT CGACGCGGCC 
GACGCCGCCG CGGCCGCCTG GGCCGCGACC GCGCCGCGGG AGCGCTCGGA GATCCTGCGC 
AAGGCCTTCG AGCTGATGCG CGAGCGCGCC GACGAGCTCG CGCACCTGAT CTCCCTGGAG 
AACGGCAAGG CGCTGGCCGA CGCCCGCGGC GAGGTGGCCT ACGCCGCCGA GTTCTTCCGC 
TGGTACGCCG AGGAGGCGGT CCGCGCGGCC GGCTCCGTGA TGACCGCGCC GTCCGGGGCC 
AACCGGATCG TCGTGCTCCA GCAGCCGGTC GGCATCTGCG TGCTGGTCAC GCCGTGGAAC 
TTCCCCGCCG CGATGGCCAC CCGCAAGATC GGCCCGGCGC TGGCGGCCGG CTGCACCGTC 
GTGCTCAAGC CGGCCAGCGA CACCCCGCTC ACCGCGCTGC TGATGGCCAA GATCCTCGCC 
GACGCCGGCG TCCCCGCGGG CGTGGTCAAC GTGCTGCCCG CGCGCCGCTC GGGCGCCGTG 
GTGTCCGCGA TGCTGCACGA CCCGCGGGTC CGCAAGCTCT CCTTCACCGG CTCGACCGAG 
GTCGGCCGGG TGCTGCTGCG CGAGGCCGCC GACCAGGTCG TCAACTGCTC GATGGAGCTC 
GGCGGCAACG CGCCGTTCAT CGTCCTCGAC GACGCCGACC TGGATGCCGC CGTCGACGGC 
GCGATGATCG CGAAGATGCG CAACGCCGGC GAGGCCTGCA CCGCCGCGAA CCGCTTCTAT 
GTCCACGCCG ACGTGGCCGA CGAGTTCAGC CGCCGGCTCG CCGAGCGGAT GGCCGCGCTG 
CGGGTCGGCC CCGGCACGGC CGACGACACC GAGGTCGGCC CGCTGGTCAA CGACGAGTCG 
GCCGCCAAGG TCGACGAGCT GGTCCGGGGC GCGGTCTCGG CCGGCGCGCG GGTCGTGGTC 
GGCGGTCGCC GGCCGGAGCG CGAGGGCTAC TACTACGAGC CGACCGTGCT GCTCGACGTG 
CCCGTCGACG CGGAGATCCT GGGCGAGGAG ATCTTCGGAC CGGTCGCCCC GGTGGTGACG 
TTCACCGACG AGGACGACGC GATCCGGATG GCGAACGAGA CCGAGTACGG CCTGGTGTCC 
TACGTCTACA CGCGCGACCT GGCGCGGGGG ATGCGGGTCA GCGAGCGGCT CGACTCCGGC 
ATGGTCGGCC TCAACCGCGG GCTGGTCTCC GACCCGGCCG CGCCGTTCGG CGGCACCAAG 
CAGTCCGGCG TCGGCCGCGA GGGCGGCCAC GAAGGCATGC TCGACTACCT GGAGTCGAAG 
TACGTCGCGG TGTCCTGGTG A

Protein sequence

MADFTLAQIP DLPLDLCVGG KEVPASDGGR FDVLDPATGA VLTSVANGTV EDALACVDAA 
DAAAAAWAAT APRERSEILR KAFELMRERA DELAHLISLE NGKALADARG EVAYAAEFFR 
WYAEEAVRAA GSVMTAPSGA NRIVVLQQPV GICVLVTPWN FPAAMATRKI GPALAAGCTV 
VLKPASDTPL TALLMAKILA DAGVPAGVVN VLPARRSGAV VSAMLHDPRV RKLSFTGSTE 
VGRVLLREAA DQVVNCSMEL GGNAPFIVLD DADLDAAVDG AMIAKMRNAG EACTAANRFY 
VHADVADEFS RRLAERMAAL RVGPGTADDT EVGPLVNDES AAKVDELVRG AVSAGARVVV 
GGRRPEREGY YYEPTVLLDV PVDAEILGEE IFGPVAPVVT FTDEDDAIRM ANETEYGLVS 
YVYTRDLARG MRVSERLDSG MVGLNRGLVS DPAAPFGGTK QSGVGREGGH EGMLDYLESK 
YVAVSW