Gene Noca_4199 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Noca_4199
Symbol
ID	4596713
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardioides sp. JS614
Kingdom	Bacteria
Replicon accession	NC_008699
Strand	+
Start bp	4437625
End bp	4439193
Gene Length	1569 bp
Protein Length	522 aa
Translation table	11
GC content	70%
IMG OID	639778805
Product	aldehyde dehydrogenase
Protein accession	YP_925383
Protein GI	119718418
COG category	[C] Energy production and conversion
COG ID	[COG1012] NAD-dependent aldehyde dehydrogenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGACCCCCA CAGGTGCCTC GCTCATCGCA GGCAGGTCGG TCGTCGGCAC TGCTGGCAGC 
ACGCGTGCCC ACAACCCCGC CACGGGCGAG GCTCTCGGCC CCGAGTTCGG TTACGCGGGC 
CCCGAGGACC TCGCCGCCGC GACCCGCGCC GCGACTGAAG CCTTCGAGCC CTACCGGGCT 
ACCTCCCCGA GCGAGCGGGC TGCGTTCCTC GACCTCATCG CGGACAACCT CGACGCGGCG 
AGGGACGCCA TCGTCGCCCG CGCCGTCCTG GAGTCCGGTC TGACGGAAGC GCGGCTGTTC 
GGCGAGCACG CCCGTACTGT CAACCAGCTC CGCCTGTTCG CACGCGAGGT CCGCCTGGGC 
GAACACCACG GCGTACGCAT CGACGAGGCG CAACCAGACC GCCAGCCGAT CCCAGCGCCG 
GATATCCGTC AGCGCCAGAT CTCCATCGGC CCGGTCCTGG TATTCGGCGC GAGCAACTTC 
CCGCTGGCGT TCTCCACCGC CGGAGGTGAC ACGGCATCGG CGTTGGCCGC CGGCTGCCCC 
GTGATCGTGA AGGCGCACAA CTCCCACGCG GGCACCGCCG AACTCGCCGG CCGCGCGATC 
TCCGATGCGG TCGCCCAGTC GGGGTTGCCC GCCGGCGTCT TCTCGATCAT CTTCGGCGCA 
GGCAGCGCCG TCGGGCAAGC CCTCGCCCAG GACCCGGCCA TCAAGGCCAT CGCGTTCACC 
GGCTCACAGG CCGCCGGCAC CGCACTGATG GCCACGGCCG CGGCTCGTCC GGAGCCCATT 
CCGGTGTACG CCGAGATGTC GAGCATCAAT CCCGTGATCC TTCTGCCGGG TGCGGTCGCC 
GAGTGTGCCG AGGCGCTCGC CACGGGCTTC GTCGGATCGC TGACGCTGGG TGCCGGCCAG 
TTCTGCACCA ATCCCGGGCT CATCTTCGTC CCCGCCGGCC AGGCAAGGTT CGTCGAGGCT 
GTCGGCGAGC TCCTCCGGGA ATCCGTCGGC CAGACGATGC TCTCGGCGAA TATCGCCGCC 
GCCTATACGG AGGGTCTCGA ACGACTAGCT GACGCCGGGG TCACCCAGGT TGCGACCGGT 
GCTGAGGGGG CGACGCTCAA CGCACCCGCC CCGGCGCTCT TCACGACCAC TGCTGCGCAC 
TTCCGCGATT CACCGGACAT GCAGGAGGAG GTCTTCGGCG CCGCAGCCCT CGTCGTCACC 
TACGACGACC AGGCCGAGCT ACGCGAGACG CTGCGGGAGA TGCAGGGACA GCTGACCGCG 
ACCATTCATG CGGCGATCGG TGATCAGGCC CTCGCGGCCG ACCTGCTGCC CGTGCTCGAG 
ACCATGGCCG GGCGCATCCT CTTCAACGGG TGGCCGACCG GGGTCGAGGT CACCCACGCC 
ATGGTGCACG GTGGCCCGTT CCCCGCTACC AGTAATGCGA TGACGACCTC GGTCGGCACG 
CTCGCGATCC AACGCTTTCT CCGGCCGGTC AGCTACCAGA ACCTGCCGGC GTCGCTACTT 
CCCGAGCCAC TGCGGGTGGA TAACCCCTGG CACCTGCCCC GTCGCCTGAA TGGGATGCCG 
CAGACGTGA

Protein sequence

MTPTGASLIA GRSVVGTAGS TRAHNPATGE ALGPEFGYAG PEDLAAATRA ATEAFEPYRA 
TSPSERAAFL DLIADNLDAA RDAIVARAVL ESGLTEARLF GEHARTVNQL RLFAREVRLG 
EHHGVRIDEA QPDRQPIPAP DIRQRQISIG PVLVFGASNF PLAFSTAGGD TASALAAGCP 
VIVKAHNSHA GTAELAGRAI SDAVAQSGLP AGVFSIIFGA GSAVGQALAQ DPAIKAIAFT 
GSQAAGTALM ATAAARPEPI PVYAEMSSIN PVILLPGAVA ECAEALATGF VGSLTLGAGQ 
FCTNPGLIFV PAGQARFVEA VGELLRESVG QTMLSANIAA AYTEGLERLA DAGVTQVATG 
AEGATLNAPA PALFTTTAAH FRDSPDMQEE VFGAAALVVT YDDQAELRET LREMQGQLTA 
TIHAAIGDQA LAADLLPVLE TMAGRILFNG WPTGVEVTHA MVHGGPFPAT SNAMTTSVGT 
LAIQRFLRPV SYQNLPASLL PEPLRVDNPW HLPRRLNGMP QT