Gene Noca_3633 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Noca_3633
Symbol	gabD2
ID	4597456
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardioides sp. JS614
Kingdom	Bacteria
Replicon accession	NC_008699
Strand	-
Start bp	3852802
End bp	3854424
Gene Length	1623 bp
Protein Length	540 aa
Translation table	11
GC content	73%
IMG OID	639778241
Product	succinic semialdehyde dehydrogenase
Protein accession	YP_924820
Protein GI	119717855
COG category	[C] Energy production and conversion
COG ID	[COG1012] NAD-dependent aldehyde dehydrogenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCGCCC AGAGCCCGAC TCCCGCCGGC GGCCCGGTCG TCGAAGGCCC GTTCGACCCC 
GAGCACGACC CGACGGCGGC CTACGCCCTC GAGCCGGAGT ACGCCGACGC GCTCACCCGG 
CGCCTGGTCG CCACCGCCGG CCGCTCGGTC CAGGTCCGGT CCCCGCTCAA CGACGCCCCG 
CTCGGGCACG TCCCGCAGTC CACCGTCGAG GACGTCGCGA CGGCATTCGA GCGGGCCCGA 
AGGGCGCAGG TCGCCTGGGC CCGCACCCCG CTCGCGGAGC GCTCGGCGAT CCTGCTGCGG 
CTGCACGACC TGGTGCTCGA CCACCAGGAC GAGATCATCG ACCTGATCGT CTGGGAGAGC 
GGCAAGGCCC GCAAGCACGC CTTCGACGAG CCGCTGCACG TCGCGCTGAC CGCCCGCTAC 
TACGCGCGCA CCGCCAAGCG GCACCTCGGC ACCGAGCGCA AGATCGGGGT CGTGCCCGGC 
CTGACCCGGG TCGAGGTCAA CCACAACCCG GTCGGCGTCG TCGGGATCAT CTCGCCCTGG 
AACTACCCCT TCAACCTGGC GCTGATCGAC GGCATCGCCG CGCTGATGGC CGGCAACGCG 
GTCGTCGCCA AGCCGGACTC GCAGACGATG CTCTCCGCGC TGCTCGGTGC CCGGCTGCTC 
GATCAGGCCG GCCTGCCGCG CGACCTGTGG CAGGTCGTCG CCGGCCCGGG CGCGGAGATC 
GGCGGCGCGA TCGTCGAGCG GGCCGACTAC GTCTGCTTCA CCGGCTCGAC CGCCACCGGC 
CGGTCGATCG CGAAGGGCTG CGCGGACCGG CTGATCGGCT GCTCGCTCGA GCTCGGCGGC 
AAGAACCCGC TCCTCGTGCT CCGCGACGCC GACCTCGAGA AGGCCGCGGA GGGCGCCGTA 
CGCGCCTCGT TCTCCAACGC CGGCCAGTTG TGCGTCTCGA TGGAGCGGAT CTTCGTCGCC 
GACCAGCTCT ACGACCGGTT CGTGGACCGG TTCGTGGCCC GCACCGAGGC GCTGACCCTC 
GGCGCGACCC TGGACTGGGG CAACGACATG GGCCCGCTGA TCTCCCAGGC CCAGCTCGAC 
ACGGTCACCG CCCACGTCGA CGACGCGGTC GCCAAGGGCG CCCGGGTGCT CGCCGGCGGC 
AAGGCCCGCC CCGACCTCGG CCCGTACTTC TTCGAGCCGA CCATCCTCGA GGGGGTCAGC 
CCCGACATGA CCTGCTTCGG CAAGGAGACC TTCGGGCCGG TCGTGTCGCT CTACCGGTTC 
CACGACGAGG TCGACGCCGT CGCCCGGGCC AACGACGGCG AGTACGGCCT GAACGCCTCG 
GTCTACAGCC GCGACGGCGC CCGGGCGCGG CTGATCGCCC GGCACCTGCG CTGCGGGACC 
GTCAACGTCA ACGAGGCCTT CGCCGCGACC TTCGCGAGCA TCGACGCCCC GATGGGCGGC 
ATGCGCGAGT CCGGCGCCGG CCGCCGCCAG GGCGCGATGG GCGTCCGGCG GTTCACCGAG 
ACCCAGGCCG TCGCGACCCA GCGGCTGATC CGGTTCGCCC CGCAGTACGG CATGTCCGAC 
CAGATGTACG CCAAGGTCAT GAACGCCAAC CTGCGCCTGA TGAAGAAGGT GGGACGCGCA 
TGA

Protein sequence

MSAQSPTPAG GPVVEGPFDP EHDPTAAYAL EPEYADALTR RLVATAGRSV QVRSPLNDAP 
LGHVPQSTVE DVATAFERAR RAQVAWARTP LAERSAILLR LHDLVLDHQD EIIDLIVWES 
GKARKHAFDE PLHVALTARY YARTAKRHLG TERKIGVVPG LTRVEVNHNP VGVVGIISPW 
NYPFNLALID GIAALMAGNA VVAKPDSQTM LSALLGARLL DQAGLPRDLW QVVAGPGAEI 
GGAIVERADY VCFTGSTATG RSIAKGCADR LIGCSLELGG KNPLLVLRDA DLEKAAEGAV 
RASFSNAGQL CVSMERIFVA DQLYDRFVDR FVARTEALTL GATLDWGNDM GPLISQAQLD 
TVTAHVDDAV AKGARVLAGG KARPDLGPYF FEPTILEGVS PDMTCFGKET FGPVVSLYRF 
HDEVDAVARA NDGEYGLNAS VYSRDGARAR LIARHLRCGT VNVNEAFAAT FASIDAPMGG 
MRESGAGRRQ GAMGVRRFTE TQAVATQRLI RFAPQYGMSD QMYAKVMNAN LRLMKKVGRA