Gene Noca_4004 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Noca_4004
Symbol	gabD2
ID	4598139
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardioides sp. JS614
Kingdom	Bacteria
Replicon accession	NC_008699
Strand	-
Start bp	4225593
End bp	4227152
Gene Length	1560 bp
Protein Length	519 aa
Translation table	11
GC content	70%
IMG OID	639778609
Product	succinic semialdehyde dehydrogenase
Protein accession	YP_925188
Protein GI	119718223
COG category	[C] Energy production and conversion
COG ID	[COG1012] NAD-dependent aldehyde dehydrogenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCACTCC AGCGACCGGC GTCGATCACC GACGCGTTCC TCGAGCGGCT CGTGGCCCGC 
GTGCCGTCGA CCAGCGGCGG CACCTGGAAG CTCACCGAGG TCTACACCGG TGACCTGCTC 
GTGGAGCTCC CGCAGTCGAC ACCCGCCGAC ATCGAGGCGG CGTTCGCGGC GGCGCGCGCG 
GCCCAGCGCT CGTGGGCGGC CCGACCGCTC AAGGAGCGGC TCGAGGTGTT CAAGCGCGCG 
CACGCCCTGT TCCTCGACAA CGCCCACACC ACGACCGACC TGATCCAGGT CGAGAGCGGC 
AAGAACCGGC GGATGGCCAT CGAGGAGACC TGCGACCCGG TGATGGTGAT GAGCCACTAC 
CTCAAGCGGG CCCCGCACCT CCTCAAGCCG GTCAAGCGCG GCGGGCCGAT CCCGTTCTTG 
TCCAGCTCGA CCGAGATCCG CCAGCCCAAG GGCGTCGTCG GGATCATCGC GCCGTGGAAC 
TTCCCGTTCG CGACCGGCAT CTCCGACTCG ATCCCGGCGC TGATGGCCGG CAACGCGATC 
GTGCTCAAGC CGGACAACAA GACGGCGCTC TCGCCGCTGT ACGGCGTGCA GATGCTCGAG 
GAGGCCGGCC TGCCGAAGGG GCTCTTCCAG GTGGTCTGCG GCGAGGGCCC GGACGTCGGC 
CCGACGCTGA TCGACAACGC CAACTACGTG ATGTTCACCG GCTCGACCGC GACCGGTCGG 
GTGATCGGGG AGCGGGCCGG GCGCAACCTA ATCGGCTGCT GCCTCGAGCT CGGCGGCAAG 
AACCCGATGA TCGTGCTCGA GGACGCGGAC CTCGACGAGG TCGTGCAGGG CGCGATCTTC 
GGCGCGTTCG GCAACACCGG CCAGATCTGC ATGCACATCG AGCGGATGTA CCTGCCCGCG 
TCGAGGTACG ACGAGTTCCG CTCGCGGTTC GTCGCTGCGA CCGAGGCGCT GACCATCGGC 
GCGGCGTACG ACTTCGGCCC CGACATGGGC TCGCTGGTCT CGCCGGACCA CATGGAGCGG 
GTCCGGGGGC ACGTCGACGA CGCCGTGGCC AAGGGCGCCA CCGTGCTCAC CGGCGGCCGG 
TCACGGCCCG ACCTCGGCCC GGCCTTCTTC GAGCCGACCA TCCTGGAGGG CGTCACCCAG 
GACATGCTCT GCGGCGTCAC CGAGACCTTC GGCCCGGTCG TCGCGCTGCA CCGGTACGCG 
ACCGTCGACG AGGCGATCGC ACTCGCGAAC GACACCGACT ACGGGCTGAA CGCCTCGGTG 
TGGGGCGGCG ACATCGCCAG CGCCTGCCAG GTCGGCCAGC GGATCGAGAC GGGCAACGTG 
AACGTCAACG ACATCCTCGC GACGGCGTAC GCGTCCAAGG GCACGCCCTC GGGCGGCGTC 
AAGCAGTCCG GCGTGGGCGC CCGGCACGGC GACCAGGGCC TGCTGAAGTA CACCGACGTG 
CAGAACCTCG CCGTCTTGAA GAAGCAGGTG ATGGGCGCGC GGCCCGGCCA GGACTACGAG 
AAGTACGTCA AGGGGATGCT CAGCGGCCTG CGGATGATGC GCAAGACCGG CATCCGCTAG

Protein sequence

MALQRPASIT DAFLERLVAR VPSTSGGTWK LTEVYTGDLL VELPQSTPAD IEAAFAAARA 
AQRSWAARPL KERLEVFKRA HALFLDNAHT TTDLIQVESG KNRRMAIEET CDPVMVMSHY 
LKRAPHLLKP VKRGGPIPFL SSSTEIRQPK GVVGIIAPWN FPFATGISDS IPALMAGNAI 
VLKPDNKTAL SPLYGVQMLE EAGLPKGLFQ VVCGEGPDVG PTLIDNANYV MFTGSTATGR 
VIGERAGRNL IGCCLELGGK NPMIVLEDAD LDEVVQGAIF GAFGNTGQIC MHIERMYLPA 
SRYDEFRSRF VAATEALTIG AAYDFGPDMG SLVSPDHMER VRGHVDDAVA KGATVLTGGR 
SRPDLGPAFF EPTILEGVTQ DMLCGVTETF GPVVALHRYA TVDEAIALAN DTDYGLNASV 
WGGDIASACQ VGQRIETGNV NVNDILATAY ASKGTPSGGV KQSGVGARHG DQGLLKYTDV 
QNLAVLKKQV MGARPGQDYE KYVKGMLSGL RMMRKTGIR