Gene Arth_1755 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Arth_1755
Symbol
ID	4445724
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Arthrobacter sp. FB24
Kingdom	Bacteria
Replicon accession	NC_008541
Strand	-
Start bp	1962049
End bp	1963542
Gene Length	1494 bp
Protein Length	497 aa
Translation table	11
GC content	67%
IMG OID	639689575
Product	succinate semialdehyde dehydrogenase
Protein accession	YP_831247
Protein GI	116670314
COG category	[C] Energy production and conversion
COG ID	[COG1012] NAD-dependent aldehyde dehydrogenases
TIGRFAM ID	[TIGR01780] succinate-semialdehyde dehydrogenase

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCATCC AGGCAACCAC CAACCCGCAG ACCTCGCAGA AGGCGCTCGA CGCCGTCGCC 
AAGGTCAGCA CCAACCTCTA CATTGACGGA GAATGGGCCG AAGCGGCCTC CGGCGCCCGG 
TTCGACGTCA TCAACCCCGC CACCGAGGAA GTCATCGCTT CCGTCGCCGA CGGCGGCCCC 
GAGGACGCCC GCCGCGCCAT CGAAACCGCC GGCCGCGTGC AGAAGCAGTG GGCCAAGACC 
GCACCCCGGG AGCGCAGCGA GATCCTGCGC CGCGCCTTCG ATCTGATCAT GGCCCGCCAG 
GACGAGCTGG CCCTGATCAT GACCACGGAA ATGGGCAAGC CCTTCGCCGA GGCCAAGGGC 
GAGGTGGCCT ACGCCGCCGA GTTCTTCCGC TGGTTCTCGG AGGAAGCCGT CCGCATCGGC 
GGTGACATGA CCACCACCGG CGACGGCAAG AACCGCATTC TGGTCACGAA GGAGCCGGTT 
GGCCCGTGCG TCCTGGTGAC GCCCTGGAAC TTCCCGCTGG CCATGGGCAC CCGGAAGATC 
GGCCCCGCCA TCGCAGCGGG CTGCACCATA GTCTTCAAGC CGGCCAACCT CACCCCGCTG 
TCCTCGCTGG CGCTGGCGGA CATCCTGATC GAGGCCGGCC TCCCCAAAGG CGTACTGAAC 
GTTGTCACCA CCACCAAAGC CTCAGAGGTG GTGACCCCGT GGATGGAAAG CGGCATTGCC 
CGCAAGGTCA GCTTCACCGG TTCCACCGGC GTGGGCGTGC GCCTGCTGGA GCAGGCGGCC 
AAGAACGTCA TGCGCTCCTC GATGGAACTG GGCGGAAACG CACCCCTCAT CGTGTTCGAG 
GACGCAGACC TGGACCGCGC CGTGGAAGGT GCGTTCGCCG CCAAGATGCG GAACATGGGC 
GAGGCCTGCA CAGCCGCCAA CCGCATCTTC GTCCAGCGCT CCGTTTCCGC CGACTTCTCC 
GCCCGGCTCG CCAAGCGGCT CGGTGCCCTG AAAGTGGGCG ACGGCGCAGT GGACGGCACC 
GACGTCGGCC CCCTCGTGGA GGAGAAAGCG CTGAACAAGG TCCAGGAACT CGTGGATGAC 
GCCGTTTCCA AGGGCGCCAC CGTGATCTGC GGCGGGTCCC GCCCCGAGGG CAAAGGCTAC 
TTCTACTCCC CCACCGTGCT GTCCGATGTC AGCTCCGACG CCGCACTGAT GAGCGAGGAA 
ATCTTCGGCC CGGTGGCCCC AATCATCCCC TTCGACACCG AAGAGGAAGT GGTCCGGCTG 
GCCAACGACA CCCCGTGGGG CCTGGCCAGC TACGTGTTCA CCCAGGACCT GGACCGCGCC 
TTCCGCGTCG GCGACGAACT CGAGGTAGGC ATGGTTGGCC TGAACACGGG CATCGTCTCC 
AACCCGGCAG CGCCGTTCGG CGGCATCAAG GCCTCCGGCC TGGGCCGTGA AGGCGGACGC 
GTGGGCCTGG ACGAGTTCCT GGAGATCAAG TACATGGCAA TCCCGCGCGT CTAA

Protein sequence

MSIQATTNPQ TSQKALDAVA KVSTNLYIDG EWAEAASGAR FDVINPATEE VIASVADGGP 
EDARRAIETA GRVQKQWAKT APRERSEILR RAFDLIMARQ DELALIMTTE MGKPFAEAKG 
EVAYAAEFFR WFSEEAVRIG GDMTTTGDGK NRILVTKEPV GPCVLVTPWN FPLAMGTRKI 
GPAIAAGCTI VFKPANLTPL SSLALADILI EAGLPKGVLN VVTTTKASEV VTPWMESGIA 
RKVSFTGSTG VGVRLLEQAA KNVMRSSMEL GGNAPLIVFE DADLDRAVEG AFAAKMRNMG 
EACTAANRIF VQRSVSADFS ARLAKRLGAL KVGDGAVDGT DVGPLVEEKA LNKVQELVDD 
AVSKGATVIC GGSRPEGKGY FYSPTVLSDV SSDAALMSEE IFGPVAPIIP FDTEEEVVRL 
ANDTPWGLAS YVFTQDLDRA FRVGDELEVG MVGLNTGIVS NPAAPFGGIK ASGLGREGGR 
VGLDEFLEIK YMAIPRV