Gene Arth_1944 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Arth_1944
Symbol
ID	4445528
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Arthrobacter sp. FB24
Kingdom	Bacteria
Replicon accession	NC_008541
Strand	-
Start bp	2193691
End bp	2195130
Gene Length	1440 bp
Protein Length	479 aa
Translation table	11
GC content	69%
IMG OID	639689754
Product	succinate semialdehyde dehydrogenase
Protein accession	YP_831426
Protein GI	116670493
COG category	[C] Energy production and conversion
COG ID	[COG1012] NAD-dependent aldehyde dehydrogenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGAACCTCA AATCAGCCCA ACACCTCGTC AACGGCACCT GGCACGCTAC CGGGACCTCC 
AAGCACGTGA CGGACCCCGG AAACGGCAGC ACCGTAGGTG AGGTCGCCTG GGGCACCGCC 
GGGGATGCCA CCCAGGCAGC CGACGCGGCC GCGGAGGCCC TTGGGTCCTG GTCACGCACC 
ACGGTGCGCA ACCGCGCCGA CCTGCTCCGC AGCGCAGCCG ACCTCCTTGC CGAACGCCGC 
GACGAACTCG CCCACACCCT GGCGCTCGAG GCGGGCAAGC GGCTCCCTGA AGCCCAGGGC 
GAGGTGGACT TCTCGGTGGA ATACTTCCGC TGGTTCGCCG AGGAAGTCCG CCGCTCCACC 
GGCACCGTCA GCCCGCCCGA ACTCCAGGGC CGGCGCCACC TCAGCCTCCG TAAACCTATC 
GGCGTGGCAC TCAGCCTCAC CCCATGGAAC TTTCCCGTAT CCATCCAGGC CCGCAAACTC 
GCCGCAATGC TGGCCGCAGG CTGCACCGTG GTGGGCCGGG TCTCCGAAAA GGCGCCGCTC 
GCCGCCACCG GCCTGTTTGA GGTCCTGCAC GACGCCGGGT TCCCCGCCGG CGTCGTCAAC 
CTGGTCCACG GGCCCTCGCG CGAAATTACC GCCGCCCTGA TGTCCCACCC GGCGGTCCGG 
GCCGTCAGTT TCACCGGTTC CACAGGCGTG GGCCGGCAGA TCATGGCGTC TGCATCGGAA 
CGCGTGGTCC GGCCCCTGCT CGAACTGGGC GGCAATGCAC CCTTCATCGT GTTCGAGGAT 
GCCGACCTGG ATGCCGCCGT CGAAGGTGCC GTCCTGGGCC GTCTCCGCAA CACAGGCCAG 
TCCTGCGTGG CCGCCAACCG GTTCCTGGTC CAGGACAGCA TCGCCGAGGA ATTTTCGCAG 
AAACTGGCGG CGCGGTTCGA CGCCATGAGC ATCGGCCACG GCGTTCCCGA CGACGGTTCT 
GACGTGCCGG ACCTCGGCCC CATGATCGAC GCCGATCGGG TGGCCGCCGT CCAGGCGCTG 
GTGGACGACG CCCTCGCGCG CGGCGCACGC CGCGTCACGC AGCGGACCGA TGTTCCGGCG 
CGCGGCGCGT TCATGGCTCC CACACTGCTC ACGGACGTCC CCGACGACGC ACCCCTGGTG 
AGCGAAGAAG TGTTCGGCCC GGCGGCCGGC GTCGTGACCT TCACGTCGGA AGAGGACGCT 
ATCCGCAAGG CGAACGCAAC CGAGATGGGC CTCGCCGCTT ACCTCTGGAG CCGCGATCCC 
AAGCGCGCCT GGGACATCCC CGAACGCCTG GAAGCCGGCA TCGTGGGGGT CAACGATCCC 
CTCCCCTCCG TAGCGTTCGC CCCCATGGGC GGCGCCAAGC AGTCCGGTCT GGGCCGCGAA 
GGAGCAAGCC TTGGCCTCGA GGAGTTCGAG GAGGTCCAGT ACGTGGCCTG GAGGCCGTAA

Protein sequence

MNLKSAQHLV NGTWHATGTS KHVTDPGNGS TVGEVAWGTA GDATQAADAA AEALGSWSRT 
TVRNRADLLR SAADLLAERR DELAHTLALE AGKRLPEAQG EVDFSVEYFR WFAEEVRRST 
GTVSPPELQG RRHLSLRKPI GVALSLTPWN FPVSIQARKL AAMLAAGCTV VGRVSEKAPL 
AATGLFEVLH DAGFPAGVVN LVHGPSREIT AALMSHPAVR AVSFTGSTGV GRQIMASASE 
RVVRPLLELG GNAPFIVFED ADLDAAVEGA VLGRLRNTGQ SCVAANRFLV QDSIAEEFSQ 
KLAARFDAMS IGHGVPDDGS DVPDLGPMID ADRVAAVQAL VDDALARGAR RVTQRTDVPA 
RGAFMAPTLL TDVPDDAPLV SEEVFGPAAG VVTFTSEEDA IRKANATEMG LAAYLWSRDP 
KRAWDIPERL EAGIVGVNDP LPSVAFAPMG GAKQSGLGRE GASLGLEEFE EVQYVAWRP