Gene Arth_0823 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Arth_0823
Symbol
ID	4446661
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Arthrobacter sp. FB24
Kingdom	Bacteria
Replicon accession	NC_008541
Strand	+
Start bp	890814
End bp	892325
Gene Length	1512 bp
Protein Length	503 aa
Translation table	11
GC content	67%
IMG OID	639688630
Product	methylmalonate-semialdehyde dehydrogenase [acylating]
Protein accession	YP_830321
Protein GI	116669388
COG category	[C] Energy production and conversion
COG ID	[COG1012] NAD-dependent aldehyde dehydrogenases
TIGRFAM ID	[TIGR01722] methylmalonic acid semialdehyde dehydrogenase

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCAACGA CGACCGTCAC CACCACCATC AACCACTTCA TCAACGGGGC CGAGGCCGCC 
GGCGAAGGCG ACCGGACCCA GCCCGTTTAC AACCCCGCCA CCGGCGCCGT CTCCGCAGAG 
CTGCGGCTGG CCAGCCGGGC GGACCTGGAC GCCACCGTTG CCGCCGCCCG CAAAGCCGCC 
GACAGCTGGG GAGACATCTC CCTGGCCAAG CGCACCGCGG TGCTGTTCAA GTTCCGCGAA 
CTCGTCGCAG CCCACGTGGA CGACCTCGCC GAGCTGATCA CCGCCGAACA CGGCAAGGTC 
CTCTCCGATG CCAAGGGCGA GATCGGCCGC GGCCTCGAAG TCATTGAATT CGCCTGCGGG 
ATCCCCACCC TGCTCAAGGG CGACTACTCG GACCAGGTCT CCACCGGCAT CGACGTCTTC 
TCCTTCCGCG AGCCGCTCGG CGTCGTCGCC GGCATCACGC CGTTCAACTT TCCTGTCATG 
GTCCCGCTGT GGATGGCGCC GATGGCCATC GCCACCGGCA ACGCCTTCAT CCTCAAGCCC 
TCCGAGCGCG ACCCGTCCGC CTCGATGCTG CTGGCCAAGC TGTGGAAGGA GGCAGGCCTT 
CCCGACGGCG TCTTCCAGGT CCTGCACGGC GACAAGGAAA CCGTGGACGG CCTCCTGACC 
CACCCGGACG TGGACGGCAT CTCCTTCGTC GGCTCCACCC CGATCGCCCA GTACGTCCAC 
GAGACCGCCA CCAAGCACGG CAAGCGCGTC CAGGCCCTGG GCGGTGCGAA GAACCACGCC 
ATCGTGATGC CCGACGCCGA CCTGGACAAC GCCGCCGACC ACCTCGCTGC TGCCGCCTTC 
GGTTCCGCCG GCGAACGCTG CATGGCCATC TCCGTTGCCG TCGCCGTCGG CGATGCCGCC 
GAACTGCTGG TCAAAAAAGT CGAAGAGCGC GCCCTCGCCG TCAAGGTCAA CAACGGCACC 
GCACCCGACG CCGAAATGGG CCCGGTCATT ACGCCCGCCT CCAAGGAACG CATCGTCAGG 
ATCGTCACCG AAGCAGAAGC CGCGGGCGCC GCGATGGTGG TGGACGGTCG CGACCTGGTG 
GTCCCCGGCC ACGAGGAAGG CTTCTGGGTG GGCCCCACCG TACTGGACCA CGTCAAGACC 
GAAATGACCG CCTACACCGA GGAAATCTTC GGACCGGTCC TCGTCGTCGT CCGGGTGGAG 
GACCTGGAGG CAGGCATCGC CCTGATCAAC TCGAACCCGT ACGGCAACGG CACCGCGATC 
TTCACCTCCT CCGGCGCCAA CGCCCGCAAG TTCCAGCGCT CCGTGACCGT GGGCATGATC 
GGCATCAACG TGCCGCTGCC CGTTCCCGTG GCCTACCACT CCTTCGGCGG CTGGAAGGCC 
TCCCTGTTCG GTGACAAGCA CATCTACGGC CCGGAAGGCG TCTCCTTCTA CACCCGTGGC 
AAGGTAGTTA CCTCACGCTG GCCCGAGCCC ACCCACGCCT CGGGTGCCTC CTACAACTTC 
CCGTCCAACT AG

Protein sequence

MSTTTVTTTI NHFINGAEAA GEGDRTQPVY NPATGAVSAE LRLASRADLD ATVAAARKAA 
DSWGDISLAK RTAVLFKFRE LVAAHVDDLA ELITAEHGKV LSDAKGEIGR GLEVIEFACG 
IPTLLKGDYS DQVSTGIDVF SFREPLGVVA GITPFNFPVM VPLWMAPMAI ATGNAFILKP 
SERDPSASML LAKLWKEAGL PDGVFQVLHG DKETVDGLLT HPDVDGISFV GSTPIAQYVH 
ETATKHGKRV QALGGAKNHA IVMPDADLDN AADHLAAAAF GSAGERCMAI SVAVAVGDAA 
ELLVKKVEER ALAVKVNNGT APDAEMGPVI TPASKERIVR IVTEAEAAGA AMVVDGRDLV 
VPGHEEGFWV GPTVLDHVKT EMTAYTEEIF GPVLVVVRVE DLEAGIALIN SNPYGNGTAI 
FTSSGANARK FQRSVTVGMI GINVPLPVPV AYHSFGGWKA SLFGDKHIYG PEGVSFYTRG 
KVVTSRWPEP THASGASYNF PSN