Gene Arth_3994 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Arth_3994
Symbol
ID	4447257
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Arthrobacter sp. FB24
Kingdom	Bacteria
Replicon accession	NC_008541
Strand	-
Start bp	4508552
End bp	4509766
Gene Length	1215 bp
Protein Length	404 aa
Translation table	11
GC content	67%
IMG OID	639691825
Product	malate dehydrogenase
Protein accession	YP_833469
Protein GI	116672536
COG category	[C] Energy production and conversion
COG ID	[COG0281] Malic enzyme
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	30
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGTCCACTG AAACAATCAC TCCCGCTGAC AGCTCCGCCA GTTCCTCCGA GGAGGCAACC 
GTGCTGACCG ACCAGGAGAT CTTCGAAGCC CACCAGGGCG GCAAGCTGTC CATCTCCAGC 
ACGGTTCCGC TGTCCAGCAA GCGCGATCTT TCCATTGCCT ACACTCCGGG TGTCGCCCAG 
GTCAGCCGCG CCATCCACGG CGAACCCGAG CTCGCCAAGA CCCTTACCTG GGCCCAGCGT 
CTGGTGGTTG TGGTCAGCGA CGGCACCGCC GTGCTGGGCC TCGGCAACAT CGGCCCCAGC 
GCGTCGCTTC CCGTCATGGA AGGCAAGTCC GCGCTCTTCA AGGCCTTCGG TGACCTGGAC 
TCCATACCGC TGGTACTGAA CACCACCGAC GTGGACGAGA TCGTTGAGAC CCTGGTACGC 
CTGCGCCCCA GCTTTGGCGC CGTGAACCTT GAGGACATCT CCGCTCCGCG CTGCTTCGAG 
CTTGAGGAAA AGCTCATCGA AGCCCTGGAC TGCCCCGTTA TGCACGATGA CCAGCACGGC 
ACCGCCGTCG TGGCCCTCGC CGCGCTGACC GGCGCAGCGA AGGTGACCGG CCGCGAACTC 
GAAGGACTCC GCGTTGTGGT TTCCGGTGCA GGTGCCGCGG GCATCGCTGT CGCGGAAATC 
CTGCTCACCG CCGGCATCCA GGACGTCGTC CTGCTCGATT CACGCGGCGT CATCAACAAG 
GACCGCGCGG ACATCGCAGC CGACCCCGCC AGCAAGAAGG GCCAGATGGC GCAGCGCAGC 
AACCCGCGCG GAATCACCGG CGGCCCCGGC GAGGCGCTGC TCGGAGCCGA TGTGTTCATC 
GGCGTCTCTT CCTCGAAGCT GGACGAGGAG CACCTGAAGC TCATGAACCA CAGCTCCATC 
GTGTTCGCCC TTTCCAACCC GGATCCCGAA GTCCTGCCGG AGGTCGCCTC ACGCTACGCC 
GCCGTTGTGG CCACGGGACG CAGCGACTTC CCCAACCAGA TCAACAACGT GCTGGCCTTC 
CCTGGAATCT TCCGCGGAGC GCTGGACGCC GGCGCCCGCC GGATCACGCC CGCCATGAAG 
CTTGCCGCCG CCCGCGCCAT CGCTGAACTG GCCGAAGCAG AGCTGTCCGC CGACTACATC 
GTGCCCAGCC CGCTGGATCC GCGAGTCGCA CCGGCCGTTT CCGCCGCCGT GGCCGCAGCG 
GTCGAGGCGG AGTAA

Protein sequence

MSTETITPAD SSASSSEEAT VLTDQEIFEA HQGGKLSISS TVPLSSKRDL SIAYTPGVAQ 
VSRAIHGEPE LAKTLTWAQR LVVVVSDGTA VLGLGNIGPS ASLPVMEGKS ALFKAFGDLD 
SIPLVLNTTD VDEIVETLVR LRPSFGAVNL EDISAPRCFE LEEKLIEALD CPVMHDDQHG 
TAVVALAALT GAAKVTGREL EGLRVVVSGA GAAGIAVAEI LLTAGIQDVV LLDSRGVINK 
DRADIAADPA SKKGQMAQRS NPRGITGGPG EALLGADVFI GVSSSKLDEE HLKLMNHSSI 
VFALSNPDPE VLPEVASRYA AVVATGRSDF PNQINNVLAF PGIFRGALDA GARRITPAMK 
LAAARAIAEL AEAELSADYI VPSPLDPRVA PAVSAAVAAA VEAE