Gene Arth_3433 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Arth_3433
Symbol
ID	4444163
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Arthrobacter sp. FB24
Kingdom	Bacteria
Replicon accession	NC_008541
Strand	+
Start bp	3866523
End bp	3868121
Gene Length	1599 bp
Protein Length	532 aa
Translation table	11
GC content	66%
IMG OID	639691257
Product	malate synthase
Protein accession	YP_832908
Protein GI	116671975
COG category	[C] Energy production and conversion
COG ID	[COG2225] Malate synthase
TIGRFAM ID	[TIGR01344] malate synthase A

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.680692
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCTCTCA CAGTCACAGA CCCGCAGCCG ATTGCACGAG CAGAGGAAAT CCTCACCCCG 
AAGGCACTGG CCTTCGTGGA GGAGCTCCAC AAGCGGTTTG CGGGCACCCG CGCCGAACTC 
CTCAAAGCCC GCGTGGCCAA GCGCGAGCAG GTAGCCCGGA CCGGAAAGCT TGATTTCCTG 
TCCGAAACCA AGGATGTCCG CGAGGGCGAC TGGAAGGTTG CGCCGGCGCC CGCCGCGCTG 
CAGGACCGCC GCGTGGAAAT GACCGGACCC GCCTCGCCGG CCAAGATGGC CATCAATGCC 
CTCAACTCCG GCGCCAAGGT GTGGCTGGCC GACCTCGAGG ACGCCAGCAC GCCCACCTGG 
GCCAACGTCA TTGACGCCAT CCTGAACCTC CGCGATGCCG CCACGGGAAC CCTGAGCTAC 
ACCTCCCCGG AGGGCAAGGA ATACCGGCTC CGCTCCGACG CCCCGCTCGC CGTCGTGGTG 
GCCCGGCCCC GCGGCTGGCA CATGGACGAG CACCACCTGC TGCTCGACGG CGAACACACC 
GTGGGCGCGC TGGTGGACTT CGGCCTGCAC TTCTTCCACA CGGCCAAGCA GCTCCTGCTC 
AACGGCCAGG GCCCGTACTA CTACCTGCCG AAGATGGAGA GCCACCTTGA GGCGCGCCTC 
TGGAACGACG TGTTCGTCTT CGCGCAGGAT TTCCTGGGCA TTCCGCAGGG CACCATCAAG 
GCCACCGTGC TGATCGAGAC GATCCCCGCG GCCTTCGAGA TGGACGAGAT CCTGTACGAG 
CTCCGCGACC ACGCCGCCGG GCTCAACGCC GGCCGCTGGG ACTACCTGTT CAGCATCATC 
AAGTACTTCC GCGACGCCGG AGCGGACTTT GTACTGCCGG ACCGCGCCAC CGTGGCCATG 
ACGGCACCGT TCATGCGGGC CTACACCGAG CTGCTCGTCA AGACCTGCCA CCACCGCGGC 
GCGTTTGCCA TGGGAGGCAT GGCCGCAGTC ATCCCCAACC GTCGCGAACC CGAGGTCACC 
GCCCAGGCAT TCGAGAAGGT CCGCGCCGAC AAGACGCGCG AAGCCAACGA CGGCTTTGAC 
GGCTCTTGGG TGGCCCACCC TGACCTGGTG CCGGTGTGCC GGGAAGTGTT CGATTCCGTC 
CTGGGCGAGC GCCCCAACCA GCTGGACAAG CAGCGCCCGG AGGTCCATGT CACGGCGGAC 
CAACTGCTGG ACATTGCCTC GGCCGACGGC ACGGTGACGG AGGCCGGGCT GCGGCTGAAC 
CTCTACGTTG CGGTCGCATA CACGGCTGTT TGGATCTCAG GCAACGGTGC GGTGGCCATC 
CACAACCTGA TGGAAGACGC CGCCACGGCC GAGATCTCCC GTTCGCAGGT CTGGCAGCAG 
ATCCGCAACA AGGTGGTCCT GGCCGATACC GGCAACACTG TCACCCGTGA ACTGGTCAGC 
AGCATCCTGG CCCAGGAAAC CGACAAGCTC CGCGGTGAAG TGGGCGAGGA GACCTTCGCC 
AAGTACTACC AGCCGGCCAG CGAACTGATC GCTGATATCT GCCTTTCCGA GGACTACACC 
GACTTCCTCA CCACGCCGGC CTACGAACTG GTGGGCTGA

Protein sequence

MALTVTDPQP IARAEEILTP KALAFVEELH KRFAGTRAEL LKARVAKREQ VARTGKLDFL 
SETKDVREGD WKVAPAPAAL QDRRVEMTGP ASPAKMAINA LNSGAKVWLA DLEDASTPTW 
ANVIDAILNL RDAATGTLSY TSPEGKEYRL RSDAPLAVVV ARPRGWHMDE HHLLLDGEHT 
VGALVDFGLH FFHTAKQLLL NGQGPYYYLP KMESHLEARL WNDVFVFAQD FLGIPQGTIK 
ATVLIETIPA AFEMDEILYE LRDHAAGLNA GRWDYLFSII KYFRDAGADF VLPDRATVAM 
TAPFMRAYTE LLVKTCHHRG AFAMGGMAAV IPNRREPEVT AQAFEKVRAD KTREANDGFD 
GSWVAHPDLV PVCREVFDSV LGERPNQLDK QRPEVHVTAD QLLDIASADG TVTEAGLRLN 
LYVAVAYTAV WISGNGAVAI HNLMEDAATA EISRSQVWQQ IRNKVVLADT GNTVTRELVS 
SILAQETDKL RGEVGEETFA KYYQPASELI ADICLSEDYT DFLTTPAYEL VG