Gene Arth_4033 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Arth_4033
Symbol
ID	4447869
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Arthrobacter sp. FB24
Kingdom	Bacteria
Replicon accession	NC_008541
Strand	+
Start bp	4552374
End bp	4553816
Gene Length	1443 bp
Protein Length	480 aa
Translation table	11
GC content	67%
IMG OID	639691864
Product	adenylosuccinate lyase
Protein accession	YP_833508
Protein GI	116672575
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0015] Adenylosuccinate lyase
TIGRFAM ID	[TIGR00928] adenylosuccinate lyase

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCCTGAAA CTGCCGCCAC AGCTGAGACC CGTACGCCTT CCGGACGCCT GGCCCTTGCC 
GCCTCGCCGG ACAAGATCGC CCTAGGCCCG CTGGACGGCC GGTACCAGTC CGCGGTCGCA 
CCGTTGGTGG ATTACCTGTC CGAGGCGGCC CTCAACCGGG ATCGCGTGGC CGTGGAAGTC 
GAGTGGCTCA TCCACCTGAC CAGCAACAGC GTCCTCCCGG GCGCCGGCCC GCTGACGCCC 
GAACAGCAGG ACCAGCTCCG CGCCATCGTC ACGGAATTCG ACTCCGCGTC GGTCACCGAG 
CTGGCCGACA TCGAGGCCGT AACGGTTCAC GACGTCAAGG CAGTCGAGTA CTACATCGGC 
CGCAGGCTGC CGGCCATCGG CATTGAGCGG CTTACCGCCA TGGTGCACTT CGGCTGCACC 
TCGGAAGACA TCAACAACCT CTCCTACGCG CTGGGCGTCA AGGGCGCCGT GGAGGACGTG 
TGGCTGCCCG CCGCCAAGGC GCTGGTGGCC CAGATCAGCA GGATGGCTGA CGACAACCGC 
AGCGTGCCCA TGCTTTCCCG CACGCACGGA CAGCCGGCCA CGCCCACCAC CCTGGGCAAG 
GAACTGGCCG TCATCGCGCA CCGCCTGACC CGCCAGCTGG ACCGGATTGC CAGGACGGAA 
TACCTGGGCA AAATCAACGG CGCCACCGGC ACCTACGCCG CCCACGTCGC TTCCGTTCCC 
GGCGCGGACT GGCAGCACGT GGCGAAGTCC TTCGTTGAGG GCCTGGGCCT GACCTGGAAT 
CCGCTGACCA CCCAGATCGA AAGCCACGAC TGGCAGGCGG AGTTGTACGC CGACGTCGCG 
CGGTTCAACC GGATCCTGCA CAACGTGTGC ACCGACATCT GGAGCTACAT CTCCATCGGC 
TACTTCGCGC AGATCCCGGT GGCGGGCGCC ACGGGTTCCT CCACCATGCC GCACAAGGTC 
AACCCGATCC GCTTTGAGAA CGCCGAAGCC AACCTGGAGA TCTCCTCCGG CCTGCTGGAC 
GTGCTGGGCT CCACGCTGGT CACCTCGCGC TGGCAGCGCG ACCTCACCGA CTCCTCCAGC 
CAGCGCAACA TCGGCGTGGC CTTCGGGCAC TCCCTGCTGG CCATCTCGAA TGTGGTCAAG 
GGCCTGGAGC GCCTGGACGT AGCCGAGGAC GTCCTGGCGG GCGACCTCGA CACCAACTGG 
GAAGTTCTGG GCGAGGCCAT CCAAATGGTG ATGCGCGCCG AGGCGATTGC CGGCGTCGAA 
GGAATGGAAA ACCCCTACGA GCGGCTCAAG GACCTGACCC GCGGACAGCG CGTGGATGCC 
GCCCGGATGC AGGAATTCGT CCAGGGCCTG GGCCTCTCCG CGGACGCCGA AGCCCGGCTG 
CTGGCCCTGA CACCGGGCAA GTACACAGGC ATCGCGGACC AGCTGGTGGA CCACCTCAAA 
TGA

Protein sequence

MPETAATAET RTPSGRLALA ASPDKIALGP LDGRYQSAVA PLVDYLSEAA LNRDRVAVEV 
EWLIHLTSNS VLPGAGPLTP EQQDQLRAIV TEFDSASVTE LADIEAVTVH DVKAVEYYIG 
RRLPAIGIER LTAMVHFGCT SEDINNLSYA LGVKGAVEDV WLPAAKALVA QISRMADDNR 
SVPMLSRTHG QPATPTTLGK ELAVIAHRLT RQLDRIARTE YLGKINGATG TYAAHVASVP 
GADWQHVAKS FVEGLGLTWN PLTTQIESHD WQAELYADVA RFNRILHNVC TDIWSYISIG 
YFAQIPVAGA TGSSTMPHKV NPIRFENAEA NLEISSGLLD VLGSTLVTSR WQRDLTDSSS 
QRNIGVAFGH SLLAISNVVK GLERLDVAED VLAGDLDTNW EVLGEAIQMV MRAEAIAGVE 
GMENPYERLK DLTRGQRVDA ARMQEFVQGL GLSADAEARL LALTPGKYTG IADQLVDHLK