Gene Arth_1503 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Arth_1503
Symbol
ID	4445966
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Arthrobacter sp. FB24
Kingdom	Bacteria
Replicon accession	NC_008541
Strand	+
Start bp	1667156
End bp	1668595
Gene Length	1440 bp
Protein Length	479 aa
Translation table	11
GC content	69%
IMG OID	639689314
Product	argininosuccinate lyase
Protein accession	YP_830997
Protein GI	116670064
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0165] Argininosuccinate lyase
TIGRFAM ID	[TIGR00838] argininosuccinate lyase

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGGCTGAGT CCGTCGAAAC CCCGAAGTCT GAAGCGACCA ACACGGGCGC TCTGTGGGGC 
GGCCGGTTCG CCGGCGGCCC AGCCGACGCC CTTGCGGCGC TGAGCAAGTC CACGCACTTT 
GACTGGCGGC TGGCCCGTTA CGACATTGCC GGGTCCAAGG CGCACGCCCG CGTGCTGCAC 
AAGGCCGGCC TGCTGGACGA CGCCGAGCTG GAGGGCATGC TGGACGCCCT GGACCGGCTG 
GATGCAGACG TTGCCTCCGG CGCCTATCTG CCCGCGGAGT CCGATGAGGA CGTCCACGGT 
TCGCTGGAAC GCGGACTGAT CGAGCGGGCG GGCACCCAGC TCGGCGGCAA GCTGCGCGCG 
GGCCGGTCCC GCAACGACCA GGTGGCCACG CTGGGACGGA TGTTCCTGCG TGACCATGCC 
CGGATCATCG CCCGCGGCGT GCTCGCCACG ATCGATGCCC TTGTGGACCA GGCCAGGGCA 
CACCAGGGCG TGGCTATGCC CGGACGCACG CACCTTCAGC ACGCGCAGCC CGTCCTGCTC 
AGCCACCACC TGCTGGCCCA TGCCTGGGCG CTGCTGCGCG ACGTGCAGCG GCTGGCGGAC 
TGGGACAAGC GTGCGGGCGT CTCGCCCTAC GGCTCCGGCG CCCTTGCGGG CTCTTCCCTG 
GGCCTGGACC CGGAAGCCGT GGCCGCGGAG CTGGGCTTCT TCTCCGCGAC CCACAACTCG 
ATCGACGGCA CCGCCTCGCG CGACGTCTTC GCCGAGTTCG CGTGGGTCAC GGCCATGATC 
GGTGTGGACC TTTCGCGCGT GTCGGAGGAG GTCATCCTTT GGGCCACCAA GGAATTCTCC 
TTTGTCACCC TGCACGATTC GTACTCCACG GGTTCCTCGA TCATGCCGCA GAAGAAGAAC 
CCGGACGTTG CCGAACTGGC CCGCGGCAAA GCGGGACGCC TGATCGGCAA CCTGACCGGG 
CTGCTGGCCA CGCTCAAGGG CCTGCCGCTC GCGTACAACC GCGACCTGCA GGAGGATAAG 
GAGCCGGTCT TCGACGCCGC CGACACGCTG GAGGTCCTGC TTCCGGCCGT CTCCGGCATG 
ATCGCCACGC TGAAGTTCAA CACTGAACGG ATGGAGTCGC TGGCACCCCA GGGCTTCGCG 
CTGGCCACGG ACATCGCCGA ATGGCTGGTC CGCCAAGGGG TTCCGTTCCG CGAGGCGCAC 
GAACTCTCCG GCGCGGCCGT GAAGCAGGCG GAAAGCCGCG GCGTGGAACT CTGGGACCTG 
ACGGACGAGG AATACGCCGC CATCTCGGAG CACCTGACGC CGGAGGTCCG CACGGTCCTG 
TCCACTGAAG GTTCGCTCAA CAGCCGCAAC TCCCAGGGCG GGACGGCACC TGCCGCCGTC 
GAGCGCCAGC TCATCGCGCT GGAAGCCGAG CTGGCCGGTG TGCGGGAGTA CGCAGGCTAA

Protein sequence

MAESVETPKS EATNTGALWG GRFAGGPADA LAALSKSTHF DWRLARYDIA GSKAHARVLH 
KAGLLDDAEL EGMLDALDRL DADVASGAYL PAESDEDVHG SLERGLIERA GTQLGGKLRA 
GRSRNDQVAT LGRMFLRDHA RIIARGVLAT IDALVDQARA HQGVAMPGRT HLQHAQPVLL 
SHHLLAHAWA LLRDVQRLAD WDKRAGVSPY GSGALAGSSL GLDPEAVAAE LGFFSATHNS 
IDGTASRDVF AEFAWVTAMI GVDLSRVSEE VILWATKEFS FVTLHDSYST GSSIMPQKKN 
PDVAELARGK AGRLIGNLTG LLATLKGLPL AYNRDLQEDK EPVFDAADTL EVLLPAVSGM 
IATLKFNTER MESLAPQGFA LATDIAEWLV RQGVPFREAH ELSGAAVKQA ESRGVELWDL 
TDEEYAAISE HLTPEVRTVL STEGSLNSRN SQGGTAPAAV ERQLIALEAE LAGVREYAG