Gene Arth_3860 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Arth_3860
Symbol
ID	4447559
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Arthrobacter sp. FB24
Kingdom	Bacteria
Replicon accession	NC_008541
Strand	+
Start bp	4343010
End bp	4344218
Gene Length	1209 bp
Protein Length	402 aa
Translation table	11
GC content	67%
IMG OID	639691684
Product	O-succinylhomoserine sulfhydrylase
Protein accession	YP_833335
Protein GI	116672402
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0626] Cystathionine beta-lyases/cystathionine gamma-synthases
TIGRFAM ID	[TIGR01325] O-succinylhomoserine sulfhydrylase

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGACCTTCA ATCCCGACGC CGCTGGCTGG AGCCCTGACA CCCAGGCTGT CCGCGGCGGA 
CTTGACCGCA CCAATTTCCA GGAGACCGCC GAGCCGATCT TCCTCAACTC GGGGTTCGTC 
TACGAATCCG CGGCAGCTGC CGAGCGGGCA TTCACCGGCG AGGACGAACG GTTTGTGTAC 
TCCCGGTACG GCAACCCCTC CGTGGCCACC TTCCAGGAAC GCCTCCGGCT GCTCGAGGGC 
ACCGAAGCGT GCTTTGCGAC GGCGTCCGGC ATGTCCGCCG TCTTTACGGC ACTGGGTGCC 
CTGCTGGCTG CCGGTGACCG GGTGGTTGCC GCCCGGTCGC TGTTCGGCTC CTGCTTTGTC 
ATTTTGAACG AGATCCTGCC CCGGTGGGGC GTCGAAACGG TGTTCGTGGA CGGCCCGGAC 
CTGGAACAGT GGCGGACCGC TTTGGCGGAA CCGACGACGG CGGTCTTCTT CGAGTCGCCG 
TCGAACCCGA TGCAGGAGAT CGTGGACATC GCCGCGGTCA GCGAACTGGC CCACGCTGCC 
GGGGCGACCG TCGTCGTCGA CAATGTCTTT GCCACCCCCC TGCTGCAGCG CTGCGGGGAG 
CTCGGCGCGG ATGTGGTGGT GTACTCCGGC ACCAAGCACA TTGACGGCCA GGGGCGGGTC 
CTTGGCGGCG CCATCCTGGG CACCAAGGAG TTCATCGAAG GCCCGGTCAA GCAGCTGATG 
CGCCACACCG GGCCGGCGCT TTCAGCCTTC AACGCCTGGG TGCTGACGAA GGGCCTGGAA 
ACCATGGCGC TGCGCGTCAA CCATTCCTCG GCCTCCGCGC TTCGCCTGGC CGAGTGGCTG 
GAAGGCCAGC CGGCGGTCAG CTGGGTCAAG TACCCGCTGC TGAAGTCCCA CCCGCAGTTT 
GAGCTGGCGG CCAGGCAGAT GAAGGCCGGC GGTACCGTGC TCACGCTGGA GCTTCTGCCG 
TCGGCGGGCC GCACGGCGAA GGAAGCAGCC TTTGCCCTGC TGGACGCGCT GCGGATCATC 
GACATCTCCA ACAACCTCGG CGATGCCAAG ACGCTCATCA CCCACCCGGC CACCACCACG 
CACCGTGCCA TGGGGCCGGA TGGCCGGGCC GCCATCGGGT TGAGCGACGG CGTGGTCCGC 
CTGTCGGTAG GACTCGAGGA TGTTGACGAC CTCATCCGCG ACCTGGAGCA GGCGCTCAAA 
CAGATCTGA

Protein sequence

MTFNPDAAGW SPDTQAVRGG LDRTNFQETA EPIFLNSGFV YESAAAAERA FTGEDERFVY 
SRYGNPSVAT FQERLRLLEG TEACFATASG MSAVFTALGA LLAAGDRVVA ARSLFGSCFV 
ILNEILPRWG VETVFVDGPD LEQWRTALAE PTTAVFFESP SNPMQEIVDI AAVSELAHAA 
GATVVVDNVF ATPLLQRCGE LGADVVVYSG TKHIDGQGRV LGGAILGTKE FIEGPVKQLM 
RHTGPALSAF NAWVLTKGLE TMALRVNHSS ASALRLAEWL EGQPAVSWVK YPLLKSHPQF 
ELAARQMKAG GTVLTLELLP SAGRTAKEAA FALLDALRII DISNNLGDAK TLITHPATTT 
HRAMGPDGRA AIGLSDGVVR LSVGLEDVDD LIRDLEQALK QI