Gene Achl_0844 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Achl_0844
Symbol
ID	7292281
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Arthrobacter chlorophenolicus A6
Kingdom	Bacteria
Replicon accession	NC_011886
Strand	+
Start bp	916666
End bp	917856
Gene Length	1191 bp
Protein Length	396 aa
Translation table	11
GC content	69%
IMG OID	643589245
Product	Cys/Met metabolism pyridoxal-phosphate-dependent protein
Protein accession	YP_002486928
Protein GI	220911619
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0626] Cystathionine beta-lyases/cystathionine gamma-synthases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	38
Fosmid unclonability p-value	0.187169
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGTCTTT CCGAACAGCA GGCCGCCGGC CTGTCCGCCG AAACCATGGT AGTGGCCGCG 
GGCCGCCCGC CGCGGGAACG GGACCAGCCG GTGAACCCGC CCCTGGTCCT GTCCTCCACG 
TACTACGGCA CAGGCCCGCT CGGCCCCGGA GACCGTGGTT ACGGCCGGTA CTCCAACCCC 
ACGTGGGACC CGTTCGAAGA GGCCCTCGGC CAGCTGGAAG GAGCGGACCT GCAGGGCCTG 
CTCTACGCCT CCGGGCTTGC TGCCGTCAGT TCTGCGTTGT CGCTGATCCC CTCCGGCGGA 
GTGCTGGTGA TGCCGAACCA CAGCTACTCC GGAACCCTTG TCATGGCCGC GGAGCTGGCC 
CAGAAAGGGT TCATTGAGCT GCGAACGGTG GACATCGCCG ATACCGGGGC CGTCAAAGCG 
GCCATCGCCC CGGGCGGGCC GGACGCCAGG GCCGCCGCCA TGCTGTGGCT GGAAAGCCCT 
ACCAACCCCA TGCTGGGAAT CGCCGACATT CCTGCGCTGA CGGAAGCCGC GCACGCGTCG 
GGCGCCATCG TGGTCACGGA CAATACCTTC TCGACGCCGC TGGTGCAGCA GCCCCTGGCC 
CTGGGCTCCG ACGTCGTACT CCACTCGGTG ACCAAGTACC TGGCGGGCCA CTCGGACGTC 
GTCCTGGGTG CCCTGGTGAC CTCCAACGCG GACATCCGCT CCGCCCTCCT GCACCACCGG 
ACCATCCACG GAGCGATCGC CGGGCCCTTT GAGGCCTGGC TTGCGCTGCG CGGCCTGCGC 
ACCCTGGCGC TGCGCGTTGA AAAGTCCCAG GAGTCTGCCA AGGTCCTGGC GGAACGGCTG 
GGCACCCACC CGGGGGTCGA ATCGATCCGG TTCCCGGGCC TCCGCACCGA TCCCGGGCAC 
GAAAGGGCCG CGGCGCAGAT GAAGGGCTTT GGCTCCATCA TCTGCATCCA GGTGGCGCCC 
GCCGGCGGAC TGGACGGCGC AGCAGCGGCC GACAAGGTCG TTGAAGCCGT CAACCTCTGG 
CTGCCGGCCA CATCGCTGGG CGGCGTGGAA TCGCTGATCG AACGCAGGCG GCGGCACACC 
GCGGAGCCGG CCACGGTGCC GGAGAACCTG GTCCGCCTCA GCACCGGCAT TGAGAACGTG 
GAAGACCTCT GGGCAGACCT GGAGCAGGCG CTGGACACTC TGGGCGGCTA G

Protein sequence

MSLSEQQAAG LSAETMVVAA GRPPRERDQP VNPPLVLSST YYGTGPLGPG DRGYGRYSNP 
TWDPFEEALG QLEGADLQGL LYASGLAAVS SALSLIPSGG VLVMPNHSYS GTLVMAAELA 
QKGFIELRTV DIADTGAVKA AIAPGGPDAR AAAMLWLESP TNPMLGIADI PALTEAAHAS 
GAIVVTDNTF STPLVQQPLA LGSDVVLHSV TKYLAGHSDV VLGALVTSNA DIRSALLHHR 
TIHGAIAGPF EAWLALRGLR TLALRVEKSQ ESAKVLAERL GTHPGVESIR FPGLRTDPGH 
ERAAAQMKGF GSIICIQVAP AGGLDGAAAA DKVVEAVNLW LPATSLGGVE SLIERRRRHT 
AEPATVPENL VRLSTGIENV EDLWADLEQA LDTLGG