Gene Achl_3020 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Achl_3020
Symbol
ID	7294500
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Arthrobacter chlorophenolicus A6
Kingdom	Bacteria
Replicon accession	NC_011886
Strand	-
Start bp	3361679
End bp	3362908
Gene Length	1230 bp
Protein Length	409 aa
Translation table	11
GC content	70%
IMG OID	643591430
Product	glutamate--cysteine ligase GCS2
Protein accession	YP_002489070
Protein GI	220913761
COG category	[S] Function unknown
COG ID	[COG2170] Uncharacterized conserved protein
TIGRFAM ID	[TIGR02050] uncharacterized enzyme

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	36
Fosmid unclonability p-value	0.163677
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGACGGGC AGGAAGCAGC AGGGCAGGAC CCGCGGCGGC AAGGCAGCAC GACGGCGGCG 
GGCGGCGTCC GGAATGACGG CGCCGGGCGT CCCGGGCCCA GGACGTTCGG GGTTGAGGAG 
GAACTGTTGC TGGTGGACCC CGGCCGGGGC GACGCGGTAC CCATGGCCGG CGCCCTGCTG 
GACCTTTACG TCCGCCCGCT GGAATCCAGT GCCGGGCCGG TGCTCACCGC CGAGTTCCAG 
CAGGAAATGA TCGAAGTGGT CACCCCGCCG CACTCCACGC TTGCCGGGCT CCAGGCGGAC 
ATCGTTGCGG GGCGGGACAT CGCCCGGCAG GCCGCGGAGG ACGTGGGCGT CCGGGTGGCT 
GCTCTGGGCA CTTCCCCCCT GCCGAGCGAC CCGCACCCGG TGCGGCTGCG CCGGTTCGCG 
GCCATGGTGG AAGAGTATGG ACTCACTGCC CGGGAACAGC TGACCTGTGG CACCCACGTC 
CACGTTTCGG TGGAGTCTGA CGAAGAAGCG GTGGGAGTGC TGGACCGGAT CCGGAACTGG 
CTGCCGGTGC TGGTGGCGCT CAGTGCCAAC TCCCCGTTCT GGCATGGAGA GGACACTGGG 
TACGCGAGCT ACCGGTCCCA GGTGTGGAGC CGGTGGCCGT CTGCCGGGCC ACTGGACATC 
CTGGGCACCC CGGATGCCTA CCACCAGCTG GTGCACGACA TGGTGAGCAC CGGCGTCGCC 
ATGGATGAAG GCATGATCTA CTTCGACGCC CGGCTGTCCC GGCACTATCC CACCGTGGAG 
GTGCGGATCG CCGACGCCTG CATGATGCCG GAAAACACCG TGCTGCTGGC CGGGATCGTC 
CGCGGACTGG TGGAAACCGC GGCCCGCGAA TGGAAGGCCG GAACCGGGCC GGCGCCGGTG 
CCCACCGCCC TGCTGCGGCT GGCTGGATGG AAGGCCAGCC GCTGGGGGCT GCGCGGGGAA 
CTCCTGGATC CGGTGACCAG CAGGCCCGGG CCGGCCCTCG GCGTCGTCAA TTCCCTCCTG 
CACCATATCC ACGGCGCGCT GGAGGACATG GGCGACCTGG AGCGGGTGGA GGAACTCACG 
GACCAGCTCC TGCACACCGG CACCGGAGCC GTCCGCCAGC TCGAGGTGCT GCACCGGACG 
GGCGACCTGG AGGACGTGGT GGATGACGCC GCCAACTGCA CCGTGGGGTC CGAAATCCAA 
GGTGCGCGGC GGGGAATGCC GGGGGATTGA

Protein sequence

MDGQEAAGQD PRRQGSTTAA GGVRNDGAGR PGPRTFGVEE ELLLVDPGRG DAVPMAGALL 
DLYVRPLESS AGPVLTAEFQ QEMIEVVTPP HSTLAGLQAD IVAGRDIARQ AAEDVGVRVA 
ALGTSPLPSD PHPVRLRRFA AMVEEYGLTA REQLTCGTHV HVSVESDEEA VGVLDRIRNW 
LPVLVALSAN SPFWHGEDTG YASYRSQVWS RWPSAGPLDI LGTPDAYHQL VHDMVSTGVA 
MDEGMIYFDA RLSRHYPTVE VRIADACMMP ENTVLLAGIV RGLVETAARE WKAGTGPAPV 
PTALLRLAGW KASRWGLRGE LLDPVTSRPG PALGVVNSLL HHIHGALEDM GDLERVEELT 
DQLLHTGTGA VRQLEVLHRT GDLEDVVDDA ANCTVGSEIQ GARRGMPGD