Gene Achl_3635 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Achl_3635
Symbol
ID	7295116
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Arthrobacter chlorophenolicus A6
Kingdom	Bacteria
Replicon accession	NC_011886
Strand	+
Start bp	4041101
End bp	4043260
Gene Length	2160 bp
Protein Length	719 aa
Translation table	11
GC content	70%
IMG OID	643592041
Product	para-aminobenzoate synthase, subunit I
Protein accession	YP_002489680
Protein GI	220914371
COG category	[E] Amino acid transport and metabolism [F] Nucleotide transport and metabolism [H] Coenzyme transport and metabolism
COG ID	[COG0147] Anthranilate/para-aminobenzoate synthases component I [COG0572] Uridine kinase
TIGRFAM ID	[TIGR00553] aminodeoxychorismate synthase, component I, bacterial clade

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	77
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGCACACCT GGCGCGGCAG GCGCTCTGAA AACGGTACGC TCTACTCCAT GAGCCCAGCC 
CCCGTCATCA TCGCCCTTGA CGGACGCTCG GGCGCAGGCA AGACCACCCT CGCCGTGGAA 
CTGGCCGCGC GCCTGCGGGC GCGCCATAAA GTGTCGCTGT TCCACCTCGA GGACATCTAT 
CCGGGCTGGA ACGGCCTGGC CGCCGGCATC GAACGCTACG TCAGCACCGT CCTGGGCCCG 
CTGAGCCGCG GCGAGGCCGC CACCTGGACC AGCTGGGACT GGGAAAAGCA TTACGACGGC 
GGCTCCCGGG TAACACTGCC CGCCGAGATT GTCATCGTGG AGGGAGTGGG TGCCGCGGCC 
GCCGCCGCCC GGCCGTTCCT GGGCGCGGCC ATCTGGGCGG ACTCCCCGGA GGACGTCCGG 
CGCACGCGCG CGCTGCAGCG GGACGGCGAA ACCTACGAGC CCTACTGGGA CCAGTGGGCG 
GCCCAGGAGT CCGAATGGCT GGCCGGGGAC GATGTTCCCG GCGCGGCGGA CCTGCACATC 
AGGAACGTGG CAGACGGCAG CGCACCGGAG GACGTGCTGC AACTCCTGCC GTACCTCCCG 
GCGCTGGCAC AGGTCCTCGC CCCGGAGCTG TCCGCCCGGC GGGGCCTGAG CCTCCGTGCC 
GAACGGCTCG ACGCACGCCC GCAGGCCGCC GAACTTTTCC ATGCCCTGTA CGGCACGTCC 
GCCAACGCCG TCTGGCTCGA CTCGTCCAAC GCGGGAGCCG CGGATCCCGG CAGTGCGGAT 
CCGAGCACCC GGACGGCCGC CGAACGCAGC CGGTTCAGCA TTCTGGCGGA CGACGGCGGC 
ACGTTCGGCC AGTCGGTCAT GCACCGGTCC GGAGCCAGCC ACATCAGCGC CGGCTCCGTC 
ACCGCCACCG TGGACGGACC GTTCTTCCGT TGGCTGGATA CCGTGTGGGG CCGCCGGGCG 
GTCCGCGCCC CGGAGGGCTA CCCCGGAGAG TTCACCCTGG GGTGGCTGGG CTACCTGGGC 
TACGAGCTGA AACGCGAAAC CGGCGGCACC GACGTCTCAG CGGCCACGCC GGACGCCGCA 
CTGATCTTCG CCGGACGGGC GGTGGTCCTG GACCACGCGG AAGGCACCGC CTGGCTCCTG 
GCACTGGACG CCCCGGACGC CGCCGAATGG CTGGACGCCG CACGGGCAGC CGTGCAGCGT 
GCAGCGGGTG CGCCCGCGGC GTTGGACAGC GGGGACGGCA ACGAACCGGC CGGCTCCGGC 
ATTGATGGCG GCAGCACCGC CGTCGGCAGC GCGTCCGTGC CCGTGTTCGC AAGCCGGGAC 
AGCGGAGTGA CCTACCGCGA AAAGATCACC AAGTCCCAGC GTGAAATCGC CGAGGGAAAC 
ACCTACGAAG TTTGCCTGAC CACCACCCTC GCGGCCCGCG TCCCGGGAGG CACCGTCGAC 
CCGTGGCATA CGTACCTGGC ACTGCGCCGC CGGAATCCGG CACCGTTCGC CAGCTACCTG 
GCCTTCGACG GGTTGGCGGT TGCCAGCACG TCGCCGGAAC GTTTCCTGCG GATAGCGTCC 
GACGGCGGCA TGCGCGCCGA GCCGATCAAG GGCACCCGCC GCCGGGCTTC CGGCGCCGCT 
GAGGATGCCG CCCTCCGGAC GGAGCTTGCC ACCTCGCTGA AGGACCGTGC CGAGAACATC 
ATGATCGTTG ACCTGCTGCG GAATGACCTG AGCCATTTCG CTGTCCCCGG CTCCGTGACG 
GTGAGCCGGC TGTGCGCCAT CGAAAGCTAC GCCACCGTGC ATCAGATGGT CAGCACTATC 
GATGCCTCCC TGCCGCCGGG TTCCCCGCGG GCCGAAGCCG TGGCTGCCTG CTTCCCTGCC 
GGTTCGATGA CAGGGGCACC GAAGATCAGC ACCATGGCCA TCCTCGACCA GCTGGAAGCC 
GGCCCCCGAG GAATCTATTC GGGGGCCATC GGATACTTCT CGCTGAACGG TGCCACGGAC 
CTGGCCGTCG CCATCCGGAC CCTGGTGATC CGCCGGGATG GTGACGGTAC TGCGGAACTG 
AGTCTCGGCG TCGGCGGCGC CATCACGTCC GATTCCGTGC CGGACGAGGA ATACGACGAA 
ATCCGCACCA AGGCCTACGG AGTCCTCTCG ACGCTCGGCG CAACTTTTCC GGACGCCTGA

Protein sequence

MHTWRGRRSE NGTLYSMSPA PVIIALDGRS GAGKTTLAVE LAARLRARHK VSLFHLEDIY 
PGWNGLAAGI ERYVSTVLGP LSRGEAATWT SWDWEKHYDG GSRVTLPAEI VIVEGVGAAA 
AAARPFLGAA IWADSPEDVR RTRALQRDGE TYEPYWDQWA AQESEWLAGD DVPGAADLHI 
RNVADGSAPE DVLQLLPYLP ALAQVLAPEL SARRGLSLRA ERLDARPQAA ELFHALYGTS 
ANAVWLDSSN AGAADPGSAD PSTRTAAERS RFSILADDGG TFGQSVMHRS GASHISAGSV 
TATVDGPFFR WLDTVWGRRA VRAPEGYPGE FTLGWLGYLG YELKRETGGT DVSAATPDAA 
LIFAGRAVVL DHAEGTAWLL ALDAPDAAEW LDAARAAVQR AAGAPAALDS GDGNEPAGSG 
IDGGSTAVGS ASVPVFASRD SGVTYREKIT KSQREIAEGN TYEVCLTTTL AARVPGGTVD 
PWHTYLALRR RNPAPFASYL AFDGLAVAST SPERFLRIAS DGGMRAEPIK GTRRRASGAA 
EDAALRTELA TSLKDRAENI MIVDLLRNDL SHFAVPGSVT VSRLCAIESY ATVHQMVSTI 
DASLPPGSPR AEAVAACFPA GSMTGAPKIS TMAILDQLEA GPRGIYSGAI GYFSLNGATD 
LAVAIRTLVI RRDGDGTAEL SLGVGGAITS DSVPDEEYDE IRTKAYGVLS TLGATFPDA