Gene Achl_1139 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Achl_1139
Symbol
ID	7292584
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Arthrobacter chlorophenolicus A6
Kingdom	Bacteria
Replicon accession	NC_011886
Strand	-
Start bp	1249899
End bp	1251305
Gene Length	1407 bp
Protein Length	468 aa
Translation table	11
GC content	71%
IMG OID	643589544
Product	transcriptional regulator, GntR family with aminotransferase domain
Protein accession	YP_002487219
Protein GI	220911910
COG category	[E] Amino acid transport and metabolism [K] Transcription
COG ID	[COG1167] Transcriptional regulators containing a DNA-binding HTH domain and an aminotransferase domain (MocR family) and their eukaryotic orthologs
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	28
Fosmid unclonability p-value	0.00414421
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGAACAACG ATAGCAGTTC GCGGATTGTC CTGGCACTCA AAAAGTGGAT TGCCGGTGCC 
GCGCCGGGAG CGAAACTGCC GTCCACGCGC TCCCTGGTGG CCGAGTACCA GGCCAGCCCG 
GTCACGGTGC AGAAGGCGCT GCAGGCGTTG ACGGCGCAGG GACTGATCGA AAGCCGTCCC 
GGAGTGGGAA CCTTCGTGCG GGCCGTCCGG ACGGCGCGCC CCGCGGACTA CGGCTGGCAA 
ACCGCGGCGC TGGGGTCGCC GTCGGCCGCG CTGCCGTCGT CGTCCACCAT GCGCACGGTG 
CCCAATGACG CCATCTGGTT CCACTCGGGC TACCCGGACC GTGAACTGCT GCCGGAACGC 
CTGGTGCGTG CGGCTCTGGC CCGGGCAGCG CGCGGTGACG CGGCACTGTC GCGCCCGCCG 
GCGGCCGGGA TGCCGGAGCT GCAGCACTGG TTTGCCCAGG AGCTGGGGTC GGCGACGCCG 
GTGGGCATCA CTCCTCCGAC GCCGAGTGAC GTGATCGTGC TGCCGGGAAG CCAGAGCGGA 
CTGAGCTCCA TCTTCCGGGC GCTGGTGGGG GCCGGGCAGC CGCTGCTGAT GGAGTCGCCC 
ACCTACTGGG GCGCCATTTT GGCCGCCGCA CAGACGGGCG TCCGGGTGGT GCCGGTGCCC 
AGCGGGCCGG ACGGCCCGGA CCCGGTGGAG CTGGCCCGGG CGTTCGAGGA GACCGGCGCG 
CGGGCGTTCT ACGCCCAGCC CAACTACGCC AACCCCAGCG GCGCCCAGTG GGCACCCGGG 
CGCGGCGGCG AGGTCCTGGA GGTGGCGCGC GCGCACGGGG CGTTCGTCAT CGAGGACGAC 
TGGGCCCATG ATTTCGGCAT CACCTCAACG CCGGTGCCGC TGGCCACGCA GGACGATTCC 
GGGCACGTCA TCTACATCAG GTCGCTGACC AAGAGCGTAT CCACGTCTGT GCGGATTGCC 
GCCGTTGTTG CCCGGGGTCC GGCCCGGGAG CGGATCCTGG CGCACCGGGC GGCGGAATCG 
ATGTACGTCA GCGGGCTGCT GCAGGCCGCG GCCCTGGATG TGGTGACGCA GCCTGGGTGG 
CAAACCCACC TGCGGAGCCT CCGCCAGCAG CTGCAGTCCC GCAGGGACCT GCTGGTGACG 
AGCATCCGGG AACACGTGCC GGATGCGCAT ATCGAGCTGC TGCCCAAAGG CGGCCTGAAC 
CTCTGGCTGC GGATGCCCGA CGGCACGGAC CTGCCCCGGC TCACCCGGGA CTGCGAGGAC 
AACGGGGTGA TCATCGCGGC CGGCACCGAA TGGTTCCCGG CCGAACCTGC CGGCCCGTTC 
GTCCGGCTCA ACTACTCCGG CCCCAACCCG GCGGCCTACC CGCAGGGTGC CCGCCTGATC 
GGCGAGGCAC TGGCGCGGCA ATTCTGA

Protein sequence

MNNDSSSRIV LALKKWIAGA APGAKLPSTR SLVAEYQASP VTVQKALQAL TAQGLIESRP 
GVGTFVRAVR TARPADYGWQ TAALGSPSAA LPSSSTMRTV PNDAIWFHSG YPDRELLPER 
LVRAALARAA RGDAALSRPP AAGMPELQHW FAQELGSATP VGITPPTPSD VIVLPGSQSG 
LSSIFRALVG AGQPLLMESP TYWGAILAAA QTGVRVVPVP SGPDGPDPVE LARAFEETGA 
RAFYAQPNYA NPSGAQWAPG RGGEVLEVAR AHGAFVIEDD WAHDFGITST PVPLATQDDS 
GHVIYIRSLT KSVSTSVRIA AVVARGPARE RILAHRAAES MYVSGLLQAA ALDVVTQPGW 
QTHLRSLRQQ LQSRRDLLVT SIREHVPDAH IELLPKGGLN LWLRMPDGTD LPRLTRDCED 
NGVIIAAGTE WFPAEPAGPF VRLNYSGPNP AAYPQGARLI GEALARQF