Gene Arth_3139 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Arth_3139
Symbol
ID	4444252
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Arthrobacter sp. FB24
Kingdom	Bacteria
Replicon accession	NC_008541
Strand	+
Start bp	3522684
End bp	3523796
Gene Length	1113 bp
Protein Length	370 aa
Translation table	11
GC content	70%
IMG OID	639690965
Product	LacI family transcription regulator
Protein accession	YP_832617
Protein GI	116671684
COG category	[K] Transcription
COG ID	[COG1609] Transcriptional regulators
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAACCGCA AGGCCACCGC ACTGGACGTC GCCAAGCTGG CGGGCGTCTC GCGCAGCGCA 
GTGTCGCTCG TGCTCAACGG GCGGGGCGAC GGCAACGTGG CCCTCGAAAG CCAGCAGCGC 
ATCCGGGAAG CCGCGGCAGC GCTGAACTAC ACGCCAAACG CCATCGCCCT GAGCCTGCGC 
AACCAGCGGT CGCGGGTCAT CGGGATTGTC TCGGACGAAG TGGTCACCAG CCCGTTCGAC 
GGCAACATCA TCGCCGGAGC GGATGCCGTG GCCCGGTCCC AGGGCTTTGT GACTGTAGTG 
ATGGATACGG AATCGGACGA GGCCCGGGAC GAGGGCGCCG TGGCCACCCT TCTGGACCGC 
CAGGTGGACG GGCTGATGTA CGTCACGGTG GGACTGCGCC CCCTGCACGT CCCGCTCAAC 
ATGTTGCAGG TGCCGTCGAT CCTGGCCAAC TGCTTTGATG ACCGCCCAGG GGCCGGTGTT 
CCCGCCGTCA TCCCCGATGA GGTCCGCGGC GGGCGGGAAG CCGCCGAACA CGTGATGTCG 
CTGGGACATC GGGACATCGC CTTCCTCGCC GGCGACTCCC TTACCCCTGC GGCGCCCCGC 
CGGATCGAGG GCTACCGCGA AGCGTTTGGC GCCGCGGACA TGCCCGTCAA CGGGGACCGC 
GTCCTCCAGG TGGGCTGGGA TATCGATGCC GGTTTCCACG GCGCCATTAA GCTCCTCGAC 
GGCGTGGAGC CGGCCGCCCG TCCCACCGCG ATCCTGTGCG CCAACGACCG CCTGGCCATC 
GGCGTCGTAC TGGCCTGCTA CCGGCTGGGG CTCAGCGTTC CGCATGACGT GTCGGTCATG 
GGTTACGACG ACGAATTCCG CATCGCCAAG AACATGGTCC CGGCGCTCAG CACCATGGCC 
CTCCCGCTCC GGGAGATGGG CGCGGCAGCC ATGACGGCGC TGCTCGCCGA CGTGGGGTCC 
GCACCGAACG GAAAGCACGA CGGCGGCGGC CCGGCTGCCG CCGCCGGCTC CGGTACCGGC 
GCTGGGACCG ACGCCGTCCA CCACGCGGTG ACGATGGTTC CGTGCCGGCT GGTGGTCCGG 
GATTCCACGG GCCCCGTCCC GGCCGGCCGC TAA

Protein sequence

MNRKATALDV AKLAGVSRSA VSLVLNGRGD GNVALESQQR IREAAAALNY TPNAIALSLR 
NQRSRVIGIV SDEVVTSPFD GNIIAGADAV ARSQGFVTVV MDTESDEARD EGAVATLLDR 
QVDGLMYVTV GLRPLHVPLN MLQVPSILAN CFDDRPGAGV PAVIPDEVRG GREAAEHVMS 
LGHRDIAFLA GDSLTPAAPR RIEGYREAFG AADMPVNGDR VLQVGWDIDA GFHGAIKLLD 
GVEPAARPTA ILCANDRLAI GVVLACYRLG LSVPHDVSVM GYDDEFRIAK NMVPALSTMA 
LPLREMGAAA MTALLADVGS APNGKHDGGG PAAAAGSGTG AGTDAVHHAV TMVPCRLVVR 
DSTGPVPAGR