Gene Arth_0397 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Arth_0397
Symbol
ID	4447124
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Arthrobacter sp. FB24
Kingdom	Bacteria
Replicon accession	NC_008541
Strand	+
Start bp	422504
End bp	423619
Gene Length	1116 bp
Protein Length	371 aa
Translation table	11
GC content	65%
IMG OID	639688196
Product	LacI family transcription regulator
Protein accession	YP_829898
Protein GI	116668965
COG category	[K] Transcription
COG ID	[COG1609] Transcriptional regulators
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCGAAGA GCACACAGGC AGCGGCGTCG GGTCCGGCCG CACCGGCCCG GTCGGCCCCT 
GCCGTCCCCA AAGCCGCTCC CGCACACCGG GGCGTCACCA TGGCGGACGT GGCCAAGGCC 
GCCGGCGTGT CCCGAACCGC GGTTTCCTTC GTCCTGAGCA ACCGCGAGAA CGCCAGCATT 
TCGGAAGAGA CCAAGCACCG CATCCTCGAA GCGGTCCAGA CCCTCGGCTA CCGGCCTAAC 
GCGGGTGCAC GTGCCCTCGC GTCGCAGCGC AGCGACTGGT ATGGCATCGT CACAGAGATC 
GTCACGGCAC CGTTCGCCGT CGACATCATC AAGGGCGCGC AGGACCAGGC CTGGCTGTCC 
CGCCGGTTCT TGCTCATCGC GCCCTCCGAC CAGGCCGATG CAACAGGACC AAACCAGGGC 
ATGGAAGACG CGGCCGTTGA AAAGCTACTG GAACAAAGAG TGGAAGGACT TCTCTACGCA 
GCCACGTACC ACCGGGCCGT GCACGTTCCC AAAAGCGCCA ACGAGGTGCC CACTGTCCTG 
ATCAACTGCT TCGACGCGGA CGGGAAGCTG CCCTCGGTCG TCCCTGACGA GCGGGCCGGG 
GGCCGCGTCG CCGTCGAGCG TTTGCTGCAA GCGGGCCACA CCAGAATCGG TGTCATCAAC 
CTGGATCCGG ACATTCCCGC CGCCGTCGGC CGTTTGGAGG GGTGCCGCGA AGCACTGGCC 
GAAGCAGGGC TGGAGCTGGA TCCTGAACTC GTCGTCTCGG GACACGCAAC GGCGGATGGC 
GGCTACGAGG CCGCCTGCGA AATTCTTGAT AAATATCAGG CCGGGGCAGG CAGGCCAACT 
GCCCTGTTCT GCCTCAACGA CCGGATGGCT ATGGGCGCTT ACGACGCCAT CAAGGAGCGC 
GGGCTCGCCA TCCCCCAAGA CATCGCCGTG ATCGGCTTCG ACAACCAGGA ACTCATTGCG 
GCCTACCTCA GGCCCAAGCT GACCACGGTT GCGTTGCCCT TCGAGGAGAT GGGTGCGCTG 
GGTGTCCAGA CACTCGCAAG CCTTACAGCC GGACAGCCGA TCACTGCACA TCAGCAAATG 
GTCGACTGTC CGCTGCTAGA ACGCTATTCA GTCTGA

Protein sequence

MAKSTQAAAS GPAAPARSAP AVPKAAPAHR GVTMADVAKA AGVSRTAVSF VLSNRENASI 
SEETKHRILE AVQTLGYRPN AGARALASQR SDWYGIVTEI VTAPFAVDII KGAQDQAWLS 
RRFLLIAPSD QADATGPNQG MEDAAVEKLL EQRVEGLLYA ATYHRAVHVP KSANEVPTVL 
INCFDADGKL PSVVPDERAG GRVAVERLLQ AGHTRIGVIN LDPDIPAAVG RLEGCREALA 
EAGLELDPEL VVSGHATADG GYEAACEILD KYQAGAGRPT ALFCLNDRMA MGAYDAIKER 
GLAIPQDIAV IGFDNQELIA AYLRPKLTTV ALPFEEMGAL GVQTLASLTA GQPITAHQQM 
VDCPLLERYS V