Gene Arth_3766 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Arth_3766
Symbol
ID	4447851
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Arthrobacter sp. FB24
Kingdom	Bacteria
Replicon accession	NC_008541
Strand	-
Start bp	4241676
End bp	4242761
Gene Length	1086 bp
Protein Length	361 aa
Translation table	11
GC content	68%
IMG OID	639691590
Product	LacI family transcription regulator
Protein accession	YP_833241
Protein GI	116672308
COG category	[K] Transcription
COG ID	[COG1609] Transcriptional regulators
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCACGA CGGCGGGCCG CGCACACCCT GACGCCCCGG AGCGACCCAA GCTGGAGGAC 
CTCGCCCGGA AGGTGGGAGT CAGCATCGCC ACGGTGTCCC GCGTGGTCAA TGGACGGAAA 
GGCGTTTCGC GCGAGGTGCG GCAGTCGGTC CTCGCCGCGA TGGACGACCT TGGCTACGAG 
CGGCCGGACC GTGCACGAAG CACCACCCGG GGCCAGGTGG GGATCATTGT TCCGGACCTG 
ACCAATCCGA TCTTTCCGGC AATTGCGCAG ACTGTCGTAT CGCTCCTGTC CCAGGAGGAC 
TTCATCCCGA TCCTCTGTGC CCTGCCGGGC GGGGGGCGCT CAGAAGACGA GTACATCGAG 
ATGCTCGTGG CGCAGGAAGC GTCCGGAATC ATTTTCATCT GCAGTTCACA CGCCGACGGC 
CAGGCCAGCC TGGAGCGTTA CCACCGGCTC CGCGGCCGCG GCATCCCGTT CGTCCTGGTC 
AACGGTGCAC GTCCGGAACT GTCGGCCGCC TCCGTGTCCA ATGACGACGC CGCGGCAATC 
AGCACGGCGG TGCACCACCT GGCCAGCCTG GGGCACCGGA AGGTGGGGCT GGCTATAGGC 
CCGCACCGTT TCATCCCCAG CAGGCAAAAG CTGGCCGGAT TCCGCTCCGC CCTCGCCGAG 
TACCTGGACA CCCAGGACCC GGAACCGCAC ACGGCTACCA GCATGTTCAC GGTGGAAGGC 
GGGCAGAGCG CGGCCAATGA GCTCCTGGAC TCCGGCCACA CGGCCATAGT GTGCGCCTCC 
GACGTCATGG CACTCGGCGC CATCCGCGCC GTCCAAGCCA GGGGGCTGCG CGTCCCGGAG 
GATGTGTCCA TCGTCGGTTT CGACGACTCC CCGCTGATGG CGCTCACCAA TCCGCCGCTG 
ACCACCCTCA GGCAGCCTGT CGCCGCGATC GCGCACGCCG CCGTCCATGC CCTGGCGGCC 
GAAATTGCCG GCGAACAGTC CACCCGTTCG CCGGTGGTCC TGGCGTCCGA CCTGGTGGTG 
CGTGGATCTA CCGGTCCTGC GGCAGCAGCT TCAGGCCCGC CGCGCAGCCC ACGATCCCGG 
CGATGA

Protein sequence

MSTTAGRAHP DAPERPKLED LARKVGVSIA TVSRVVNGRK GVSREVRQSV LAAMDDLGYE 
RPDRARSTTR GQVGIIVPDL TNPIFPAIAQ TVVSLLSQED FIPILCALPG GGRSEDEYIE 
MLVAQEASGI IFICSSHADG QASLERYHRL RGRGIPFVLV NGARPELSAA SVSNDDAAAI 
STAVHHLASL GHRKVGLAIG PHRFIPSRQK LAGFRSALAE YLDTQDPEPH TATSMFTVEG 
GQSAANELLD SGHTAIVCAS DVMALGAIRA VQARGLRVPE DVSIVGFDDS PLMALTNPPL 
TTLRQPVAAI AHAAVHALAA EIAGEQSTRS PVVLASDLVV RGSTGPAAAA SGPPRSPRSR 
R