Gene Arth_3308 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Arth_3308
Symbol
ID	4444002
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Arthrobacter sp. FB24
Kingdom	Bacteria
Replicon accession	NC_008541
Strand	+
Start bp	3713991
End bp	3715031
Gene Length	1041 bp
Protein Length	346 aa
Translation table	11
GC content	68%
IMG OID	639691132
Product	LacI family transcription regulator
Protein accession	YP_832784
Protein GI	116671851
COG category	[K] Transcription
COG ID	[COG1609] Transcriptional regulators
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCACGGT CAGCCAGCAT CAAGGATGTT GCGAACCATG CCCGCGTAGC GGTGGGAACG 
GTGTCCAACG TCCTGAATTA CCCGGACCGG GTTTCACAGC GGACCAAGGA CCGCGTTCTG 
CAGGCGATCG ACGAGCTTGG CTTCGTCCGC AACGACGCAG CCCGGCAGCT CCGGGCCGGA 
CACAGCCGCA CCATCGGCCT GATTGTGCTG GATGTGGGCA ACCCCTTCTT CACCTCCGTG 
GTCCGGGCCG CCGAGGACGC CGCCGCCCTG CAGGGAAGCG CCGTCCTGCT CGGGGACAGC 
GGGCACGATG CCGGCCGGGA GTCGAACTAC ATCGACCTCT TCCAGGAGCA GAGGGTCCAG 
GGCCTGCTGA TCTCGCCCGT GGGTGACGTC ACTGAGCGCC TCGACCAGCT GCGTGAGCGC 
GGCGTCCCCA CCGTTCTGGT GGACCGGCTG GCCGATGAGA CGAAGTACAG CTCAGTTTCC 
GTTGACGACG ACGCCGGCGG TTACCTCGCC GCACGGCACC TGCTGGACAT CGGCCGCCGT 
CGGCTGGCTT TCGTGGGAGG CCCGACGTCG ATACGCCAGG TGGCGGACCG CCTCCAGGGG 
GCGCAACGCG CCGTCGCTGA AGTTCCGGAC GCTTCACTTG AAATTCTGGA TTCGGCCGGA 
CAGACCGTCC TGGCGGGCCG GGGCGTGGGC GACCAGCTGG TGCGCCGCAG CTCCGGCGAA 
CTGCCGGACG GCGTGTTCTG CGCCAACGAC CTGCTCGCCC TCGGCGTAAT GCAGTCCCTC 
ACCATGCTGC ACACTCTGCG GATCCCGGAA GACATCGCCC TGATCGGCTA TGACGACATC 
GACTTCGCCG TGTCAGCCGT GGTGCCGCTG TCCTCGATCC GCCAGCCAAC GGAAGCGCTC 
GGCCGGACCG CCATCGAGCT GCTGGCCGAG GAAGTGGACG CCATGGGGCC CGCCTCGGTG 
CGGCCCCACC ACCGCGCCGT GATCTTCACT CCCGAACTGG TGGTGCGGCA AAGCACCGCG 
GGCGCCGCCA CCCCGGCCTA G

Protein sequence

MSRSASIKDV ANHARVAVGT VSNVLNYPDR VSQRTKDRVL QAIDELGFVR NDAARQLRAG 
HSRTIGLIVL DVGNPFFTSV VRAAEDAAAL QGSAVLLGDS GHDAGRESNY IDLFQEQRVQ 
GLLISPVGDV TERLDQLRER GVPTVLVDRL ADETKYSSVS VDDDAGGYLA ARHLLDIGRR 
RLAFVGGPTS IRQVADRLQG AQRAVAEVPD ASLEILDSAG QTVLAGRGVG DQLVRRSSGE 
LPDGVFCAND LLALGVMQSL TMLHTLRIPE DIALIGYDDI DFAVSAVVPL SSIRQPTEAL 
GRTAIELLAE EVDAMGPASV RPHHRAVIFT PELVVRQSTA GAATPA