Gene Arth_4011 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Arth_4011
Symbol
ID	4447812
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Arthrobacter sp. FB24
Kingdom	Bacteria
Replicon accession	NC_008541
Strand	-
Start bp	4527105
End bp	4528325
Gene Length	1221 bp
Protein Length	406 aa
Translation table	11
GC content	67%
IMG OID	639691842
Product	transcriptional regulator
Protein accession	YP_833486
Protein GI	116672553
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism [T] Signal transduction mechanisms
COG ID	[COG2508] Regulator of polyketide synthase expression
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCACCAGC AGGATGTGGA ACAGCTCGTG GAGCAGGTAG CCGTAAAGCT CGGCCGTGGA 
CTGTCGCTCG AAGATCTCGA CGGCGTTCTG CTCGCCTACA GCTCCAATCA GTCCCACGCG 
GACCGGGTCC GGGTGAACTT CCTGCTCAGC AAACGCGTAC CGGCGGACGT GAAGGCGTGG 
CAGCTATCGC ACGGTATCGC GACGGCGGTG CGTCCCGTCG TCGTACCCGC CAACGAGGAT 
CTTGGCATGC TGGGACGCGT CTGCGTCCCG CTGCTGGTCC GCGGTTTCCG CGTCGGTTAC 
CTGTGGGTGC AGCAGGACAT TGACGACCAA AGCGCGACGG CGATTCTCAC CCAGCTGCCT 
GGCGTCCGGG ACGAACTCGA ACTTCTGTCC GGGCTGCTCC TCGAGTCGAA CACGGCCGAA 
TCCGAGTTCC GGCGCCGCAG GGAGCAGGAG TTCCTCAGCG CCTGCCGCGG TGAAGCGAAT 
GCCGTTGCCG CCGTGGCCGG CTGGAAGGAG GTGCAGGGCC GCGGCCCGTG GCAGCTTGTC 
ACAGTGCTCG ACGCCGACGG CTGGGCGGAG GGATCCGACC CCATCGCCTC AACCCTGATC 
CACCGGTCCT CGGCCCTGCA GGCGACCATC GGTGTGGACG CGGCGCTCTT CAGTGCCGGC 
ACGGAAACCC ACGCGGTGGT CCTGTTCCGG GAATCTACCG GGCGGGCGGC CCATGCGCAG 
GTCCTGGTCC ACTACCAGCT GGAACTTGCC AAGCGGTCCG GGCGGCCCGT GCACCGGATC 
ATCCTTGGAA CAAGCGAAGG CTTCGCCAAG CCGCGTCAAC TGGCAGACGC CTACCGGCAG 
TCCAAGCAGG CCGCGCAGGC CGCCGCAGTG GATTCCCAGC TGGGCGAGCT GGTGGATTGC 
CGGGCCACCG GCGTCTACCA GCTGCTGGCC TCCGCCGGTG GCGGCGCCGG GGCCTGGGCC 
GACGCCGGTT CCGTCTACTG GCGCATCCTG GAAGACCACG ATCGGAACGG TGAGCTCCTG 
CCCGTGCTGG AACTCCTGTA TGACAATGAC GGTTCAGTGC AGGACGTCGC CACCAGGCTG 
CATCTGCACC GGAGCAGTAT TTACAACCGG CTGGGCCGCA TCCGGCAGGT CCTTGGCGTG 
GATCCGCTGA AGGGCATGGT CCGGCTCGAA CTCCATGCGG CCCTCAAGGC CCGCCGCTGG 
GCAGGACGCC CACGGATTTA G

Protein sequence

MHQQDVEQLV EQVAVKLGRG LSLEDLDGVL LAYSSNQSHA DRVRVNFLLS KRVPADVKAW 
QLSHGIATAV RPVVVPANED LGMLGRVCVP LLVRGFRVGY LWVQQDIDDQ SATAILTQLP 
GVRDELELLS GLLLESNTAE SEFRRRREQE FLSACRGEAN AVAAVAGWKE VQGRGPWQLV 
TVLDADGWAE GSDPIASTLI HRSSALQATI GVDAALFSAG TETHAVVLFR ESTGRAAHAQ 
VLVHYQLELA KRSGRPVHRI ILGTSEGFAK PRQLADAYRQ SKQAAQAAAV DSQLGELVDC 
RATGVYQLLA SAGGGAGAWA DAGSVYWRIL EDHDRNGELL PVLELLYDND GSVQDVATRL 
HLHRSSIYNR LGRIRQVLGV DPLKGMVRLE LHAALKARRW AGRPRI