Gene Arth_1907 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Arth_1907
Symbol
ID	4445561
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Arthrobacter sp. FB24
Kingdom	Bacteria
Replicon accession	NC_008541
Strand	-
Start bp	2147057
End bp	2148103
Gene Length	1047 bp
Protein Length	348 aa
Translation table	11
GC content	59%
IMG OID	639689717
Product	AraC family transcriptional regulator
Protein accession	YP_831389
Protein GI	116670456
COG category	[K] Transcription
COG ID	[COG2207] AraC-type DNA-binding domain-containing proteins
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.198384
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGAAGAAA CATCTCGCGA CAACCACGTC GCCGACGATC CGGACAGGCC ACAGCACGAT 
CAGATCAGGC GCTACAGTGT TCCGGCCGGG CTGAACCCGG AAGAAAAATT CGAACATTGG 
CGGAGCTGGT ACGCCAGCGC GATTGACGCT CCCGTTCGGT TGGAAAAAAC CGAAAAGTCA 
GTGCGATCTG GCTTCAATCC AACCGCCCTG AGCCTTGAGA GTCCGGGCTT CAGTCTTGTT 
GATGTCACGA ATGAACCCGC CAGTTGCTAC TGGAACGGGG ACACGAATCC CAGCGACTGG 
CTCGTGTATT TCAGGACTTC ATGTGACAAG TTCAGCTTCT CGGGACGTTC CGAGGCTGTC 
GCTCCCGGAA CAGTCAGGTT CTTTGATCTT TCTTTGCCGG GAAACTTCCA TGCGCCCGCC 
GGCCTAAGCG CTGTGCGGGT CCATTTCGAC CGGGGGCTGC TCGGCTTGGA CGGCAGATCC 
GTCAAACGGC TGCAGGGATT GGCCGACATC AGAGAAAACC CCATTATGCG TGGGCTGATT 
CTTCCAGCCT TGTCCGGCTG GCAGCGGTCG GTCATAGCCC AGGAGATGCC ACGTCTCCAA 
CCAGTCGTCC GGTCGATGAT GACGGCCCTG GTCAGCTCCT TGCTCGAAAC CACGGCCGAT 
CCCGGCGATA TAAGACTGGC CCGCATCGCA GCGATCAAGA AATTCGTGCA CCGGAACTTC 
AGAAACCCTG CCCTCACAGT TGACGAGGTC GTGGCTTACT CATTTCTTTC ACGCCGTGCC 
CTTTACTACC TCTTCGAAGA CGAAGGGCTC CAAGTCAGCG GGCACATCCG CGCCCTGCGG 
ACCTTGGAAG CCCTTGAGCT CCTCGCCGAA GCAACCTCCT GGAAACGCTC TCTGACGGAC 
ATAGCGGGTG CCAGCGGGTT CAAGAGCCTG CAAGCCATGC GGCGTGCCGT CAGGGAACTA 
ACAGGGCTCT CGCTTGGGGA CGCGCAGCAG AACCCGGAAC TCTTGCAGAC TCGAGCCGCC 
GAACTAAGAA AATTGACCGT GCTGTGA

Protein sequence

MEETSRDNHV ADDPDRPQHD QIRRYSVPAG LNPEEKFEHW RSWYASAIDA PVRLEKTEKS 
VRSGFNPTAL SLESPGFSLV DVTNEPASCY WNGDTNPSDW LVYFRTSCDK FSFSGRSEAV 
APGTVRFFDL SLPGNFHAPA GLSAVRVHFD RGLLGLDGRS VKRLQGLADI RENPIMRGLI 
LPALSGWQRS VIAQEMPRLQ PVVRSMMTAL VSSLLETTAD PGDIRLARIA AIKKFVHRNF 
RNPALTVDEV VAYSFLSRRA LYYLFEDEGL QVSGHIRALR TLEALELLAE ATSWKRSLTD 
IAGASGFKSL QAMRRAVREL TGLSLGDAQQ NPELLQTRAA ELRKLTVL